交易中的机器学习：理论、模型、实践和算法交易

Aleksey Nikolayev 2022.05.25 20:34 #26481

Aleksey Vyazmikin #:

你能想明白就好--我没有直接意识到，谢谢你的解释。

但后来发现，第一阶段的算法应该找到能更好地分隔成箱的预测因子对，然后对它们进行 "剥离"。

不，它适用于任何数量的预测因子。每一步都会选择哪个预测因子和哪个片段（左侧或右侧）是最佳的切分对象。传统的决策树也是这样做的--在每一步中，预测因子及其切点都会被选择为最佳，从而产生两个新的方框。PRIM 的唯一不同之处在于，每一步都会切下一个有限的小片，从而形成一个渐进的过程，因此它的名字中有 "耐心 "一词。

我个人认为，对标准方法的另一种修改也很有趣，即每个盒子不是切成两个，而是切成三个新盒子。有机会我会对此发表一些看法。

mytarmailS 2022.05.25 20:56 #26482

Aleksey Nikolayev #:

有机会我会谈谈我的看法。

也许实现和测试会更好一些

Maxim Dmitrievsky 2022.05.25 23:21 #26483

Aleksey Nikolayev #:

不，它适用于任何数量的预测因子。在每一步，我们都要选择哪个预测因子和哪个切片（左侧或右侧）是最佳的。传统的决策树也是这样做的--在每一步中，预测因子及其切点都被选择为最佳，从而产生两个新的方框。PRIM 的唯一不同之处在于，在每一步中，都会切下一个有限的小片，从而形成一个渐进的过程，这也是其名称中 "耐心 "一词的由来。

我个人认为，对标准方法的另一种修改也很有趣，即每个盒子不是切成两个，而是切成三个新盒子。有机会我会就此发表一些看法。

https://xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html

Aleksey Vyazmikin 2022.05.25 23:26 #26484

Aleksey Nikolayev #:

不，它适用于任何数量的预测因子。在每一步，我们都要选择哪个预测因子和哪个切片（左侧或右侧）是最佳的。传统的决策树也是这样做的--在每一步中，预测因子及其切点都被选择为最优，从而产生两个新的方框。

所以我并没有说不是这样--它是可行的--这只是实施的问题--如果你任意选择两个边界良好的预测因子，盒子就不会出现--这就是问题所在！这就是为什么我假定成对搜索是一次性进行的。

Aleksey Nikolayev#:

PRIM 的不同之处在于，每一步都会切掉有限的一小块，这是一个循序渐进的过程，因此其名称中出现了 "病人 "一词。

截断--什么意思--在靠近树根的地方有条件地分割后的一小块残留物？

阿列克谢-尼古拉耶夫#:

我个人认为，标准方法的另一种修改很有意思，即每个方框不是切成两个，而是切成三个新的方框。有机会我会对此发表一些看法。

为什么不是 5 个？:)我支持尝试！

Aleksey Nikolayev 2022.05.26 05:03 #26485

mytarmailS #:
也许实现和测试会更好

我认为这不会发生。到目前为止，我们只有一个漫无边际的假设。

假设我们从某个地方肯定地知道重要的规则是 A<x1<B，但现在有一条规则 a<x1<b，其中 a<A，B<b。一个好的规则至少要分两步才能得到，例如 1)a<x1<B 和 2)A<x1<B。在实践中，这可能意味着不同预测因子的分区步骤会不小心楔入这两个步骤之间，而这一重要规则最终根本不会出现。因此，每一步的分区块数可能不是固定的，而是根据最优性考虑确定的。在特殊情况下（与战争时期的正弦差不多），它们的数量可以等于 5）。

Aleksey Nikolayev 2022.05.26 05:13 #26486

Aleksey Vyazmikin #:

截断--这是什么意思--按常规在靠近树根的地方劈开后的一小块残余？

他们可能根本就没想过要建一棵好树--他们只想砍下 "好的一截"）我更倾向于砍下适合交易的一截，而不是装成一个瓦匠，把整个空间铺得没有缝隙）这与 "不要试图一直在市场中 "这句老话颇为吻合。如果预测者不属于 "好的大块"，那么这些预测者就会被忽略，因此预测树最终也就没什么用了。

是的，放弃树会导致在可能的方框交叉点上做文章，但如果它能发挥作用，树就不可怜了）。

Aleksey Nikolayev 2022.05.26 05:18 #26487

Maxim Dmitrievsky #:
https:// xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html

这似乎比我的小实验要严重得多）这与考虑预测因子之间的依赖结构有关，而这种依赖结构是事先已知的。

mytarmailS 2022.05.26 05:30 #26488

Aleksey Nikolayev #:

我觉得这行不通。到目前为止，这只是一个漫无边际的猜测。

假设我们从某个地方肯定地知道重要的规则是 A<x1<B，但现在有一条规则 a<x1<b，其中 a<A，B<b。一个好的规则至少要分两步才能得到，例如 1)a<x1<B 和 2)A<x1<B。在实践中，这可能意味着不同预测因子的分区步骤会不小心楔入这两个步骤之间，而这一重要规则最终根本不会出现。因此，每一步的分区块数可能不是固定的，而是根据最优性考虑确定的。在特殊情况下（与战争时期的正弦差不多），它们的数量可以等于 5）。

使用符号回归，设计你想要的，而不是其他算法提供的。

你知道 Rku 吧，它有一个软件包，还有一些示例，一切都已经有人做过了，而且是为我们做的。

Forester 2022.05.26 05:38 #26489

Aleksey Nikolayev #:

这似乎比我的小实验要严重得多）这与考虑预测因子之间的依赖结构有关，而这种结构是事先已知的。

如果只有 1 和 2 可以相互作用。或者 3、4、5。那么在第一次拆分后，例如在 3 的基础上，所有的下游拆分都只能从 3、4、5 集合中进行。
我假设，只需从 1,2 和 3,4,5 组建立两棵树。如果有 10 个集合，那么就有 10 棵树。等等。

Forester 2022.05.26 05:40 #26490

不过，那是在蹦蹦跳跳。然后，在一组上种第一棵树。第二棵精炼树在任何其他组合上，依此类推。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2649