交易中的机器学习:理论、模型、实践和算法交易 - 页 1964

 
Aleksey Vyazmikin:

我之前可能没有说明,小样本中至少要有1%的指标留在表内,大样本中至少要有100个指标,所以当然不会分到任何一类的表内没有错误。

你似乎误解了最后一步--我把它看作是对剩余1%样本的统计评估--在这个样本中,我们观察到结果随着不同预测器的分割而改善,我们得到了子空间信息,例如。

如果A>x1,那么目标1将有40%的正确率,也就是60%的子样本。

如果B>x2,那么目标1将以55%的比例被正确识别,也就是45%的子样本。

如果A<=x1,那么目标1将被70%的人正确定义,也就是50%的子样本。

这些拆分中的每一个都有一个重要性系数(我还没有决定如何计算),最后一个拆分也有一个。

以此类推,比方说最多5-10个预测因子,那么在应用时,如果我们到达最后一个分割点,我们将系数相加(或使用更复杂的求和方法),如果系数之和超过阈值,则该表被归类为1,否则为0。


实现这一点的一个简单方法是强行构建一个森林,直到倒数第二个分割点,然后排除已经从样本中选择的预测因子,这样就可以选择新的预测因子。或者干脆,在建立树后,按叶子过滤样本,并逐一查看每个预测器,寻找符合完整性和准确性标准的最佳分割。

而且,如果其他类别的 "0 "意味着没有行动,而不是相反的输入,那么训练样本 的结果就会改善,否则就会有改善和恶化。

训练结果仍然是介于N和N+1深度训练的树,例如6和7。如果在第6级时的误差是20%,在第7级时的误差是18%,你的方法将给出两者之间的误差,例如19%。你认为1%的收益值得花时间吗?
以前介绍过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。
现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林 到6级,另一个森林到7级,然后进行平均。


训练样本 不必让我们担心--它始终是完美的。

 
elibrarius:
同样,训练结果将是介于训练到N和N+1深度的树之间的东西,例如6和7。如果第6级的误差是20%,第7级的误差是18%,你的方法会给你介于两者之间的误差,例如19%。你认为1%的收益值得花时间吗?
以前描述过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。
现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林到6级,另一个森林到7级,然后进行平均。


训练样本 不应该让我们担心--它始终是好的。

收益通常超过1%。

当然,你可以随机化森林,但你如何让它们直到倒数第二个分裂都是一样的?假设你将10棵树训练到第6个分叉,你以同样的方式训练另外10棵树,但训练到第7个分叉。

 
Aleksey Vyazmikin:

收益通常超过1%。

当然,你可以有随机森林,但 你如何让它们在倒数第二个分裂之前都是一样的? 比方说,我们把10棵树教到第6个分叉点,用同样的方法教另外10棵树,但教到第7个分叉点。

不可能。这就是为什么它们是随机的,因为我们采取随机列进行训练。那么,平均化就会有好的结果。
你可以尝试设置列的分数=1。也就是说,所有的柱子都会参与构建树,而不是所有柱子中随机的50%。所有的树都会是一样的,所以也要在森林里设置1棵树。总共有一棵树的森林被训练到6级,另一棵树的深度为7级。
如果你需要超过2棵树--那么独立地从集合中移除一些列,并在所有剩余的列上训练额外的森林。

同时补充:参与训练的行数也应设置为1,即全部,这样训练的效果才会一样。因此,随机森林 中的所有随机因素都被删除了。
 

要想出交易逻辑,这是个挑战。

到目前为止,我们想出了这个办法。


加上NS架构在很大范围内的变化

最重要的是要把它弄好

 
Maxim Dmitrievsky:

要想出交易逻辑,这是个挑战。

到目前为止,我们想出了这个办法。


加上NS架构在很大范围内的变化

最重要的是要选择正确的奖励

又是在有援军的情况下攻打NS?他们似乎在利用奖励

 

我建议在这个数据上进行测试,那里肯定有一个模式,而且很清楚应该以什么为目标

ps把名字中的.txt去掉

附加的文件:
test.zip.001.txt  15360 kb
test.zip.002.txt  13906 kb
 

在1.5个月内。完全自学,无需干预

我稍后会再做一些调查......太多参数了

 
Maxim Dmitrievsky:

在1.5个月内。完全自学,无需干预

我稍后会再做一些调查......太多参数了

还不错)。
 
Maxim Dmitrievsky:

在1.5个月内。完全自学,无需干预

我稍后会再做一些调查......太多参数了

那么,这是在新的贸易数据上,或者你甚至怎么理解它?

 
mytarmailS:

那么,这是在新的贸易数据上,或者甚至是如何理解的呢?

你只需运行它,它就会进行交易,边走边学。