交易中的机器学习:理论、模型、实践和算法交易 - 页 1964 1...195719581959196019611962196319641965196619671968196919701971...3399 新评论 Forester 2020.08.12 08:21 #19631 Aleksey Vyazmikin: 我之前可能没有说明,小样本中至少要有1%的指标留在表内,大样本中至少要有100个指标,所以当然不会分到任何一类的表内没有错误。你似乎误解了最后一步--我把它看作是对剩余1%样本的统计评估--在这个样本中,我们观察到结果随着不同预测器的分割而改善,我们得到了子空间信息,例如。如果A>x1,那么目标1将有40%的正确率,也就是60%的子样本。如果B>x2,那么目标1将以55%的比例被正确识别,也就是45%的子样本。如果A<=x1,那么目标1将被70%的人正确定义,也就是50%的子样本。 这些拆分中的每一个都有一个重要性系数(我还没有决定如何计算),最后一个拆分也有一个。以此类推,比方说最多5-10个预测因子,那么在应用时,如果我们到达最后一个分割点,我们将系数相加(或使用更复杂的求和方法),如果系数之和超过阈值,则该表被归类为1,否则为0。实现这一点的一个简单方法是强行构建一个森林,直到倒数第二个分割点,然后排除已经从样本中选择的预测因子,这样就可以选择新的预测因子。或者干脆,在建立树后,按叶子过滤样本,并逐一查看每个预测器,寻找符合完整性和准确性标准的最佳分割。而且,如果其他类别的 "0 "意味着没有行动,而不是相反的输入,那么训练样本 的结果就会改善,否则就会有改善和恶化。 训练结果仍然是介于N和N+1深度训练的树,例如6和7。如果在第6级时的误差是20%,在第7级时的误差是18%,你的方法将给出两者之间的误差,例如19%。你认为1%的收益值得花时间吗? 以前介绍过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。 现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林 到6级,另一个森林到7级,然后进行平均。 训练样本 不必让我们担心--它始终是完美的。 Aleksey Vyazmikin 2020.08.12 12:42 #19632 elibrarius: 同样,训练结果将是介于训练到N和N+1深度的树之间的东西,例如6和7。如果第6级的误差是20%,第7级的误差是18%,你的方法会给你介于两者之间的误差,例如19%。你认为1%的收益值得花时间吗? 以前描述过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。 现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林到6级,另一个森林到7级,然后进行平均。 训练样本 不应该让我们担心--它始终是好的。 收益通常超过1%。 当然,你可以随机化森林,但你如何让它们直到倒数第二个分裂都是一样的?假设你将10棵树训练到第6个分叉,你以同样的方式训练另外10棵树,但训练到第7个分叉。 Forester 2020.08.12 13:19 #19633 Aleksey Vyazmikin: 收益通常超过1%。当然,你可以有随机森林,但 你如何让它们在倒数第二个分裂之前都是一样的? 比方说,我们把10棵树教到第6个分叉点,用同样的方法教另外10棵树,但教到第7个分叉点。不可能。这就是为什么它们是随机的,因为我们采取随机列进行训练。那么,平均化就会有好的结果。 你可以尝试设置列的分数=1。也就是说,所有的柱子都会参与构建树,而不是所有柱子中随机的50%。所有的树都会是一样的,所以也要在森林里设置1棵树。总共有一棵树的森林被训练到6级,另一棵树的深度为7级。 如果你需要超过2棵树--那么独立地从集合中移除一些列,并在所有剩余的列上训练额外的森林。 同时补充:参与训练的行数也应设置为1,即全部,这样训练的效果才会一样。因此,随机森林 中的所有随机因素都被删除了。 Maxim Dmitrievsky 2020.08.12 16:52 #19634 要想出交易逻辑,这是个挑战。 到目前为止,我们想出了这个办法。 加上NS架构在很大范围内的变化 最重要的是要把它弄好 Forester 2020.08.12 17:25 #19635 Maxim Dmitrievsky: 要想出交易逻辑,这是个挑战。到目前为止,我们想出了这个办法。 加上NS架构在很大范围内的变化最重要的是要选择正确的奖励 又是在有援军的情况下攻打NS?他们似乎在利用奖励 Rorschach 2020.08.12 17:59 #19636 我建议在这个数据上进行测试,那里肯定有一个模式,而且很清楚应该以什么为目标。 ps把名字中的.txt去掉 附加的文件: test.zip.001.txt 15360 kb test.zip.002.txt 13906 kb Maxim Dmitrievsky 2020.08.12 18:33 #19637 在1.5个月内。完全自学,无需干预 我稍后会再做一些调查......太多参数了 Valeriy Yastremskiy 2020.08.12 19:17 #19638 Maxim Dmitrievsky: 在1.5个月内。完全自学,无需干预我稍后会再做一些调查......太多参数了 还不错)。 mytarmailS 2020.08.13 05:58 #19639 Maxim Dmitrievsky: 在1.5个月内。完全自学,无需干预我稍后会再做一些调查......太多参数了 那么,这是在新的贸易数据上,或者你甚至怎么理解它? Maxim Dmitrievsky 2020.08.13 08:51 #19640 mytarmailS: 那么,这是在新的贸易数据上,或者甚至是如何理解的呢? 你只需运行它,它就会进行交易,边走边学。 1...195719581959196019611962196319641965196619671968196919701971...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
我之前可能没有说明,小样本中至少要有1%的指标留在表内,大样本中至少要有100个指标,所以当然不会分到任何一类的表内没有错误。
你似乎误解了最后一步--我把它看作是对剩余1%样本的统计评估--在这个样本中,我们观察到结果随着不同预测器的分割而改善,我们得到了子空间信息,例如。
如果A>x1,那么目标1将有40%的正确率,也就是60%的子样本。
如果B>x2,那么目标1将以55%的比例被正确识别,也就是45%的子样本。
如果A<=x1,那么目标1将被70%的人正确定义,也就是50%的子样本。
这些拆分中的每一个都有一个重要性系数(我还没有决定如何计算),最后一个拆分也有一个。
以此类推,比方说最多5-10个预测因子,那么在应用时,如果我们到达最后一个分割点,我们将系数相加(或使用更复杂的求和方法),如果系数之和超过阈值,则该表被归类为1,否则为0。
实现这一点的一个简单方法是强行构建一个森林,直到倒数第二个分割点,然后排除已经从样本中选择的预测因子,这样就可以选择新的预测因子。或者干脆,在建立树后,按叶子过滤样本,并逐一查看每个预测器,寻找符合完整性和准确性标准的最佳分割。
而且,如果其他类别的 "0 "意味着没有行动,而不是相反的输入,那么训练样本 的结果就会改善,否则就会有改善和恶化。
以前介绍过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。
现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林 到6级,另一个森林到7级,然后进行平均。
训练样本 不必让我们担心--它始终是完美的。
同样,训练结果将是介于训练到N和N+1深度的树之间的东西,例如6和7。如果第6级的误差是20%,第7级的误差是18%,你的方法会给你介于两者之间的误差,例如19%。你认为1%的收益值得花时间吗?
以前描述过一个简单的方法--将一些树木训练到6级,一些训练到7级深度。这将需要重写代码。
现在我想出了一个更简单的方法,因为你不必重写任何东西。只要用任何软件包建立一个随机森林到6级,另一个森林到7级,然后进行平均。
训练样本 不应该让我们担心--它始终是好的。
收益通常超过1%。
当然,你可以随机化森林,但你如何让它们直到倒数第二个分裂都是一样的?假设你将10棵树训练到第6个分叉,你以同样的方式训练另外10棵树,但训练到第7个分叉。
收益通常超过1%。
当然,你可以有随机森林,但 你如何让它们在倒数第二个分裂之前都是一样的? 比方说,我们把10棵树教到第6个分叉点,用同样的方法教另外10棵树,但教到第7个分叉点。
不可能。这就是为什么它们是随机的,因为我们采取随机列进行训练。那么,平均化就会有好的结果。
同时补充:参与训练的行数也应设置为1,即全部,这样训练的效果才会一样。因此,随机森林 中的所有随机因素都被删除了。你可以尝试设置列的分数=1。也就是说,所有的柱子都会参与构建树,而不是所有柱子中随机的50%。所有的树都会是一样的,所以也要在森林里设置1棵树。总共有一棵树的森林被训练到6级,另一棵树的深度为7级。
如果你需要超过2棵树--那么独立地从集合中移除一些列,并在所有剩余的列上训练额外的森林。
要想出交易逻辑,这是个挑战。
到目前为止,我们想出了这个办法。
加上NS架构在很大范围内的变化
最重要的是要把它弄好
要想出交易逻辑,这是个挑战。
到目前为止,我们想出了这个办法。
加上NS架构在很大范围内的变化
最重要的是要选择正确的奖励
又是在有援军的情况下攻打NS?他们似乎在利用奖励
我建议在这个数据上进行测试,那里肯定有一个模式,而且很清楚应该以什么为目标。
ps把名字中的.txt去掉
在1.5个月内。完全自学,无需干预
我稍后会再做一些调查......太多参数了
在1.5个月内。完全自学,无需干预
我稍后会再做一些调查......太多参数了
在1.5个月内。完全自学,无需干预
我稍后会再做一些调查......太多参数了
那么,这是在新的贸易数据上,或者你甚至怎么理解它?
那么,这是在新的贸易数据上,或者甚至是如何理解的呢?