交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2019.02.07 12:51 #12971

之前谈到了从数组中去除噪声值的理论可能性，这里是原始模型

在这里，我从一个具有二叉树响应权重的阵列中去除0.01至-0.01的噪声

收益略少，但相对性能有所提高。

Aleksey Vyazmikin 2019.02.07 13:02 #12972

Hm，删除了（零值）已经从-0.02到0.02的二进制树。

似乎没有薄弱的进展，这意味着这里面有一个合理性的内核--需要进一步研究。

Forester 2019.02.07 13:09 #12973

阿列克谢-维亚兹米 金。

用非常原始的术语来说，第一棵树对样本没有反应，它的返回值为零，而第四棵树有这种反应，并计算出 "概率 "0.6--技术上纠正了第一棵树的错误，但实际上揭示了一个以前根本不存在的联系。

第一棵树的误差不仅可以是0，也可以是1。

也就是说，如果第一棵树预测为1，但实际上是0，那么后面的树应该把总数从1减少到0。因此，2,3等树将进行负预测，以便在N步之后把第一棵树的1减少到0。

Aleksey Vyazmikin 2019.02.07 13:45 #12974

elibrarius。

第一棵树的误差不仅可能是0，也可能是1。

也就是说，如果第一棵树预测为1，但实际上是0，那么后面的树就应该把总数从1减少到0.也就是说，2，3等树会给出负的预测，在N步之后把第一棵树的1减少到0。

当然，我同意。但这并没有改变本质--重要的是树将找到的模式，而对这个模式的解释是一个单独的算法的工作。

Maxim Dmitrievsky 2019.02.07 13:48 #12975

阿列克谢-维亚兹米 金。

而且我不知道社会的情况，也就是说，我不知道其他地区的其他个人是如何做的？

拉取数据对我来说似乎是合乎逻辑的，因为我正在寻找一个借助MO的人类行为（或算法）的模型，可能有很多这样的行为模式，而且它们可能是独立的，所以尽可能多地拉取数据是有意义的，因为不可能把它们全部归纳在一起。对于某人来说，市场是一个整体，是一个集体思想工作的结果，是某种没有规则的投票机关，他们可能正在寻找正确的模型来描述作为一个独立有机体的市场行为。

当你是它的一部分时，你怎么能不知道呢 )

也许我在分享，因为最初的目标是做一个类似于人工智能的东西，它可以自己捡起所有的东西，而不需要手动的程序。只有在设计这种东西的时候才是常规的

我无法想象手动翻阅成百上千的模型，在那里选择东西。相反，我想忘记 "发明 "TC的事，就像一场恶梦。

Aleksey Vyazmikin 2019.02.07 14:16 #12976

Maxim Dmitrievsky:

当你是它的一部分时，你怎么会不知道呢 )

也许我是在分享，因为最初的目标是做一个类似于人工智能的东西，可以自己涵养所有的东西，不需要人工的苦差事。只有在设计这种东西的时候才是常规的

我无法想象手动翻阅成百上千的模型，在那里选择东西。相反，我想忘记 "发明 "TC的事，就像一个坏梦。

而且我不知道如何分别分析每个模型--这就是为什么我把重点放在批量处理上。应详细分析单个模型，以改进模型创建周期的整体算法，找到新的思路。

问题是，当你有成百上千的模型变体，而这些变体给出了完全不同的结果时，你很难理解该怎么做才能改善结果--这是我遇到的最大障碍。起初，我用4个预测器得到了有趣的模型，在我看来，增加更多的预测器是没有意义的，只应该生成更多的模型，然后相反，我使用了很多预测器，训练样本的影响更大，再加上CatBoost 本身的训练参数很多。这就是为什么我倾向于生成许多模型，并在每10万个模型中保存2-3个，并更深入地研究它们。

Maxim Dmitrievsky 2019.02.07 14:20 #12977

阿列克谢-维亚兹米 金。

我不知道如何分别分析每个模型--因此要强调批量处理。问题是，当你有成百上千的模型变体，它们给出了完全不同的结果，就很难知道该如何处理它们。

问题是，当你有成百上千的模型变体，而这些变体给出了完全不同的结果时，你很难理解该怎么做才能改善结果--这是我遇到的最大障碍。起初，我用4个预测器得到了有趣的模型，在我看来，增加更多的预测器是没有意义的，只应该生成更多的模型，然后相反，我使用了很多预测器，训练样本的影响更大，再加上CatBoost本身的训练参数很多。因此，我倾向于认为有必要生成许多模型，并从每10万个模型中保存2-3个，而且已经有更详细的模型可以研究。

是的，就像这样，最好是尽可能地实现自动化，这样的话，仍然是一个平庸的选择，哪个更可取，喝杯咖啡？

这很难做到，我同意，但它将是人工智能，而不是一个普通的分类器。

至于最后一个--有一个AutoML libs--神经网络为特定的任务选择最佳的神经网络或模型集，它也很酷。还没有使用。

Aleksey Vyazmikin 2019.02.07 14:38 #12978

Maxim Dmitrievsky:

是的，类似的东西，最好是尽可能的自动化，这样事后就可以在一杯咖啡中选择你最喜欢的那一个，这很微不足道。

我同意，这很难做到，但这将是一个人工智能，而不是一个普通的分类器。

现在训练结束后，结果由脚本处理（没有模型的解释器--通过CatBoost 计算），在10万个模型中，我得到那些符合所有三个样本的定义标准（模型和交易标准）的模型，我们得到大约50-100个模型，我将它们转换为在终端显示，并进行进一步更详细的选择的重新传递。事实上，如果我确切地知道我想要什么，我甚至可能不会在终端启动它们，但现在我正在寻找选择标准，并认为直观地看不同的模型是有用的。我可以用脚本保存平衡曲线，但我不知道如何处理图形--我还是搞不清楚。

我不知道在Python中是否可以一次创建许多模型，但如果有兴趣的话，我可以把我用来做这个的棍子发给你。

Maxim Dmitrievsky 2019.02.07 14:42 #12979

阿列克谢-维亚兹米 金。

现在训练后的结果由脚本处理（没有模型解释器--基于CatBoost的结果），在10万个模型中，我得到符合所有三个样本的标准（模型和交易标准）的模型，我得到大约50-100个模型，我在终端转换它们进行播放，并在那里进行第二次选择，进一步进行更详细的选择。事实上，如果我确切地知道我想要什么，我甚至可能不会在终端启动它们，但现在我正在寻找选择标准，并认为直观地看不同的模型是有用的。我可以用脚本保存平衡曲线，但我不知道如何处理图形--我还是搞不清楚。

我不知道在python中是否可以同时创建许多模型，但如果有兴趣的话，我可以把我用来做这个的棒子发给你。

你可以在Python中做任何事情，甚至更多。

还没有，不，谢谢......我只是在读一些有趣的书。我也用过python中的catbust，我把它和forest做了比较，我没有看到大的改进，但它是可以配置的，而且它自己的工作也很好。事实上，在几行中。

Aleksey Vyazmikin 2019.02.07 14:43 #12980

马克西姆-德米特里耶夫斯基。

AutoML--一个神经网络为一个特定的任务选择最佳的神经网络或模型集，也很酷。还没有用过它。

我也做过类似的事情--问题还是关于预测因素和选择标准（目标）。现在（许多个月后）用预测器敲定所有想法，并回到这个主题。而结果大致上是有的，我之前已经发布了这种模型的工作原理，但我需要不同的样本，有不同的散点，最好是来自不同的模型。

那么AutoML用什么作为预测器和目标呢？

交易中的机器学习：理论、模型、实践和算法交易 - 页 1298