交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.04.07 20:01 #26251

Maxim Dmitrievsky #:
如果你拿到了就给我看看，我给你看看我的方法结果，我没有时间去完成。

它仍在开发中，在计算机资源方面是一个非常昂贵的过程，而我正在优化代码。

mytarmailS 2022.04.11 13:52 #26252

有趣的文章，值得思考的问题

https://www.autodesk.com/research/publications/same-stats-different-graphs

mytarmailS 2022.04.12 12:05 #26253

移动窗口中标志的重要性（指标和价格）。

在某一时刻，该指标可能是10%的重要性，而在另一时刻，它可能是0.05%的重要性，这就是生活的真相)

如果你认为它解决了一切问题，你应该为它感到骄傲。

这就是费舍尔虹膜的四个标志的样子。

或者如果你放大滑动窗口。

Forester 2022.04.12 21:09 #26254

mytarmailS #:

移动窗口中标志的重要性（指标和价格）。

在某一时刻，该指标可能是10%的重要性，而在另一时刻，它可能是0.05%的重要性，这就是生活的真相)

如果你认为它解决了一切问题，你应该为它感到骄傲。

这就是费舍尔虹膜的四个标志的样子。

或者如果你放大滑动窗口。

很明显，虹膜（和类似问题）有一个稳定的模式。每一个用它们做实验的人都已经发现，所有的东西都会在引号中 "浮动"。

我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，要解释你的图表，上面有什么，以及它们是如何建立的。

mytarmailS 2022.04.12 21:22 #26255

elibrarius #:

虹膜（和类似问题）有一个稳定的模式，这个事实已经很清楚了。而一切 "漂浮 "在引号中的事实，也是每个做过实验的人都清楚的。

我想知道在图表的每个点上，指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型？
一般来说，解释你的图表，上面有什么，以及它们是如何建立的。

有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/

它计算出特征的熵...

为什么每一点的重要性都不同？是的，因为特征的信息量是在一个滑动窗口中计算的，正如我上面写的那样。

Maxim Dmitrievsky 2022.04.13 04:43 #26256

mytarmailS #:
有很多方法可以找出性状的信息量，对于一些人来说，你不需要训练一个模型。我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/

他计算了特征的熵...

为什么每一点的重要性都不同？是的，因为特征的信息量是在我上面写的滑动窗口中计算的。

因此，你必须寻找重要性没有跳跃的时期，你可以使用2个模型。否则，就是一团糟。

我在网上做了窗口培训，如果不按时间过滤就全部拿出来，性能很差。我当时没有想到要用过滤法来做。在我关于熵的文章中，有一个关于这种机器人的例子

最有可能的是，重要性的跳跃是由于熵的变化，如果像回报的迹象

但所有前门的信徒都有自己的现实，而不是基于实践。

mytarmailS 2022.04.13 05:07 #26257

Maxim Dmitrievsky #:

但各种前门的信徒都有自己的现实，不是基于实践的。

那是什么？

我认为你需要寻找一个模式，并为它建立一个模型，往往MO不能建立一个模型，即使是一个可理解的模式，你必须用你的双手来做所有的事情。

Maxim Dmitrievsky 2022.04.13 05:09 #26258

mytarmailS #:
那是什么？

我认为你需要寻找一个模式，并为它建立一个模型，往往MO不能建立一个模型，即使是一个可理解的模式，你必须全部手工完成。

嗯，有各种各样的复发网络，这里有一个

直接通过模式，寻找它的行为模式 :)

很简单：训练它，在测试中检查它，确定它脱落和工作的时期，得出结论/尝试过滤它，确定一个模式

你不应该把统计数字与MO分开，你应该把统计数字用于模型，它们是随机训练的

如果你知道这个模式，你就不需要MO了。

mytarmailS 2022.04.13 06:29 #26259

Maxim Dmitrievsky #:
你应该直接去找模型，找一个模式，在那里它的行为就像一个模式一样:)

如果非常简单：教它，在考试中测试它，确定它倾泻和工作的时期，得出结论/尝试过滤它，确定一个模式

是的，原则上是可以的，甚至更好，按照这个顺序你可以在机器上做

Maxim Dmitrievsky#:

如果很简单：教学，测试，确定浇灌和工作的时期，得出结论/试图过滤掉，检测出一个模式

或不倒））。

Maxim Dmitrievsky#:

你不应该把统计数字与MO分开，你应该把统计数字用于模型，它们是随机训练的

对我来说，没有必要做复杂的模型，一个简单的规则就足够了，否则就不能称之为模式。

Maxim Dmitrievsky#:

如果你知道这个模式，那么MO就没有必要了。

我总是想做得更好）））。

Forester 2022.04.13 06:35 #26260

mytarmailS #:
有很多方法可以找出一个特征的信息量，有些你不需要训练一个模型。我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/

他计算了特征的熵...

为什么每一点的重要性都不同？是的，因为特征的信息量是在滑动窗口中计算的，正如我上面写的那样

我在比较几种估计属性重要性的方法。我把最耗费资源的一个作为基准：通过逐个去除特征来训练模型。
快速方法与基准不吻合。它们也不相互匹配。fselector更快，我认为它也不会与任何东西相匹配。

Сравнение разных методов оценки важности предикторов.

www.mql5.com

Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За

交易中的机器学习：理论、模型、实践和算法交易 - 页 2626