交易中的机器学习:理论、模型、实践和算法交易 - 页 2626

 
Maxim Dmitrievsky #:
如果你拿到了就给我看看,我给你看看我的方法结果,我没有时间去完成。
它仍在开发中,在计算机资源方面是一个非常昂贵的过程,而我正在优化代码。
 
 

移动窗口中标志的重要性(指标和价格)。

在某一时刻,该指标可能是10%的重要性,而在另一时刻,它可能是0.05%的重要性,这就是生活的真相)

如果你认为它解决了一切问题,你应该为它感到骄傲。


这就是费舍尔虹膜的四个标志的样子。


或者如果你放大滑动窗口。


 
mytarmailS #:

移动窗口中标志的重要性(指标和价格)。

在某一时刻,该指标可能是10%的重要性,而在另一时刻,它可能是0.05%的重要性,这就是生活的真相)

如果你认为它解决了一切问题,你应该为它感到骄傲。


这就是费舍尔虹膜的四个标志的样子。


或者如果你放大滑动窗口。


很明显,虹膜(和类似问题)有一个稳定的模式。每一个用它们做实验的人都已经发现,所有的东西都会在引号中 "浮动"。

我想知道在图表的每个点上,指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型?
一般来说,要解释你的图表,上面有什么,以及它们是如何建立的。


 
elibrarius #:

虹膜(和类似问题)有一个稳定的模式,这个事实已经很清楚了。而一切 "漂浮 "在引号中的事实,也是每个做过实验的人都清楚的。

我想知道在图表的每个点上,指标的意义是如何不同的。它是针对所有训练线上建立的整个模型一次性确定的。还是你那里有5000个模型?
一般来说,解释你的图表,上面有什么,以及它们是如何建立的。


有很多方法可以找出一个特征的信息量,有些你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
它计算出特征的熵...

为什么每一点的重要性都不同?是的,因为特征的信息量是在一个滑动窗口中计算的,正如我上面写的那样。
 
mytarmailS #:
有很多方法可以找出性状的信息量,对于一些人来说,你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
他计算了特征的熵...

为什么每一点的重要性都不同?是的,因为特征的信息量是在我上面写的滑动窗口中计算的。
因此,你必须寻找重要性没有跳跃的时期,你可以使用2个模型。否则,就是一团糟。

我在网上做了窗口培训,如果不按时间过滤就全部拿出来,性能很差。我当时没有想到要用过滤法来做。在我关于熵的文章中,有一个关于这种机器人的例子

最有可能的是,重要性的跳跃是由于熵的变化,如果像回报的迹象
但所有前门的信徒都有自己的现实,而不是基于实践。
 
Maxim Dmitrievsky #:

但各种前门的信徒都有自己的现实,不是基于实践的。
那是什么?


我认为你需要寻找一个模式,并为它建立一个模型,往往MO不能建立一个模型,即使是一个可理解的模式,你必须用你的双手来做所有的事情。
 
mytarmailS #:
那是什么?


我认为你需要寻找一个模式,并为它建立一个模型,往往MO不能建立一个模型,即使是一个可理解的模式,你必须全部手工完成。

嗯,有各种各样的复发网络,这里有一个

直接通过模式,寻找它的行为模式 :)

很简单:训练它,在测试中检查它,确定它脱落和工作的时期,得出结论/尝试过滤它,确定一个模式

你不应该把统计数字与MO分开,你应该把统计数字用于模型,它们是随机训练的

如果你知道这个模式,你就不需要MO了。
 
Maxim Dmitrievsky #:
你应该直接去找模型,找一个模式,在那里它的行为就像一个模式一样:)

如果非常简单:教它,在考试中测试它,确定它倾泻和工作的时期,得出结论/尝试过滤它,确定一个模式

是的,原则上是可以的,甚至更好,按照这个顺序你可以在机器上做

Maxim Dmitrievsky#:


如果很简单:教学,测试,确定浇灌和工作的时期,得出结论/试图过滤掉,检测出一个模式

或不倒))。

Maxim Dmitrievsky#:


你不应该把统计数字与MO分开,你应该把统计数字用于模型,它们是随机训练的

对我来说,没有必要做复杂的模型,一个简单的规则就足够了,否则就不能称之为模式。

Maxim Dmitrievsky#:


如果你知道这个模式,那么MO就没有必要了。

我总是想做得更好)))。

 
mytarmailS #:
有很多方法可以找出一个特征的信息量,有些你不需要训练一个模型。 我使用了fselector。https://www.r-bloggers.com/2016/06/venn-diagram-comparison-of-boruta-fselectorrcpp-and-glmnet-algorithms/
他计算了特征的熵...

为什么每一点的重要性都不同?是的,因为特征的信息量是在滑动窗口中计算的,正如我上面写的那样
我在比较 几种估计属性重要性的方法。我把最耗费资源的一个作为基准:通过逐个去除特征来训练模型。
快速方法与基准不吻合。它们也不相互匹配。fselector更快,我认为它也不会与任何东西相匹配。
Сравнение разных методов оценки важности предикторов.
Сравнение разных методов оценки важности предикторов.
  • www.mql5.com
Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За