交易中的机器学习:理论、模型、实践和算法交易 - 页 1848

 
mytarmailS:

这不是一个需要思考的想法,而是一个需要阅读的想法!

文本分类--了解做什么,如何做,用什么算法来做

理智分析:用于确定 "正面/负面 "言论。

这在现成的软件包中已经实施了5-10年,你可以开始使用它们,不必重新发明轮子。

是的,我同意这个想法是为了阅读。
是的,有用于语音分类的算法。
我们的想法是思考如何把这一切放在一起。

如果你知道任何现成的软件包,请告诉我它们的名字。

 
Roman:

是的,我同意这个想法是为了阅读。
是的,有用于语音分类的算法。
我的意思是要考虑如何把它放在一起。

如果你知道有什么包裹,请告诉我它们的名字。

有成百上千的人,我能告诉你什么呢?


文本挖掘

实验分析

 
mytarmailS:

有成百上千的人,我能告诉你什么呢?

文本挖掘

实验分析

好吧,这里至少有一些名字,可以从什么开始,寻找什么。谢谢你。

 
Mihail Marchukajtes:

但是,建立同样的指标似乎是正常的,但当传递给专家顾问时,却被转移了一个栏位,变成了一个完整的混乱。如果我可以改变它,我将不胜感激。

还有,人工智能怎么没有在开盘时收集到最后一个小节?如果是这样,这种转变是合乎逻辑的。

 
elibrarius:
谢谢你。我习惯于使用 "精确",(对我自己而言)称其为 "准确",以方便上课。我现在就用普通的术语来称呼它)。
而一般来说,当有一个 "等待 "类的时候,Precision可以被认为是一个基本指标。精度的错误是错误分类造成的直接损失。
而召回意味着利润损失,即我们等待而不是采取行动。
底线是最大限度地提高F1,这将在预测错误最小和错过利润最小的情况下找到最佳价值。

如果我们谈论的是通过提升学习(CatBoost),通常精确度会上升得非常快,但召回率会慢慢上升,而且在召回率上升的同时,精确度也会下降。我的观点是,在训练期间,最好分别控制两个指标,例如,设置80<精确性>60和召回率>50的限制,并尝试在这些限制内停止训练。用不同的系数来做就比较困难,比如F1。很遗憾,开发者没有预见到这种可能性,我还没有想出成品模型的树木修剪方法。

另一个想法是将样本分成10个部分,每个部分训练10个模型,看看模型在每个部分的表现,并修剪模型树,平均重新训练率,然后以某种方式将所有的模型集中起来。这将清理模型的过度拟合,只使用具有一致趋势信息的数据。

 
Aleksey Vyazmikin:

还有,最后一个柱子的OI怎么没有在开盘时收集?如果是这样,这种转变是合乎逻辑的。

不,它是写在每一个刻度 上的
 
Mihail Marchukajtes:
不,它是写在每一个刻度 上的。

不清楚你是如何要求EA中的指标提供数据的,如果它在图表上被正确建立。你是否在策略测试器的视觉模式下检查过指标结构?

 
Aleksey Vyazmikin:

另一个想法是将样本分成10个部分,在每个部分训练10个模型,看看模型在每个部分的行为,修剪模型树,平均过度训练率,然后以某种方式将所有的模型集中起来。因此,模型的过度训练将被清理掉,只使用具有稳定趋势信息的数据。

我也有一个类似的想法,但现在我正忙于其他事情。我希望很快能用它来做实验。
它也有一个缺点--模型将在小10倍的数据区域内学习。我认为它的普遍性将因此降低。

 
Aleksey Vyazmikin:

不清楚你是如何从EA的指标中请求数据的,如果它在图表上被正确构建。你是否在策略测试器的视觉模式下检查过指标结构?

它是Icon的标准配置...但它在每一个刻度线上 都会从文件中读取数据,而当一个新的柱状体出现时,指标会读取它,结果发现它取了一个错误的值。
 
Roman:

好吧,至少这里有可以开始的名字和要寻找的东西。谢谢你。

它们不是名字,而是指向你所需要的一切的链接,是现成的。以及更多。