交易中的机器学习:理论、模型、实践和算法交易 - 页 3286

 
Andrey Dik #:

嗯,这听起来已经像是专业人士的观点了(对错是另一个问题)。
我们没有理由取笑它。
这完全正确,而这正是最大的问题所在。由于缺乏适当标记的资源(通常是最昂贵的),他们甚至发明了主动学习。当算法本身尝试对数据集进行真实标注+注释者的帮助时。在我们的例子中,买入或卖出。

然后,他们又在自己的标记错误上做手脚。这是显而易见的。
 
Maxim Dmitrievsky #:
上面我介绍了 matstat。在此之前,我写过关于 kozul 的文章。更早之前,我还写过关于 Oracle 错误(标记错误)的文章,即当数据以一种你无法理解的方式标记时。从这些文章中,我们可以清楚地认识到,在不同的大块数据和不同长度的训练中,结果会有所不同。这取决于没有提供或描述的数据。

这就是实验的目的--量和时序哪个更重要。

只是强调的是引用数据,而不仅仅是采样和一些与时间无关的其他观察结果。如果时间很重要,那么就应该谨慎使用诸如交叉验证等样本分割方法。

如果市场行为发生了重大且不可逆转的变化,那么时间就很重要,这将导致在控制从时间上差异巨大的样本中学习时,无法获得可接受的模型。

当然,标价问题本身也很重要,但在此可以将其从括号中剔除。

如果你对标记很感兴趣,它是基于 Expert Advisor 的策略,代码在我的文章中。

我使用了以下设置:

А.测试设置:

- 符号: EURUSD

- 时间框架: M1

- 时间间隔:2010 年 1 月 1 日至 2023 年 9 月 1 日

B. CB_Exp EA 策略设置

- 周期104

- 时间框架:2 分钟

- 移动方法: 平滑移动

- 价格计算基础: 收盘


预测因子与 Expert Advisor 中的相同。

 
Andrey Dik #:

我不知道,但很想知道。

我很高兴,所以我在这里大声表达我的想法不是没有道理的。

 
Aleksey Vyazmikin #:

这就是实验的目的--体积和时间顺序哪个更重要。

不存在哪个更重要的问题。有一个标记问题。只要你把这个问题括起来,我就把你的努力括起来。

 
Aleksey Vyazmikin #:

强调的是引用数据,而不仅仅是与年代无关的一些其他观测数据的样本。如果时间紧迫,则应慎用交叉验证等样本分割方法。

我使用 Valking Forward 也是出于同样的原因。
而且,火车图的大小与此有关。例如,在 20000 行时,可以找到一些前向数据,但在 5000 或 100000 行时,则是随机的。

 
Forester #:

我使用 Valking Forward 也是出于同样的原因。
而且,这与列车区段的大小有很大关系。例如,在 20000 条线路上可以找到一些前向信息,但在 5000 或 100000 条线路上则是随机的。

但你能想到为什么会这样,不是吗?因为分区不正确,随机落入了最正确的区间:)

随机 "一词已经暗示了 matstat。
 
Maxim Dmitrievsky #:

这不是哪个更重要的问题。这是一个标记问题。只要你还在为这个问题纠结,我也会为你的努力纠结。

每个人对问题的看法都不一样。每个人都在寻找自己的解决方案。我在寻找任何标记数据的稳定性,这是一个不同的方向,与你的方向并不矛盾。

对我来说,最重要的问题是如何以较高的概率估计稳定性,或通过少量的观察结果来监控稳定性的测量。这样就可以使用任何标记。

 
Aleksey Vyazmikin #:

每个人看待问题的方式不同。并寻找自己的解决方案。我在寻找任何标记的数据稳定性 ,这是一个不同的方向,与你的方向并不矛盾。

对我来说,最重要的问题是如何以较高的概率估算稳定性,或通过少量的观察结果来监控稳定性的测量。这样就可以使用任何标记。

把猫标成骆驼,并从中寻找稳定性,这一定是一个很酷的方向。

我已经习惯了与你的任何对话都会走入思维的死胡同。

 
Maxim Dmitrievsky #:

把猫标记为骆驼,并从中寻找稳定感,这一定是一种很酷的潮流。

我已经习惯了和你的对话陷入僵局。

如果你能评估它们在训练之外的用处,那么猫还是骆驼又有什么区别呢?

真是奇怪的逻辑。

 
Aleksey Vyazmikin #:

如果能评估它们在训练之外的用途,谁还会在乎是猫还是骆驼呢?

😀