交易中的机器学习:理论、模型、实践和算法交易 - 页 2727

 
Aleksey Nikolayev #:

你的假设似乎太强了。从这个意义上说,如果有可能实现它们,那实际上就是一个圣杯。我想解决的是一个更温和、更具体的问题--在足够的托盘长度和没有过时的例子之间找到一种折中的通用方法。

在我看来,这个问题对于 MO 和 matstat 在我们领域的应用至关重要。

您没有做过实验吗?毕竟,根据您的理论方法,在样本量增加到一个临界值后,样本中的模式就会过时,不再起作用,这意味着学习的质量会下降,对新数据的结果也会随着样本量的增加而变差。

 
Aleksey Nikolayev #:

我们可以对已经训练好的模型进行后验分析。我想在训练样本选择阶段补充先验分析。

我也这么认为。为了简单起见,我决定使用 "之 "字形最后形成的顶部,但我希望能有更精细的设计。

我开始只从新数据中抽取工作片段,并以第二个模型的形式进行过滤,使其同时适用于新旧数据,然后再在其他新数据上进行检查,就像文章中所说的那样。

这也是一种拟合,但以模型误差为基础。就好像我们至少要选择那些它能很好分类的变体,所以除了随机性(至少在训练和验证以及其他一些验证上),它们中还有一些东西。

如果先验地放下一些东西,那么采取任何长期监测可能都是有意义的,它至少会给出一些足够的标记。捕捉迹象。


我想出了一个新的垃圾邮件发送者的特征和目标(与通常的随机抽样相比,它似乎很有参考价值,确实如此)。但有一些变种,还没有测试过。

 
Aleksey Vyazmikin #:

您没有做过实验吗?毕竟,根据你在这个问题中的理论方法,在样本量增加到一个临界值之后,样本中的模式就会变得陈旧,不再起作用,因此学习的质量应该会下降,在新数据上,当样本量增加时,结果会变得更糟。

你可能会意识到,在大量时间点的历史长度上对大量变体进行训练是一项完全艰巨的计算任务。即使你奇迹般地收集到了所有这些统计数据,但如何将这些信息系统化也是个问题。当然,对于每个时刻来说,不同的历史长度肯定是最合适的。如何解读这些信息,最重要的是如何推断未来?

我想反其道而行之--提出一些启发式方法,以大幅减少训练历史长度的变体数量(字面意思是减少到几个变体)。

 
Maxim Dmitrievsky #:

开始时,我只从新数据中提取有效数据块,然后将过滤器作为第二个模型应用于新旧数据,然后再像文章中那样在其他新数据上进行检查。

这也是一种拟合,但以模型误差为基础。就像我们至少要选择那些能够很好分类的变体一样,所以除了随机性(至少在训练和验证以及其他一些验证上),这些变体中还有一些东西。

如果先验地放下一些东西,那么采取任何长期监测可能都是有意义的,它至少会给出一些足够的标记。捡起标志。


我想出了一种新的垃圾邮件特征和目标(似乎很有参考价值,因此与通常的随机抽样相比)。但有一些变种,还没有测试过。

我得好好想想。我不太明白如何将其转化为我自己的想法和概念。

 
Aleksey Nikolayev #:

我得好好想想。我真的不知道如何将它转化为我的感知和概念语言。

另外,将刻度线转换为柱状线会大大降低预测能力。

但消除了与 dts 的潜在冲突)。

 
Maxim Dmitrievsky #:

此外,将刻度线转换为条形图会大大降低预测能力

但消除了与 dts 的潜在冲突:)

顺便说一句,这也是一个重要的实际问题和有趣的理论问题。您可以将其表述为实际买卖价差对交易量(流动性、波动性)的依赖性,计算相应的回归,比较外汇和股票交易工具等。还有一点是,只有那些 TS 交易量大的人才会对这个问题感兴趣。)

 
Aleksey Nikolayev #:

你可能意识到,要在历史长河中的大量时刻训练大量变体,绝对是一项艰巨的计算任务。即使你奇迹般地收集到了所有这些统计数据,但如何将这些信息系统化也是个问题。对每个时刻来说,不同的历史长度肯定是最佳的。如何解释这些信息,最重要的是,如何将其推断到未来?

我想反其道而行之--提出一些启发式方法,以大幅减少训练历史长度的变体数量(字面意义上的几个变体)。

实验的问题是可以解决的,我也做过类似的事情。

当时我就想到,应该研究估计样本可比性的方法。但我无法实现它--我不懂公式。

 
Aleksey Vyazmikin #:

实验的问题是可以解决的,我也做过类似的实验。

从技术上讲,它很可能是可以解决的。问题是如何解释这样的实验结果。

Aleksey Vyazmikin#:

我当时就想到,我们应该研究评估样本可比性的方法。但我没有意识到这一点--我不明白其中的公式。

例如,Matstat 有很多检验样本同质性的方法。当然,如果我对您的术语理解正确的话。

 
Aleksey Nikolayev #:

顺便说一句,这也是一个重要的实际问题和有趣的理论问题。可以将其表述为实际买卖价差对交易量(流动性、波动性)的依赖性,计算相应的回归,比较外汇和股票交易工具等等。还有一点是,只有那些 TS 交易量大的人才会对这个问题感兴趣)。

哦,真是一团糟,什么都不清楚。他们从哪里获得这些带交易量的报价,有哪些供应商,他们是否存在等等。到头来,即使他们成功了,他们也会像其他所有原则类似的人一样,禁止这种有毒的 ts。或者带着一顶帽子跑到不同的地方,在魔法坠子之前收集掉进帽子里的东西。

欢迎 TS 从一个小时的交易长度,它是可能的几个仪器上,他们似乎没有人特别应变方面的毒性,但它是很难使这样一个困难,可能是因为他们不应变。
 
Maxim Dmitrievsky #:
哦,真是一团糟,让人无法理解。他们从哪里得到这些带音量的报价,他们使用什么供应商,他们是否存在,诸如此类的一切。到头来,即使成功了,他们也会像其他基于类似原则的公司一样,取缔这样一个有毒的 TS。

我认为 fxsaber 写道,问题始于一些大的周转。也许您的 TS 已成为抄袭者太受欢迎的牺牲品)。