交易中的机器学习:理论、模型、实践和算法交易 - 页 3190

 
Aleksey Nikolayev #:

以某种方式将其与利润联系起来,至少是近似地联系起来,并将实际利润与随机利润样本进行比较。检验是否存在误差的标准是样本的平均利润等于零。检查实际利润相对于样本的正相关性--三西格玛法则。

我不准备详谈您的任务,因为我自己的任务也很繁重。

当我们讨论为进一步分类而对数据进行预处理时,利润与之有什么关系?

Aleksey Nikolayev#:

你们的量子是为提取利润而设计的吗?有没有这方面的计划?将其极端简化,哪怕是近似但快速地计算一个样本,然后检查真实结果是否属于这个样本的尾部。

你愿意要求人们深入研究你的思维模式,却又完全不愿意深入研究蒙特卡洛这样简单而广为人知的想法,实在令人厌烦。

我想我已经受够了。

每个人都有权管理自己的时间。

但很显然,你并没有理解你提出建议的问题。

谢谢你的帮助。

 
Aleksey Vyazmikin #:

我明白。

我还有一个建议,为了使森林构建过程更易于管理,把选定量子段的一个具体子样作为每棵树的根,怎么样?

深度应该是 2-3 分,这样叶片上可分类的例子就不会少于 1%。

我认为这样的模型会更加稳定。

也就是说,如果您选择 10 个量子/拆分,然后在这些拆分的实例上训练 10 棵树?
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。树的结果是不同的。

Aleksey Vyazmikin#:

我对我发布 gifs 的样本进行了实验,样本中已有 47% 的单位,数据汇总于表中。

...
结果表明,这些量子片段的质量(实用性)比原始 片段差(少)10 倍

当我与 fxsaber 交流时,我认为这种劣化(倍)是由于他的算法造成的。但他的数据并没有如此大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我是连续评估所有条形图的,所以才会 有这样的想法)。

一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相同,那么是的--继续积累统计数据。

如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。

UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主图))。

 
Aleksey Vyazmikin #:

我写严格序列只是为了举例说明。我还写道,解决这个问题可以提高模型的稳定性。但解决方法可以不同。

即使没有解决上述问题--选择正确的量子表也能提高学习效果,这是我在几十个样本上测试过的。

然后,我展示了如何快速进行训练预处理,从不连贯数据中清除样本。你可以从图片上看到,用这种方法甚至可以在新数据上获得有利的模型。

最后,这种方法是可行的,而开发这种方法正是我的目标。

因此,说它不可行就是否认现实。

我不认为价格是纯粹的 SB,其本质至少不能被部分拆解。如果它是纯粹的 SB,那么整个主题就是一个错误。

我认为我们应该召开一次机械师会议。显然,会议应在阿联酋的某个地方举行,并提供自助餐。然后在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。

日程安排如下:一天会议,一天大家喝酒,第二天大家吵架,互相扯胸脯,然后又是会议,如此循环往复。不断循环)

赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:)
 
Aleksey Vyazmikin #:

利润与为进一步分类而预处理数据有什么关系?

你那无数张资产负债表不断陡峭的 gif 有什么意义?也许你只是不明白问题的答案?

 
Maxim Dmitrievsky #:
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。

会议日程是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯胸,然后再开一次会议,如此循环往复。随时进行)

赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:)

用赛伯的钱来熟悉他的战略,这个想法似乎很好,而且考虑得很周全。我甚至不知道会出什么问题 🤔

 
Aleksey Nikolayev #:

用 Saber 的钱来熟悉他的策略的想法似乎很棒,而且经过深思熟虑。我甚至不知道会出什么问题 🤔

😀 忘了补充 - 主要赞助商是最成功的。但每个人都需要参与进来。
我认为可以找人赞助他的演讲。

会议的重点可能不是讨论具体策略,而是一般方法、理念、工具等。
 
Forester #:

也就是说,如果选择 10 个量子/片段,然后使用这些片段中的示例训练 10 棵树?这看起来很简单。
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。结果显示,树是不同的。

是的,就是这样--当然,这种方法可以变得更复杂,但如果你想的话。

现在,如果我没记错的话,树中的预测因子只命中了一半的范围,而没有寻找最佳的分割点?

至于这个想法是否成功--我完全同意,但卧石之下也不会有流水。

林务员#:

当我与 fxsaber 谈论使用他的算法进行混合时,我想到了这种恶化(倍)。他的数据没有这么大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我对所有条形图进行连续评估,所以才有了这个想法)。


一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相等,那么是的--继续积累统计数据。

如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。

UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主要形状))。

不幸的是,我在处理数据时犯了一个错误(当时我正在为这些测试快速重新设计脚本,有一个细微差别没有考虑到),结果表格是这样的

结论是,数据可以随机落入量子表的范围,并通过可用的稳定性测试。使用的是默认设置/标准--现在我将尝试收紧它们,看看结果如何。

不过,我以前写过,大约只有 30% 的量子截止值在其他两个样本上显示出其效率,所以结果总体上是在意料之中的。只是它的奇怪之处让我不得不仔细检查一切。如何改进选择结果是一个挑战。

不过,量化的目的是选择一个有概率偏移的组。尽管在新数据的作用下,组本身会转向另一个目标,但通过拆分,还是有可能在其中找到一片稳定的叶子。

在我做实验的样本中,我认为平均每天只有一个信号,因此条形图之间相距甚远。

我认为更有趣的是查看我上面建议的实验结果--它应该能显示随机生成的目标反应落入采样量子段的频率。正如阿列克谢-尼古拉耶夫(Aleksey Nikolayev)在他的抽象概念中建议的那样,这将是固定间隔的 "胸部"。

您可以发送您的样本,我将选择量子片段,您可以在这些数据上实验创建修改过的森林,或者我可以给您我的样本。

 
Maxim Dmitrievsky #:
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。

会议日程是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯胸,然后再开一次会议,如此循环往复。随时进行)

赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:)

Fourchette - 听起来不错,但需要暴力 - 我自己还没有注意到。我为自己不被理解而感到难过,但这本身并不会引起如此强烈的攻击性。

 
Aleksey Vyazmikin #:

Furshet - 听起来还不错,但对暴力的需求 - 我还没注意到。不被理解让我感到难过,但这本身并不会引起如此强烈的攻击性。

暴力只是双方自愿的,当争论结束后,所有文明人
 
Maxim Dmitrievsky #:
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。
会议日程会是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯对方的胸脯,然后又是会议,如此循环往复。随时进行)
赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:)

我想阅读有关机器学习的内容,而幽默大师们正在这里磨练他们的技巧。

我希望能在其他地方看到幽默笑话和其他与主题无关的东西。


现在进入正题。

你写道,你认为市场是随机的,这句话的依据是什么?

你有什么确凿的理由来证明市场价格变动的随机性吗?