交易中的机器学习：理论、模型、实践和算法交易

Yuriy Asaulenko 2019.03.02 08:25 #13821

elibrarius。

我不采用除法（P[i]/P[0]），而是采用减法（P[i]-P[0]），也就是说，不是相对价格变化，而是绝对价格。我初步删除了离群值（从最大和最小的数值来看，数量为1%）。

分割有什么好处吗？我目前正在使用一个不需要归一化和缩放的森林。

你做移位，但不做缩放。

Forester 2019.03.02 09:13 #13822

尤里-阿索连科。
你在做一个转变，但不是一个缩放。

是的，树木/森林也不需要缩放。

也就是说，除法比减法没有太大的优势。除了在对数的情况下，这将使数据更类似于正态分布，正如Alexey Nikolaev所说。但在这种情况下，我也看不出有什么好处--树不是按一个层次做分割，而是按另一个层次做分割--也就是说，它将对任何分布进行调整。因为这棵树本质上是一种简单的记忆。

Evgeniy Chumakov 2019.03.02 09:14 #13823

把价格作为过去100个价格的百分比。错误？

Forester 2019.03.02 09:15 #13824

叶夫根尼-丘马科夫。
把价格作为过去100个价格的百分比。错误？

这类似于除法

Maxim Dmitrievsky 2019.03.02 10:08 #13825

图形应该被分为若干层次，垂直方向上的相同或不相同的大块，每个大块都应该在一个范围内被提名。

图表应该被分成若干级别，在垂直方向上相等或可能不相等的大块，每个大块应该被规范化为一个范围，即类似于正常价格水平。如果我们不对整个系列或在滑动窗口中进行归一化，我们将再次失去一些非常重要的信息。

但在划分层次时，我们会面临另一个问题--当价格处于边界条件时，或者如果我们拿很多最新的价格进行训练，其中一些是在一个 "层次 "上，其他则是在另一个层次上。我还没有想好怎么做。

我可能需要对各层级进行镜像，以使各层级之间的过渡不受影响。

很自然，未转换的图仍然是最有信息量的。因此，你应该非常小心地进行任何转换--模型的质量将与你的无知成比例地降低。因此，所有关于50%的误差是正常的和其他废话的传说，模型根本没有从这种 "特征 "中学到任何东西。

Forester 2019.03.02 11:07 #13826

这是很复杂的事情，我不知道为什么，我真的不知道该怎么做。

尤里在简单的增量方面也做得很好

Maxim Dmitrievsky 2019.03.02 11:12 #13827

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1) *1000)

这没有意义--每个后续的热链都包含前一个热链的一半有用信息，也就是说，它们，1：强烈相关，2：滞后最大的热链包含前一个热链的所有方差，也就是说，它们没有提供任何信息增量

结果如下：滞后最大的回报的重要性将是最大的（更多的方差，更多的信息增益），并且这个回报包含了其他特征的所有方差。

Maxim Dmitrievsky 2019.03.02 11:23 #13828

elibrarius。

尤里在简单的增量方面也做得很好。

不可能的，因为它永远不可能

Maxim Dmitrievsky 2019.03.02 11:41 #13829

elibrarius。

你编出来的东西很复杂，不清楚为什么，也确实不清楚怎么做。

想象一下这种情况。

在不同的历史时刻，市场上的价格主要反映了供求关系的平衡

你坚持以有限的正常化的历史部分为特征，只反映了当前的情况

你的模型将不同的历史时刻合并成一个正常化的无面流（所有的市场情况都相互等同），它不再包含任何历史序列或公平价格

你留下的是一堆相同的模式归一化模式，当增加历史深度时，这些模式会重叠，导致50/50的错误。你没有教给模型任何东西，你在预处理时已经丢掉了最重要的信息，因为你做的一切都不正确，即遵循为绝对不同的任务设计的书籍，描述完全不同的过程。

报价不是一个信号，它是一个完全不同的过程，不应该这样处理。例如，尤里是一名辐射物理学家，因此他没有其他事情可做。

在这种培训中，你考虑时间，但你不考虑价格。市场上的价格水平（高于/低于）甚至比时间更重要，因为它反映了供需平衡，而供需平衡反映了所有基本市场信息。

Vitaly Muzichenko 2019.03.02 11:56 #13830

马克西姆-德米特里耶夫斯基。

想象一下这种情况。

市场上的价格反映了供应和需求的平衡，主要是在不同的历史时刻

你坚持以有限的正常化的历史部分为特征，只反映了当前的情况

你的模型将不同的历史时刻合并成一个正常化的非个人流（所有的市场情况都相互等同），它不再包含任何历史序列或公平的价格

你留下的是一堆相同的模式归一化模式，当增加历史深度时，这些模式会重叠，导致50/50的错误。你没有教给模型任何东西，你在预处理时已经丢掉了最重要的信息，因为你做的一切都不正确，即遵循为绝对不同的任务设计的书籍，描述完全不同的过程。

报价不是一个信号，它是一个完全不同的过程，不应该这样处理。例如，尤里是一名辐射物理学家，因此他没有其他事情可做。

在这种培训中，你考虑到了时间，但你没有考虑到价格。市场上的价格水平（高于/低于）甚至比时间更重要，因为它反映了供需平衡，而供需平衡反映了所有基本市场信息。

很遗憾，你不能给一个 "赞"。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1383

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1) *1000)