交易中的机器学习:理论、模型、实践和算法交易 - 页 1383

 
elibrarius

我不采用除法(P[i]/P[0]),而是采用减法(P[i]-P[0]),也就是说,不是相对价格变化,而是绝对价格。我初步删除了离群值(从最大和最小的数值来看,数量为1%)。

分割有什么好处吗?我目前正在使用一个不需要归一化和缩放的森林。

你做移位,但不做缩放。
 
尤里-阿索连科
你在做一个转变,但不是一个缩放。
是的,树木/森林也不需要缩放。


也就是说,除法比减法没有太大的优势。除了在对数的情况下,这将使数据更类似于正态分布,正如Alexey Nikolaev所说。但在这种情况下,我也看不出有什么好处--树不是按一个层次做分割,而是按另一个层次做分割--也就是说,它将对任何分布进行调整。因为这棵树本质上是一种简单的记忆。

 
把价格作为过去100个价格的百分比。 错误?
 
叶夫根尼-丘马科夫
把价格作为过去100个价格的百分比。 错误?
这类似于除法
 

图形应该被分为若干层次,垂直方向上的相同或不相同的大块,每个大块都应该在一个范围内被提名。

图表应该被分成若干级别,在垂直方向上相等或可能不相等的大块,每个大块应该被规范化为一个范围,即类似于正常价格水平。如果我们不对整个系列或在滑动窗口中进行归一化,我们将再次失去一些非常重要的信息。

但在划分层次时,我们会面临另一个问题--当价格处于边界条件时,或者如果我们拿很多最新的价格进行训练,其中一些是在一个 "层次 "上,其他则是在另一个层次上。我还没有想好怎么做。

我可能需要对各层级进行镜像,以使各层级之间的过渡不受影响。

很自然,未转换的图仍然是最有信息量的。因此,你应该非常小心地进行任何转换--模型的质量将与你的无知成比例地降低。因此,所有关于50%的误差是正常的和其他废话的传说,模型根本没有从这种 "特征 "中学到任何东西。

 

这是很复杂的事情,我不知道为什么,我真的不知道该怎么做。

尤里在简单的增量方面也做得很好

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1) *1000)

这没有意义--每个后续的热链都包含前一个热链的一半有用信息,也就是说,它们,1:强烈相关,2:滞后最大的热链包含前一个热链的所有方差,也就是说,它们没有提供任何信息增量

结果如下:滞后最大的回报的重要性 将是最大的(更多的方差,更多的信息增益),并且这个回报包含了其他特征的所有方差。

 
elibrarius

尤里在简单的增量方面也做得很好。

不可能的,因为它永远不可能

 
elibrarius

你编出来的东西很复杂,不清楚为什么,也确实不清楚怎么做。

想象一下这种情况。

在不同的历史时刻,市场上的价格主要反映了供求关系的平衡

你坚持以有限的正常化的历史部分为特征,只反映了当前的情况

你的模型将不同的历史时刻合并成一个正常化的无面流(所有的市场情况都相互等同),它不再包含任何历史序列或公平价格

你留下的是一堆相同的模式归一化模式,当增加历史深度时,这些模式会重叠,导致50/50的错误。 你没有教给模型任何东西,你在预处理时已经丢掉了最重要的信息,因为你做的一切都不正确,即遵循为绝对不同的任务设计的书籍,描述完全不同的过程。

报价不是一个信号,它是一个完全不同的过程,不应该这样处理。例如,尤里是一名辐射物理学家,因此他没有其他事情可做。

在这种培训中,你考虑时间,但你不考虑价格。市场上的价格水平(高于/低于)甚至比时间更重要,因为它反映了供需平衡,而供需平衡反映了所有基本市场信息。
 
马克西姆-德米特里耶夫斯基

想象一下这种情况。

市场上的价格反映了供应和需求的平衡,主要是在不同的历史时刻

你坚持以有限的正常化的历史部分为特征,只反映了当前的情况

你的模型将不同的历史时刻合并成一个正常化的非个人流(所有的市场情况都相互等同),它不再包含任何历史序列或公平的价格

你留下的是一堆相同的模式归一化模式,当增加历史深度时,这些模式会重叠,导致50/50的错误。 你没有教给模型任何东西,你在预处理时已经丢掉了最重要的信息,因为你做的一切都不正确,即遵循为绝对不同的任务设计的书籍,描述完全不同的过程。

报价不是一个信号,它是一个完全不同的过程,不应该这样处理。例如,尤里是一名辐射物理学家,因此他没有其他事情可做。

在这种培训中,你考虑到了时间,但你没有考虑到价格。市场上的价格水平(高于/低于)甚至比时间更重要,因为它反映了供需平衡,而供需平衡反映了所有基本市场信息。

很遗憾,你不能给一个 "赞"。