引文中的依赖性统计(信息论、相关和其他特征选择方法)。 - 页 31

 
Avals: 没有必要一直 预测 :)只有在不连续的时刻。

而更多的时候,系统应该说:"让我们坐立不安,我对宇宙模型有危机感"。我想这是任何智能交易系统的一个有用的品质,反映了市场的混乱现实:它只允许在某些时刻稍微瞥见未来。

候选人: 一般来说,从帖子一直悬在空中的事实来看,我在这个线程中的时间要么已经过去,要么还没有到来 :)。现在可能是喷泉休息的时候了 :)。

可能还没有 :)。

而且说实话,我还没打算激活这个话题,但它出现后,我猜想会有关于这个发展。但我并不后悔,因为讨论已经澄清了一些事情。

候选人:我 从一开始就假设该方法能感觉到任何依赖性,这对预测有用,也无用。关于波动性,这里有明确的证据来支持这样的假设。

波动性是这个信息游戏中的一个重要角色,但我认为它仍然不是国王和上帝。

 

我将继续这个主题,而是为了美学家。也许这将是这个话题的结束。或者,也许会有另一个人打开。

我将公布我的实验结果。

 

显示欧元兑美元D1的零条(更确切地说,价格增量p[0]-p[1])从1到250的滞后期相互信息量的图表。




接下来,让我们试着保持数列的原始波动性(保持增量模数),同时混合增量的符号。我们得到。



类似的图表和对等的信息之和非常相似。这意味着,删除梯度的符号并不影响相互信息。为了证实这个标志的不重要性,让我们试试下面的方法。让我们把增量的符号序列保留在原来的格式中,但把增量的模数混在一起,打破了波动性的结构。现在我们有了。




该图表有一个不同的外观。总数大幅减少。因此,在去除波动性后,由于存在原始的增量符号序列,我们对零条的信息要少得多。


现在让我们把增量符号和增量模数序列都混在一起,也就是说,让我们摆脱波动性和原数列中发生的符号序列。




我们得到的结果大致相同,甚至总和更高。我们假设无波动性的序列与完全随机的序列几乎相同(不过,它的分布规律被保留了)。


为了不对每个实验进行多次实现,让我们对不同系列的相互信息获得值之间的差异进行假设的统计测试。

Kolmogorov-Smirnov检验原始序列和保留了波动性的序列的相互信息。p > 0,1.拒绝差异的假设。

对于原始系列和保留增量符号的系列:P < 0.01。差异的假设被证实。

对保留符号的系列和随机系列进行测试。p < 0,1.一个模棱两可的结果,但随机序列的相互信息之和甚至更大,所以我倾向于接受差异的假设,或者至少不比随机序列优越。

结论:这种方法,利用收盘价增量,可以检测出价格波动的依赖性,而增量迹象的依赖性是无法检测的,如果有任何意义的话。用这种方法不可能预测价格运动的方向。

 

在过去的一个月里,我一直没有关注这个问题:我一直在忙于其他事情,所以没有时间。

我原则上同意该判决。但只是关于这几天。我已经怀疑过,而且以前也说过(不仅是我),天数上的混乱比短时的混乱要多得多。

此外,还应该考虑到,信息量过大的酒吧没有被筛选出来。我怀疑这对结果有很大影响。

简而言之,应该更认真地对待可能提供给神经网络输入的数据的选择问题。因此,事实证明,为了从神经网中获益,你必须给它喂食极度无污的顶级美味佳肴。而现在还不是美味佳肴,而是未捕获的星级鲟鱼。

 
Mathemat:

在过去的一个月里,我一直没有关注这个问题:我一直在忙于其他事情,所以没有时间。

我原则上同意该判决。但只是关于这几天。我已经怀疑过,而且以前也说过(不仅是我),天数上的混乱比短时的混乱要多得多。

此外,还应该考虑到,信息量过大的酒吧没有被筛选出来。我怀疑这对结果有很大影响。

简而言之,应该更认真地对待可能提供给神经网络输入的数据的选择问题。因此,事实证明,为了从神经网络中获益,你必须给它喂食极度无污的顶级美味佳肴。而现在,它仍然不是美味佳肴,而是未被捕获的星级鲟鱼。

阿列克谢,首先,我很高兴在主题中看到你。我同意你的意见。我也听说并思考过日记中大量的混乱现象。我的观点如下:在大的TF上,时间序列 函数不如1分钟和5分钟的平滑,在ticks上更是如此。如果一个人学会了在小TF上提前预测几个小节,就会有力量。当然,我也可以计算分钟的相互信息,这将是更有趣的。我可能也会为蜱虫做这件事,我将从Gain Capital的网站上获取它。但使用条形集合体的信息的问题没有解决,我被卡在这上面了。对不起。

我完全同意 "明星 "没有被抓住的说法。而在这方面,冗余信息的问题很重要。如果我们采取具体条目的信息,从根本上说,我们是在提出所采取的每个滞后的重要性问题。

总而言之,但愿能在直播中再次见到你。

 
alexeymosc: 当然,我也可以计算出分钟的互换信息,这甚至会很有趣。我也可以为蜱虫做这件事,我将从Gain Capital的网站上获取它们。

对于几分钟来说,更不用说刻度了,就时间和电脑资源的使用 而言,这可能太浪费了。我指望着拿着手表去数数。我们将拭目以待。

这里最严重的问题不是在表面上,而是在内部:过去的历史对特区来说不是一个常数。酒吧一直在出现和消失。而过去历史的局部变化可能会严重影响结果(或者说是矩阵)。我对此感到非常不舒服。我正在寻找一种方法来解决历史的持久性问题,同时将计算的数量减少一个数量级。

 
alexeymosc:

阿列克谢,首先,我很高兴在主题中看到你。我同意你的意见。我也听到并想到了这几天大量的混乱情况。我的观点如下:在大的TF上,时间序列函数不像在分钟和5分钟上那样平滑,在ticks上更不平滑。如果一个人学会了在小TF上提前预测几个小节,就会有力量。当然,我也可以计算分钟的相互信息,这将是更有趣的。我可能也会为蜱虫做这件事,我将从Gain Capital的网站上获取它。但使用条形集合体的信息的问题没有解决,我被卡在这上面了。对不起。

我完全同意,"椋鸟 "还没有被抓住。而在这方面,冗余信息的问题很重要。如果我们采取具体条目的信息,我们从根本上提出了所采取的每个滞后的重要性问题。

总而言之,但愿能在直播中再次见到你。

也许在大的TF上,时间序列 函数不像在分钟和5分钟上那么平滑,在tick上更是如此,但它更容易预测。 在较小的TF上,特别是在分钟上,时间序列函数揭示了一个模式,正如我所理解的,在几百甚至几千条内,而在10(-s)条内,可能的一般模式的随机成分的比例非常高。
 
yosuf:
也许在大的时间范围内,时间序列的函数不像1分钟和5分钟的那样平滑,甚至在tick上也不平滑,但它更容易预测。 在较小的时间范围内,特别是在1分钟的时间范围内,时间序列的函数在几百甚至几千条内显示出规律性,而在几十条(-s)内,可能的一般模式中随机成分的比例非常高。

我同意,优素福。也有这种意见。顺便说一下,这就是为什么我每天都要服用药片。但是,有趣的是,相同数量的滞后期的相互信息之和,小时柱比白天柱要大。即使它主要是波动性,但事实就是事实。因此,也许较小的时间框架更适合于特定的预测模型。

 
Mathemat:

对于几分钟来说,更不用说刻度了,就时间和电脑资源的使用而言,这可能太浪费了。我指望着拿着手表去数数。我们将拭目以待。

这里最严重的问题不是在表面上,而是在内部:过去的历史对特区来说不是一个常数。酒吧一直在出现和消失。而过去历史的局部变化可能会严重影响结果(或者说是矩阵)。我对此感到非常不舒服。我正在寻找一种方法来解决历史常数的问题,同时,将计算的数量减少一个数量级。

这是一个非常好的观点。虽然我自己没有在历史上挖掘过波动条的问题,但对我来说这一点很清楚,阿列克谢。我认为我们应该根据时间序列 的一些衍生信号进行测量,而不是根据时间序列本身。也许采取时间框架内的加权平均价格是有意义的,尖峰会被平滑掉。顺便说一下,我做过一次:我采取了按小时收盘价计算的加权平均盘面价格(事实上,它是周期为24的MA,但这个小波间隔24步的值被用于计算)。我还计算了相互信息。我很惊讶。1号滞后期显示了最大的信息,其他滞后期显示了10倍或更少的信息。与原来的每日价格系列形成鲜明的差异...
 
你明明知道波动性聚集对较低时间段的影响,却得出所谓较高时间段的噪音更大的结论。唯一的依据是你的信念。如果你真的想比较不同的时间尺度,那么就不要直接比较,而是比较它们的波动影响的残差,否则都类似于你自己的信仰。