交易中的机器学习:理论、模型、实践和算法交易 - 页 84

 
我一直告诉他们,预测5年的市场是不现实的。他们想建立一个足够的模型,至少可以用一两个星期,并为此感到高兴,但他们想建立一个5年的模型。这就是乌托邦。还有一个问题要问全知全能的阿列克谢:告诉我,如果定义了两个绝对相同的类别,而它们的市场修正是截然相反的,那么模型会如何表现?所以说,矛盾的数据....。在这种情况下,模型会有什么表现????毕竟,模式本身并不重要,重要的是市场对这种模式的反应....。
 
Mihail Marchukajtes:
我也一直告诉他们,预测5年的市场是不现实的......。

说话和劝告是没有用的。许多人都有认知上的扭曲,其中也有对信息的过滤,比如:如果信息不符合世界观,要么根本不被感知,要么就会引起唾弃的反应。

换句话说,这里的大多数居民要么根本不注意你的谈话,要么就会开始埋怨,说你是巨魔。

但这并不是重点。问题是,在jPrediction 中,从第7版开始就出现了评估预测因子的重要性的可能性。要做到这一点,在创建(训练)一个新模型或从文件中加载一个早期保存的模型后,你需要调用 "查看重要的预测因子 "菜单项或按 "热 "键F5。

而且你可以看一下预测因素的重要性的图表。

最好的预测器是最好的--最显著的预测器。 如果你从这个样本中删除 "竞争力 "一栏,你会在训练后得到 "垃圾进,垃圾出 "的信息。

最差的预测者是最差的--最不显著的预测者。如果我们把 "经营风险 "一栏从样本中删除,概括能力不会变差。

说明中标有"-"的其余预测因子具有中等意义。如果将他们从这个样本中删除,概括能力将明显下降。

 
尤里-雷舍托夫

说话和劝告是没有用的。很多人都有认知上的扭曲,其中还有信息过滤器,比如:如果信息不符合世界观,要么根本不被感知,要么就会引起唾弃的反应。

换句话说,这里的大多数居民要么根本不注意你的谈话,要么就会开始埋怨,说你是巨魔。

但这并不是重点。问题是,在jPrediction 中,从第7版开始就出现了评估预测因子的重要性的可能性。要做到这一点,在创建(训练)一个新模型或从文件中加载一个早期保存的模型后,你需要调用 "查看重要的预测因子 "菜单项或按F5热键。

而且你可以看一下预测因素的重要性的图表。

最好的预测器是最好的--最显著的预测器。 如果你从这个样本中删除 "竞争力 "一栏,你会在训练后得到 "垃圾进,垃圾出 "的信息。

最差的预测者是最差的--最不显著的预测者。如果将 "经营风险 "一栏从这个样本中删除,可概括性就不会恶化。

说明中标有"-"的其余预测因子具有中等意义。如果将他们从这个样本中删除,概括能力将明显下降。

谢谢你!!!。极其有用的补充。继续旋转....纺纱...
 
尤里-雷舍托夫

说话和劝告是没有用的。很多人都有认知上的扭曲,其中还有信息过滤器,比如:如果信息不符合世界观,要么根本不被感知,要么就会引起唾弃的反应。

也就是说,这里的大多数居民要么根本不注意你的谈话,要么就会开始埋怨,说你是巨魔。

但这并不是重点。问题是,在jPrediction 中,从第7版开始就出现了评估预测因子的重要性的可能性。要做到这一点,在创建(训练)一个新模型或从文件中加载一个早期保存的模型后,你需要调用 "查看重要的预测因子 "菜单项或按 "热 "键F5。

而且你可以看一下预测因素的重要性的图表。

最好的预测器是最好的--最显著的预测器。 如果你从这个样本中删除 "竞争力 "一栏,你会在训练后得到 "垃圾进,垃圾出 "的信息。

最差的预测者是最差的--最不显著的预测者。如果将 "经营风险 "一栏从这个样本中删除,可概括性就不会恶化。

说明中标有"-"的其余预测因子具有中等意义。如果将他们从这个样本中删除,概括能力将明显下降。

你如何计算预测因素的显著性?
 
桑桑-弗门科
如何计算预测器的重要性?

在很短的时间内(但不是很清楚),预测器的重要性是通过训练后获得的加权系数来计算的。

更多细节,请参见jPrediction源代码中计算预测器重要性的算法。或者我得写一整篇文章来更清楚地解释它。

 
Mihail Marchukajtes:
谢谢你!!!。极其有用的补充。继续转发........

最主要的是,你现在可以非常迅速地计算出低价值的预测因子,并以其他预测因子取代它们。替换之后,必须要看一下通用性是否增加。如果它没有增加,那么这个改变是不正确的,也就是说,一个更重要的预测因素被一个不那么重要的预测因素所取代。

昨天我试验了一下引言。很快就找到了最重要的TA震荡器。但结果是只有5个。而且进一步说,无论你放什么,概括能力都不会增长。因此,事实证明,无论你通过TA指标和震荡器看什么,但事实上它们都是基于相同的数据--之前历史的一小段(几个柱状),尽管它们处理这些数据的方式有点不同。所有的TA指标和振荡器都是同样的 "鸡蛋",只是从侧面看。无论你如何洗牌,它都包含相同的牌。所有的指数和震荡指标相互之间的关联性太大,与未来的关联性很小。

为了提高概括能力,有必要从某个地方抽取一些影响报价的其他数据,但不是从报价中得出的。也就是说,我们需要一些额外的信息来源。我在哪里可以得到它们?当然,我们可以尝试使用以下预测因素:月相、太阳黑子的数量、街头足球队的比赛结果、Wonchka河的水位或狗Tuzyk每平方厘米的跳蚤数量。但它们可能是有意义的吗?

 
尤里-雷舍托夫

最主要的是,你现在可以非常迅速地计算出低价值的预测因子,并以其他预测因子取代它们。替换之后,当务之急是要看可推广性是否增加。如果它没有增加,那么替代就没有做对,较重要的预测因子被较不重要的因子所取代。

昨天我试验了一下引言。很快就找到了最重要的TA震荡器。但是他们只有5个人。而进一步说概括能力不增长,我不在乎你放什么。也就是说,事实证明,无论你尝试什么TA指标和振荡器,但事实上它们都是基于相同的数据--之前历史的一小段(几个柱状),尽管它们处理这些数据的方式有点不同。所有的TA指标和振荡器都是同样的 "鸡蛋",只是从侧面看。无论你如何洗牌,它都包含相同的牌。所有的指数和震荡指标相互之间的关联性太大,与未来的关联性很小。

为了提高概括能力,有必要从某个地方抽取一些影响报价的其他数据,但不是从报价中得出的。也就是说,我们需要一些额外的信息来源。我在哪里可以得到它们?当然,我们可以尝试使用以下预测因素:月相、太阳黑子的数量、街头足球队的比赛结果、Wonchka河的水位或Tuzik的杂种狗每平方厘米的跳蚤数量。但它们不太可能是重要的?

至于占星术,我不会否定几千年来的实践。 作为一个球迷,我可以说,失去最喜欢的球队对生产力 有负面影响。 如果天桥镇是一个资源垄断者如诺尼克尔的城市,产量可能会下降,正如沃尤奇卡河的水位下降所间接表明的。

我们不可能猜测哪只蝴蝶,在什么地方,什么时候,扇动一下翅膀就会引起海啸。

 
尤里-雷舍托夫

最主要的是,你现在可以非常迅速地计算出低价值的预测因子,并以其他预测因子取代它们。替换之后,必须要看一下通用性是否增加。如果没有增加,则说明替换的方法不正确,即用一个不那么重要的预测因子取代了更重要的预测因子。

昨天我试验了一下引言。很快就找到了最重要的TA震荡器。但是他们只有5个人。而进一步说概括能力不增长,我不在乎你放什么。因此,事实证明,无论你通过TA指标和震荡器看什么,但事实上它们都是基于相同的数据--之前历史的一小段(几个柱状),尽管它们处理这些数据的方式有点不同。所有的TA指标和振荡器都是同样的 "鸡蛋",只不过是从侧面看。无论你如何洗牌,它都包含相同的牌。所有的指数和震荡指标相互之间的关联性太大,与未来的关联性很小。

为了提高概括能力,有必要从某个地方抽取一些影响报价的其他数据,但不是从报价中得出的。也就是说,我们需要一些额外的信息来源。我在哪里可以得到它们?当然,我们可以尝试使用以下预测因素:月相、太阳黑子的数量、街头足球队的比赛结果、Wonchka河的水位或狗Tuzyk每平方厘米的跳蚤数量。但它们不太可能是重要的?

试试累积delta。按实际量的累积分布.....Zscore系统/ Ye cjjndtcndtyyj dc` nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[ ?nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
 
Mihail Marchukajtes:
试试累积delta。按实际量的累积分布.....Zscore系统/ Ye cjjndtcndtyyj dc` nj c hfpys[ gfh? vj;yj lf;t 'rpjnbxtcrb[ ?nfv rjhhtkzwbz ljk;yf jncencndjdfnm ^-)
当然还有其他货币对的数据,甚至是与预测无关的异国数据...
 

也许有人会感兴趣,我发现了一个可以模拟交易和建立交易系统的软件包,叫做quantstrat

http://www.rinfinance.com/agenda/2013/workshop/Humme+Peterson.pdf