交易中的机器学习:理论、模型、实践和算法交易 - 页 111

 
Mihail Marchukajtes:
而你一直试图在5年内遏制市场上的分??????。这71个观察结果,在5分钟内的两个星期的交易中,如果有什么......。而且只买。因此,去吧.....还是你泄气了?
他在说什么...这很疯狂。
 
Dr.Trader:

正如我之前所说,这个指标是无用的。

数据被随机分为两个大致相等的部分,然后只对第一部分进行模型训练,并同时对两部分进行测试。概括性为~75%意味着模型在最后能正确预测文件中75%的例子。
有几种方法可以使模型达到75%:
1)模型在训练数据上被训练到100%的准确率,而在文件的第二部分中新数据失败,它得到50%的准确率(与掷硬币一样)。平均数将正好是75%。这是一个非常糟糕的发展,在交易中也会很糟糕。
2)模型在训练数据上被训练到75%的准确率,它在测试数据上显示出同样的75%,这又是平均75%。在这种情况下,这是最好的情况,有机会赢得一些东西。
3)这两者之间的任何中间选项。

你的选择可能更接近于第一个。你需要非常幸运才能在交易中取得这样的结果,我假设你没有损失你的存款只是由于指标,它作为主要的信号(序列,或其他)。我认为,基于这一个指标的专家顾问将给出和指标+jPrediction一样好的结果。

你怎么知道如何计算归纳能力?雷舍托夫知道,我认为计算完全基于测试数据,正如他之前所说的......。如果经典的序列是可行的,我就不会使用预测器,但可惜的是......。这就像任何事情一样耗费精力。另一方面,分类器的加入则使其得到了相当的改善。我再一次写道,71次观察是TS在5分钟内两星期的工作。对于这个时间框架,这是一个相当可接受的间隔。我不习惯在半年或更长时间内做这些事。我训练了两个星期,赚了一天就完了,而你还在寻找圣杯。是的,我每天都在训练模型。在早上。好消息是,现在的优化时间非常合理.....。
 
mytarmailS:
他在说什么呢...这简直是一派胡言。
那么,你不明白的是????。还是超出了你的理解力????。
 
Mihail Marchukajtes:
那么,你不明白的是????。还是超出了你的理解力????。

我问你如何衡量总容量,你告诉我多年的历史和其他一些废话......

我无法用一种方式衡量一般能力,你也无法用另一种方式衡量,但你不知道如何衡量,你能做的只是在jPrediction 中查找数字,却不知道这些数字从何而来,如何而来的,所以当他们开始问你具体问题时,你就开始胡说八道,说什么多年的历史等等。 停止吧...请...

 
mytarmailS:

我问你如何衡量总容量,你告诉我多年的历史和其他一些废话......

我无法用一种方式衡量一般能力,你也无法用另一种方式衡量,但你不知道如何衡量,你能做的只是在jPrediction 中查找数字,却不知道这些数字从何而来,如何而来的,所以当他们问你具体问题时,你就开始胡说八道,说什么多年的历史等等。 别闹了,...请...

我可能已经解释过,我使用雷舍托夫的预测器,他是如何衡量普适性的,这些是给尤里的问题。问他。虽然他给出了公式,我也大致记得,但我不明白你为什么要问我。我只是他程序的用户,没有更多的.....。
 
Mihail Marchukajtes:
我认为该计算仅基于测试数据

如果是这样的话,我很高兴,这就好多了。

在任何情况下,fronttest显示出更好的结果。我把你的文件分成两部分(没有洗牌,只是按顺序),第一部分有50行,第二部分有19行。 所以jPrediction不能访问第二个文件中的例子,这对模型来说将是真正的新数据。

最后,在第二个文件中,JPrediction只给出了9个案例的答案。准确率约为50%,这个结果没什么好的。

附加的文件:
 
Dr.Trader:

如果是这样的话,我很高兴,这就好多了。

在任何情况下,前面的测试显示出更好的结果。我把你的文件分成两部分(没有洗牌,只是按顺序),第一部分有50行,第二部分有19行。 所以jPrediction无法访问第二个文件中的例子,而这对模型来说将是真正的新数据。

最后,在第二个文件中,JPrediction只给出了9个案例的答案。正确的有5个,错误的有4个,准确率约为50%,这个结果没什么好的。

同意。需要在输入数据上下功夫.....
 
Dr.Trader:

如果是这样的话,我很高兴,这就好多了。

在任何情况下,fronttest显示出更好的结果。把你的文件分成两部分(没有洗牌,只是按顺序),第一部分有50行,第二部分有19行。 所以jPrediction无法访问第二个文件中的例子,对模型来说这将是真正的新数据。

因此,在第二个文件中,JPrediction只在9个案例中给出了答案。正确的有5个,错误的有4个。 准确率约为50%,这个结果没有任何好处。

19、50岁,谁更。从数据集数据库中抽取任何例子,至少有数百行。

对我来说,这个软件并不适合,如果只是因为我自己更喜欢拿起参数 和分解数据。但作为入门级,我认为这将是有趣的。

 

Reshetov!

我的提议仍然有效。

 
mytarmailS:

你好,Yuri !

有问题))关于顺序搜索...

比方说,我们有10个预测因子

1,2, 3,4, 5, 6, 7, 8, 9, 10

绿色 组是显示出最佳概括能力的预测器组,在这个组中,将加入其他预测器N+1。

红色 组,是比绿色组 稍差的一组, 将不参加测试,所有的测试都集中在绿色 组上。

问题:如果在用其他N+1个预测器逐一进行所有试验后,发现在最终结果中,红色组的概括能力更强,这是否也很现实,还是我误解了什么 ????请澄清一下。

如果你想在不看数据和算法的情况下得到一个毫不含糊的答案,你最好去找桑桑尼茨-福明科,因为他带着一张聪明的脸会用 "精确和有价值 "的指示来告诫你任何问题,不管它是否有歧义。

如果你想要一个更精确的答案,那就做一个A/B测试,即在一种情况下尝试将红色与黑色连接到绿色,而在另一种情况下,只连接黑色。无论哪种方案从实验结果中得到最好的概括性,对于你的任务来说都是最正确的方案。

问题是,经验的结果始终是真理的标准。

例如,我今天正在测试jPrediction的数据中心化。在不同的样本上,结果要么令人沮丧,要么稍好。虽然对于反向传播网格来说,居中的做法会有明显的改善。不得不离开线性归一化。

而如果我不做A/B测试,而是从一些机器学习的小书或讲座中获取 "现成的知识",或者问一些无所不知的人,我就会得到这样的答案:据说居中化比线性归一化 "更好"。尽管经验表明,这对所有的算法来说都是不明确的。

这就是那种馅饼。