交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2016.08.17 08:39 #1101

Mihail Marchukajtes:
而你一直试图在5年内遏制市场上的分??????。这71个观察结果，在5分钟内的两个星期的交易中，如果有什么......。而且只买。因此，去吧.....还是你泄气了？

他在说什么...这很疯狂。

Mihail Marchukajtes 2016.08.17 08:41 #1102

Dr.Trader:

正如我之前所说，这个指标是无用的。

数据被随机分为两个大致相等的部分，然后只对第一部分进行模型训练，并同时对两部分进行测试。概括性为~75%意味着模型在最后能正确预测文件中75%的例子。
有几种方法可以使模型达到75%：
1）模型在训练数据上被训练到100%的准确率，而在文件的第二部分中新数据失败，它得到50%的准确率（与掷硬币一样）。平均数将正好是75%。这是一个非常糟糕的发展，在交易中也会很糟糕。
2）模型在训练数据上被训练到75%的准确率，它在测试数据上显示出同样的75%，这又是平均75%。在这种情况下，这是最好的情况，有机会赢得一些东西。
3）这两者之间的任何中间选项。

你的选择可能更接近于第一个。你需要非常幸运才能在交易中取得这样的结果，我假设你没有损失你的存款只是由于指标，它作为主要的信号（序列，或其他）。我认为，基于这一个指标的专家顾问将给出和指标+jPrediction一样好的结果。

你怎么知道如何计算归纳能力？雷舍托夫知道，我认为计算完全基于测试数据，正如他之前所说的......。如果经典的序列是可行的，我就不会使用预测器，但可惜的是......。这就像任何事情一样耗费精力。另一方面，分类器的加入则使其得到了相当的改善。我再一次写道，71次观察是TS在5分钟内两星期的工作。对于这个时间框架，这是一个相当可接受的间隔。我不习惯在半年或更长时间内做这些事。我训练了两个星期，赚了一天就完了，而你还在寻找圣杯。是的，我每天都在训练模型。在早上。好消息是，现在的优化时间非常合理.....。

Mihail Marchukajtes 2016.08.17 08:44 #1103

mytarmailS:
他在说什么呢...这简直是一派胡言。

那么，你不明白的是????。还是超出了你的理解力????。

mytarmailS 2016.08.17 09:03 #1104

Mihail Marchukajtes:
那么，你不明白的是????。还是超出了你的理解力????。

我问你如何衡量总容量，你告诉我多年的历史和其他一些废话......

我无法用一种方式衡量一般能力，你也无法用另一种方式衡量，但你不知道如何衡量，你能做的只是在jPrediction 中查找数字，却不知道这些数字从何而来，如何而来的，所以当他们开始问你具体问题时，你就开始胡说八道，说什么多年的历史等等。停止吧...请...

Mihail Marchukajtes 2016.08.17 09:18 #1105

mytarmailS:

我问你如何衡量总容量，你告诉我多年的历史和其他一些废话......

我无法用一种方式衡量一般能力，你也无法用另一种方式衡量，但你不知道如何衡量，你能做的只是在jPrediction 中查找数字，却不知道这些数字从何而来，如何而来的，所以当他们问你具体问题时，你就开始胡说八道，说什么多年的历史等等。别闹了，...请...

我可能已经解释过，我使用雷舍托夫的预测器，他是如何衡量普适性的，这些是给尤里的问题。问他。虽然他给出了公式，我也大致记得，但我不明白你为什么要问我。我只是他程序的用户，没有更多的.....。

Dr. Trader 2016.08.17 09:19 #1106

Mihail Marchukajtes:
我认为该计算仅基于测试数据

如果是这样的话，我很高兴，这就好多了。

在任何情况下，fronttest显示出更好的结果。我把你的文件分成两部分（没有洗牌，只是按顺序），第一部分有50行，第二部分有19行。所以jPrediction不能访问第二个文件中的例子，这对模型来说将是真正的新数据。

最后，在第二个文件中，JPrediction只给出了9个案例的答案。准确率约为50%，这个结果没什么好的。

附加的文件：

1bj8_qxs8yoq.zip 9 kb

Mihail Marchukajtes 2016.08.17 09:38 #1107

Dr.Trader:

如果是这样的话，我很高兴，这就好多了。

在任何情况下，前面的测试显示出更好的结果。我把你的文件分成两部分（没有洗牌，只是按顺序），第一部分有50行，第二部分有19行。所以jPrediction无法访问第二个文件中的例子，而这对模型来说将是真正的新数据。

最后，在第二个文件中，JPrediction只给出了9个案例的答案。正确的有5个，错误的有4个，准确率约为50%，这个结果没什么好的。

同意。需要在输入数据上下功夫.....

Alexey Burnakov 2016.08.17 10:18 #1108

Dr.Trader:

如果是这样的话，我很高兴，这就好多了。

在任何情况下，fronttest显示出更好的结果。把你的文件分成两部分（没有洗牌，只是按顺序），第一部分有50行，第二部分有19行。所以jPrediction无法访问第二个文件中的例子，对模型来说这将是真正的新数据。

因此，在第二个文件中，JPrediction只在9个案例中给出了答案。正确的有5个，错误的有4个。准确率约为50%，这个结果没有任何好处。

19、50岁，谁更。从数据集数据库中抽取任何例子，至少有数百行。

对我来说，这个软件并不适合，如果只是因为我自己更喜欢拿起参数和分解数据。但作为入门级，我认为这将是有趣的。

СанСаныч Фоменко 2016.08.17 11:04 #1109

Reshetov!

我的提议仍然有效。

Yury Reshetov 2016.08.17 18:28 #1110

mytarmailS:

你好，Yuri !

有问题））关于顺序搜索...

比方说，我们有10个预测因子

1,2, 3,4, 5, 6, 7, 8, 9, 10

绿色组是显示出最佳概括能力的预测器组，在这个组中，将加入其他预测器N+1。

红色组，是比绿色组稍差的一组，它将不参加测试，所有的测试都集中在绿色组上。

问题：如果在用其他N+1个预测器逐一进行所有试验后，发现在最终结果中，红色组的概括能力更强，这是否也很现实，还是我误解了什么 ????请澄清一下。

如果你想在不看数据和算法的情况下得到一个毫不含糊的答案，你最好去找桑桑尼茨-福明科，因为他带着一张聪明的脸会用 "精确和有价值 "的指示来告诫你任何问题，不管它是否有歧义。

如果你想要一个更精确的答案，那就做一个A/B测试，即在一种情况下尝试将红色与黑色连接到绿色，而在另一种情况下，只连接黑色。无论哪种方案从实验结果中得到最好的概括性，对于你的任务来说都是最正确的方案。

问题是，经验的结果始终是真理的标准。

例如，我今天正在测试jPrediction的数据中心化。在不同的样本上，结果要么令人沮丧，要么稍好。虽然对于反向传播网格来说，居中的做法会有明显的改善。不得不离开线性归一化。

而如果我不做A/B测试，而是从一些机器学习的小书或讲座中获取 "现成的知识"，或者问一些无所不知的人，我就会得到这样的答案：据说居中化比线性归一化 "更好"。尽管经验表明，这对所有的算法来说都是不明确的。

这就是那种馅饼。

交易中的机器学习：理论、模型、实践和算法交易 - 页 111