交易中的机器学习：理论、模型、实践和算法交易

Mihail Marchukajtes 2017.06.23 15:52 #4181

好吧，我将在这里抛出一些信息。事情是这样的，我有一个想法，应该用什么数据来预测市场，但不幸的是，我不能以正确的形式全面收集它们，如果有人帮助组织收集，我将分享他的优化器，好，以及整个战略。数据已经足够好了，但要成为超级的，我们需要添加一些东西。谁的编程能力强，能从多个网站获取csv文件中的在线数据？

Aleksey Terentev 2017.06.23 20:03 #4182

Mihail Marchukajtes:
好的，我把资料放在这里。我有一些想法，应该用什么数据来进行市场预测，但不幸的是，我不能以正确的形式收集所有的数据。如果有人帮助我组织收集，我将与他分享优化器和一般的策略。数据已经足够好了，但要成为超级的，我们需要添加一些东西。谁的编程能力强，能从多个网站获取csv文件中的在线数据？

我的模型是基于多线程和多样化的数据。我有解析数据的经验。我很乐意参加。

Yuriy Asaulenko 2017.06.23 20:35 #4183

我在我的博客中写过关于选择神经网络参数的文章--Selecting NEUROSET CONFIGURATION。

至少在初始阶段，最好这样做，即以后如果有必要，可以简化NS。

博客中的选择例子是抽象的，但我正是从类似的考虑出发，选择了我的NS的参数。学习成绩一般都不差。

有点可怕的是NS的体积--在已经为3个MA的例子中，它已经超过了100个神经元，而且它还不是一个TS，而只是一个模板。

Maxim Dmitrievsky 2017.06.23 20:44 #4184

尤里-阿索连科。

我在我的博客中写过关于选择神经网络参数的文章--Selecting NEUROSET CONFIGURATION。

至少在初始阶段，最好这样做，即以后如果有必要，可以简化NS。

博客中的选择例子是抽象的，但我正是从类似的考虑出发，选择了我的NS的参数。学习成绩一般都不差。

对NS的数量有点害怕--在3MA的例子中，已经超过了100个神经元，而且它还不是一个TS，只是一个模板。

让我们试试这种方式--在周末或下周，我将在这里抛出有趣的预测器，你告诉我你对它们的看法。MT5中只有指标形式的预测器，其中4个

我将尝试把它们作为预测器使用一段时间，我将有机会组织一次挑战赛--谁能通过这些预测器教给NS赚钱:)我还没有学会它们，但到目前为止我还没有做过实验。

Yuriy Asaulenko 2017.06.23 20:57 #4185

马克西姆-德米特里耶夫斯基。

让我们这样试试--在周末或下周，我将在这里发布有趣的预测，而你将对它们发表意见......？在mt5中只有指标形式的预测器，其中有4个

这将有可能组织一次挑战赛--谁能通过这些预测器教给NS赚钱:)但目前我还不能教MP使用它们进行交易获利。

(嗯，在我开始真正的交易之前，我还有很长的路要走）。我已经做了一个多月了。

如果我想使用你的指标，这将是有趣的，但我不会使用我的。事实上，基础（2008年的初始版本）可以在这里找到 -Butterworth移动平均线 - MetaTrader 4的指标。当然，现在一切都不同了。

Maxim Dmitrievsky 2017.06.23 20:59 #4186

尤里-阿索连科。

好吧，在我能够真正进行交易之前，我还有很长的路要走）。我已经做了一个多月了。

如果你有一个好的专家顾问，对我来说会很有用。然而，基础（2008年的初始版本）可以在这里找到 -Butterworth移动平均线 - MetaTrader 4的指标。当然，现在一切都不同了。

是的，我会这样做，只是因为有时我的大脑变成了一个管子，我需要别人的意见:)

Алёша 2017.06.24 11:04 #4187

我不想让任何人难过，但可惜的是，你们中的大多数人不知道如何正确准备目标。所有那些鼓舞人心的结果（75-80%的准确率）都是来自慢速蜡烛（>10分钟）的芯片，实际上是纯粹的血汗工厂。55%的准确率足以使夏普比率高于2，60%的准确率在慢速数据上也是一样的圣杯，也就是传说中的夏普比率3-4，没有人在现实中这样交易，只有HFT的家伙，但他们的交易成本尺度不同，有更少的SR <2是不赚钱的。

简而言之...

你无法看到目标!

换句话说，在计算目标时，你不能使用在计算特征时HOWEVER的数据，否则结果就会是一个poky。由于显而易见的原因，ZZ 这样的 "诡计 " 去死吧，它在远离计算特征的区域的极值之间进行插值，结果是高昂的，至少有90%的准确度没有问题，但这是一个假的。这就是 "预测不是主要的"、我们仍然应该发展TS等蒙昧主义讨论的基础。因此，事实上这 "90%"仍然是 "心爱的 "50%。

理智一点 :)

СанСаныч Фоменко 2017.06.24 12:41 #4188

阿利奥沙。

简而言之...

不要看到目标（特征）!

换句话说，在计算目标时，你不能使用在计算特征时永远使用的数据，否则，结果将是一个扫荡。由于显而易见的原因，ZZ 这样的 "诡计 " 去死吧，它在远离计算特征的区域的极值之间进行插值，结果是高昂的，至少90%的准确性没有问题，但这是一个假的。这是关于 "预测并不重要 "的蒙昧主义讨论的基础，人们仍然应该发展TS等等。因此，实际上这 "90%"仍然是 "心爱的 "50%。

理智一点 :)

不能同意你对ZZ的结论，以及你一般的结论。

例如，RSI。其中插值ZZ或反之为这个特定的预测器。同时，我可以证明RSI作为ZZ的预测器，其预测能力并不差。而且，例如，挥手对ZZ没有预测能力，对ZZ来说是100%的噪音--作为预测器完全无用。你可以得到一个基于mashka的模型，误差小于10%，但是如果你在一个没有与训练文件相关联的新文件上运行这个训练过的模型，你会得到任意的错误。

除了你提到的问题，即这个非常的RZ所衍生的RZ的预测器中存在预测器，还有一个问题是基本的，独立于目标变量的：就是预测器与目标变量不相关的问题，对于一个特定的（RZ也不例外）目标变量来说是噪音。噪声是一个非常方便的预测器。你总能在噪声值中找到能减少预测误差的值。当我不理解这一点时，我经常得到5%左右的预测错误。

但是，如果人们能够从特定目标变量的噪声中清理出初始预测器集，那么将误差降低到30%以下是非常困难的，至少对我来说是这样。

结论是：对某一特定目标变量来说是噪声的预测器会导致过度训练，ZZ也不例外。

Алёша 2017.06.24 13:08 #4189

SanSanych Fomenko:

我不能同意你对ZZ的结论，也不能同意你的一般结论。

例如，RSI。其中插值ZZ或反之为这个特定的预测器。同时，我可以证明RSI作为ZZ的预测器，其预测能力并不差。而且，例如，挥手对ZZ没有预测能力，对ZZ来说是100%的噪音--作为预测器完全无用。你可以得到一个基于mashka的模型，误差小于10%，但是如果你在一个没有与训练文件相关联的新文件上运行这个训练过的模型，你会得到任意的错误。

除了你提到的问题，即这个非常的RZ所衍生的RZ的预测器中存在预测器，还有一个问题是基本的，独立于目标变量的：就是预测器与目标变量不相关的问题，对于一个特定的（RZ也不例外）目标变量来说是噪音。噪声是一个非常方便的预测器。你总能在噪声值中找到能减少预测误差的值。当我不理解这一点时，我经常得到5%左右的预测错误。

但是，如果知道如何从特定目标变量的噪声中清除初始预测器集，那么将误差降低到30%以下是非常困难的，至少对我来说是这样。

结论是：过度训练是由对某一特定目标变量的噪声预测器造成的，ZZ也不例外。

很好!让我们就这个极其重要的话题进行辩论。我建议我们进行一系列的实验，以弄清这个问题的真相。

因此，我争辩说。

1）正确，从随机捆绑的时间序列中进行特征合成和分类，分为2个类别，在有足够的样本（从5-10k）的情况下，有50%的准确率（像一枚硬币）。如果准确率在统计学上有明显的偏差（>51%），那么在特征合成和/或分类的过程中就会出现错误。

2）当使用在计算特征时使用的数据的目标时，我们得到了明显的准确性偏差（55，60，90%），对先验不能预测的随机时间（50%）。这意味着这种悲痛是假的。

СанСаныч Фоменко 2017.06.24 13:21 #4190

阿利奥沙。

2）当我们使用用于计算性状的目标数据时，我们会得到一个明显的准确性偏差(55, 60, 90%) ON RANDOM TIMES，而这是无法先验预测的（50%）。这意味着这个仪表是假的。

为什么要检查什么呢？对我来说，这很明显。

我举了一个RSI-ZZ的例子--没有什么共同之处，你可以建立一个误差小于50%的模型。

另一个例子：Mashka-ZZ--很容易就会出现低于10%的误差。当在一个新文件上测试时，一个完全任意的结果。

交易中的机器学习：理论、模型、实践和算法交易 - 页 419