再培训 - 交易系统 - MQL5 算法交易论坛

Yousufkhodja Sultonov 2016.07.09 15:38 #31

Aliaksandr Hryshyn:

谁使用什么技术来尽量减少模型/顾问的再培训？

我们必须从以下事实出发：在这种情况下，我们不能不对历史数据进行分析，而且必须完全消除 "适应历史 "的概念。最主要的应该是TS的理念本身，它的基础是什么。每个TS都是基于一个或多个指标的读数。后者有诸如采样量N这样的参数，在分析了整个采样量后达到了它的裁决。我们很自然地认为，没有一个指标能够以同样的方式成功地处理所有历史数据。因此，像SL和TP这样的参数来拯救。这里有3个需要优化的基本参数。有必要找到它们的值，以便TS可以通过所选TF的整个历史数据范围。在获得了整个时期的积累图后，我们需要分析并接受这样一个事实：在最坏的部分，由于市场的多面性，TS背后的原始想法并没有发挥作用。试图搜索并将整个情节分为 "坏 "和 "好"，以及 "训练 "和 "前进 "是在浪费时间。TS需要根据全部可用的历史材料进行评估。

Stanislav Korotky 2016.07.09 19:23 #32

Youri Tarshecki:

那么，告诉我，你如何决定一个前锋是训练过度还是训练不足。过度训练的退化方式是否与训练不足的退化方式不同？

确定训练条件的质量的唯一方法是看到相应的样本外测试的质量。而只有通过比较结果，你才能知道优化是过度优化还是欠优化。但我没有看到任何地方有处理优化不足的主题。由于某些原因，每个人都认为问题的根源在于神话般的过度优化而不是代码质量。

前向退化评估了一个系统的通用性（即稳定性，对未知数据的适用性）。当它（能力）很低时，从实际的角度来看，无论我们是过度训练还是训练不足都没有区别--在任何情况下我们都会被淘汰。但是，如果专家顾问是经典的训练--使用参数集和MT测试器--那么我们不可能训练不足（从技术角度来看）。而如果使用自己的算法进行学习，我们可以使用众所周知的方法（例如提前停止）来找到 "误差最小 "时的最佳点（OOS中的最佳结果）：在这一点上，欠优化已经结束，而过度优化还没有发生。不幸的是，标准测试器没有提供这种自动功能来比较优化期和OOS期的系统性能。MT中的OOS是正向测试。因此，黑体字强调的内容实际上与我所说的相同。这个话题的发起人提出了一个关于再培训的问题，所以这里的答案是关于这个问题。至于学习不足，如果我们指的不是优化的程度，而是抽象的 "代码质量"，似乎包括预测器的选择、输入数据准备的方法、训练样本的深度和其他元知识，那么学习不足的定义非常简单--没有积极的优化结果。

Youri Tarshecki 2016.07.10 11:17 #33

我不同意训练不足的说法--从技术上讲，这并不难做到。也就是说，退化的事实本身并不能说明它是过度训练还是训练不足。

如果作者把心思从这个词上移开，明白最佳是高斯的东西，那么他就会以稍微不同的方式提出问题--如何确定训练的最佳数量和密度。

然后我们就可以更具体了。

就我个人而言，我是根据测试的结果来定义的。

TheXpert 2016.07.10 11:26 #34

Stanislav Korotky:
Термин этот не дурацкий, а давно устоявшийся и "одобренный лучшими собаководами"

事实上，过度拟合并不是真正的过度训练，而是过度拟合。

Aliaksandr Hryshyn 2016.07.10 13:24 #35

让我们试着从一个稍微不同的角度来看待这个问题。

模型/TS在训练时（如果它有这种可能性的话）能够从历史数据中记住一些规律性的东西，同时，由于它的不完善性，它也会记住 "噪音"。我们将认为噪音是指TS可以 "学习"，在新的数据上不能给出好的结果，噪音对于其他策略可能是不同的。

有趣的问题是，我们如何才能至少部分地限制TS/模型，使其不能 "记住 "噪声？或者如何从噪音中 "净化 "历史数据，同样，噪音与TS有关。

这里有一个图片中的简单例子，我们假设第1行和第2行是同一个模型。

下面是另一个例子，在两条垂直线之间的区域，模型（红线）是非常错误的。

Youri Tarshecki 2016.07.10 17:20 #36

这些照片到底是关于什么的？轴的情况如何？优化的数量？

Youri Tarshecki 2016.07.10 17:27 #37

Комбинатор:

事实上，过拟合并不是真正的过度训练，而是过度拟合。

完全正确。拟合或过度拟合是同一件事。

Yousufkhodja Sultonov 2016.07.10 19:58 #38

Youri Tarshecki:
完全正确。装配或重新装配都是一样的。

如果对全部历史数据进行拟合或重新拟合，只会提高TS的质量。

Aliaksandr Hryshyn 2016.07.10 22:07 #39

Youri Tarshecki:
这些照片到底是关于什么的？轴上有什么？优化的数量？

它们不是专门针对交易的。他们展示了简单的例子，说明一个模型（第一张图片中的1号和2号线，以及第二张图片中的红线）在数据（小方块和下面的点）上可能是 "错误的"。

让我们假设在横轴上将是指标的值，而在纵轴上，对于点--TS应该如何预测价格的某个属性，使用这个指标的值，以便在加。对于线--TS是如何预测的。在这个预测的基础上，TS可以进行交易。这就是这样一个有条件的例子。预测的属性可以是存在趋势或平坦，波动性，等等。

Youri Tarshecki 2016.07.11 05:43 #40

Aliaksandr Hryshyn:

它们不是专门针对交易的。他们展示了一个模型（第一张图中的1号和2号线，以及第二张图中的红线）如何在数据（小方块和下面的点）上 "出错 "的简单例子。

让横轴为指标值，纵轴为点数--TS应该如何用这个指标值来预测某个价格属性，以实现盈利。对于线--TS是如何预测的。在这个预测的基础上，TS可以进行交易。这就是这样一个有条件的例子。预测的属性可以是存在趋势或平坦，波动性，等等。

在水平方向上，应该有指标值或指标组的优化操作的数量，在历史的同一时刻出现。而在垂直线上，是对整个系统的检查结果。然后我们可以谈谈过度训练和训练不足以及它们是什么。然后曲线会有很大不同。它几乎是一个正态分布，唯一不同的是，在某些时候，增加通过次数（或减少指标参数的步长）将不会得到任何新的东西。

如何调整通行证的数量？

1.通过简单改变训练次数，或改变指标参数的距离（步长）。

2.通过改变与OOS检查的 "步骤 "有关的培训历史深度。然后，历史上的同一部分将被优化不同的次数，尽管有不同数量的 "邻居"。

3.通过改变一个遗传优化算法，如果我们使用它。例如，通过改变代数、随机性等。

在这里，也许是所有可用的工具来对抗PERE和NEDO。

我还要指出，如果我们在优化（拟合）过程中准确地关注检查而不是结果，那么曲线的性质将不取决于系统本身是否无利可图。也就是说，如果这个系统正在失去，那么当过度训练时，它只会失去更多，就是这样。训练的任务是找到最佳参数。而编码的任务是找到可行的变体，训练的最佳状态本身并不创造任何新东西。

再培训 - 页 4