再培训 - 页 4

 
Aliaksandr Hryshyn:
谁使用什么技术来尽量减少模型/顾问的再培训?
我们必须从以下事实出发:在这种情况下,我们不能不对历史数据进行分析,而且必须完全消除 "适应历史 "的概念。最主要的应该是TS的理念本身,它的基础是什么。每个TS都是基于一个或多个指标的读数。后者有诸如采样量N这样的参数,在分析了整个采样量后达到了它的裁决。我们很自然地认为,没有一个指标能够以同样的方式成功地处理所有历史数据。因此,像SL和TP这样的参数来拯救。这里有3个需要优化的基本参数。有必要找到它们的值,以便TS可以通过所选TF的整个历史数据范围。在获得了整个时期的积累图后,我们需要分析并接受这样一个事实:在最坏的部分,由于市场的多面性,TS背后的原始想法并没有发挥作用。试图搜索并将整个情节分为 "坏 "和 "好",以及 "训练 "和 "前进 "是在浪费时间。TS需要根据全部可用的历史材料进行评估。
 
Youri Tarshecki:

那么,告诉我,你如何决定一个前锋是训练过度还是训练不足。过度训练的退化方式是否与训练不足的退化方式不同?

确定训练条件的质量的唯一方法是看到相应的样本外测试的质量。而只有通过比较结果,你才能知道优化是过度优化还是欠优化。但我没有看到任何地方有处理优化不足的主题。由于某些原因,每个人都认为问题的根源在于神话般的过度优化而不是代码质量。

前向退化评估了一个系统的通用性(即稳定性,对未知数据的适用性)。当它(能力)很低时,从实际的角度来看,无论我们是过度训练还是训练不足都没有区别--在任何情况下我们都会被淘汰。但是,如果专家顾问是经典的训练--使用参数集和MT测试器--那么我们不可能训练不足(从技术角度来看)。而如果使用自己的算法进行学习,我们可以使用众所周知的方法(例如提前停止)来找到 "误差最小 "时的最佳点(OOS中的最佳结果):在这一点上,欠优化已经结束,而过度优化还没有发生。不幸的是,标准测试器没有提供这种自动功能来比较优化期和OOS期的系统性能。MT中的OOS是正向测试。因此,黑体字强调的内容实际上与我所说的相同。这个话题的发起人提出了一个关于再培训的问题,所以这里的答案是关于这个问题。至于学习不足,如果我们指的不是优化的程度,而是抽象的 "代码质量",似乎包括预测器的选择、输入数据准备的方法、训练样本的深度和其他元知识,那么学习不足的定义非常简单--没有积极的优化结果

 

我不同意训练不足的说法--从技术上讲,这并不难做到。也就是说,退化的事实本身并不能说明它是过度训练还是训练不足。

如果作者把心思从这个词上移开,明白最佳是高斯的东西,那么他就会以稍微不同的方式提出问题--如何确定训练的最佳数量和密度。

然后我们就可以更具体了。

就我个人而言,我是根据测试的结果来定义的。

 

Stanislav Korotky:
Термин этот не дурацкий, а давно устоявшийся и "одобренный лучшими собаководами"

事实上,过度拟合并不是真正的过度训练,而是过度拟合。

 

让我们试着从一个稍微不同的角度来看待这个问题。

模型/TS在训练时(如果它有这种可能性的话)能够从历史数据中记住一些规律性的东西,同时,由于它的不完善性,它也会记住 "噪音"。我们将认为噪音是指TS可以 "学习",在新的数据上不能给出好的结果,噪音对于其他策略可能是不同的。

有趣的问题是,我们如何才能至少部分地限制TS/模型,使其不能 "记住 "噪声?或者如何从噪音中 "净化 "历史数据,同样,噪音与TS有关。

这里有一个图片中的简单例子,我们假设第1行和第2行是同一个模型。

下面是另一个例子,在两条垂直线 之间的区域,模型(红线)是非常错误的。

 
这些照片到底是关于什么的?轴的情况如何?优化的数量?
 
Комбинатор:

事实上,过拟合并不是真正的过度训练,而是过度拟合。

完全正确。拟合或过度拟合是同一件事。
 
Youri Tarshecki:
完全正确。装配或重新装配都是一样的。
如果对全部历史数据进行拟合或重新拟合,只会提高TS的质量。
 
Youri Tarshecki:
这些照片到底是关于什么的?轴上有什么?优化的数量?
它们不是专门针对交易的。他们展示了简单的例子,说明一个模型(第一张图片中的1号和2号线,以及第二张图片中的红线)在数据(小方块和下面的点)上可能是 "错误的"。

让我们假设在横轴上将是指标的值,而在纵轴上,对于点--TS应该如何预测价格的某个属性,使用这个指标的值,以便在加。对于线--TS是如何预测的。在这个预测的基础上,TS可以进行交易。这就是这样一个有条件的例子。预测的属性可以是存在趋势或平坦,波动性,等等。
 
Aliaksandr Hryshyn:
它们不是专门针对交易的。他们展示了一个模型(第一张图中的1号和2号线,以及第二张图中的红线)如何在数据(小方块和下面的点)上 "出错 "的简单例子。

让横轴为指标值,纵轴为点数--TS应该如何用这个指标值来预测某个价格属性,以实现盈利。对于线--TS是如何预测的。在这个预测的基础上,TS可以进行交易。这就是这样一个有条件的例子。预测的属性可以是存在趋势或平坦,波动性,等等。

在水平方向上,应该有指标值或指标组的优化操作的数量,在历史 的同一时刻 出现。而在垂直线上,是对整个系统的检查结果。然后我们可以谈谈过度训练和训练不足以及它们是什么。然后曲线会有很大不同。它几乎是一个正态分布,唯一不同的是,在某些时候,增加通过次数(或减少指标参数的步长)将不会得到任何新的东西。

如何调整通行证的数量?

1.通过简单改变训练次数,或改变指标参数的距离(步长)。

2.通过改变与OOS检查的 "步骤 "有关的培训历史深度。然后,历史上的同一部分将被优化不同的次数,尽管有不同数量的 "邻居"。

3.通过改变一个遗传优化算法,如果我们使用它。例如,通过改变代数、随机性等。

在这里,也许是所有可用的工具来对抗PERE和NEDO。

我还要指出,如果我们在优化(拟合)过程中准确地关注检查而不是结果,那么曲线的性质将不取决于系统本身是否无利可图。也就是说,如果这个系统正在失去,那么当过度训练时,它只会失去更多,就是这样。训练的任务是找到最佳参数。而编码的任务是找到可行的变体,训练的最佳状态本身并不创造任何新东西。