交易员的自欺欺人:对前锋的不信任。 - 页 12

 
Vasiliy Sokolov:

关于R^2再多说一点。

对我来说,这是一个非常有力的指标,但还不够。在实践中,我遇到了一些TC,可以产生非常好的和平稳的股权上升。R^2非常高,他们的一组参数甚至可以破解最复杂的前进。下面是一个这样的TS的例子。


它的公平性使人在市场上站稳脚跟,但并不是那么简单。适应的TS有一个显著的特点:它们的参数集几乎总是不稳定的,这些参数值的任何轻微转变都会大大改变结果。例如,在这个TS中稍微改变一下关闭规则,就会导致以下结果。

你可以看到,一个小小的变化导致了灾难性的结果。这就是为什么在确定了最佳参数集后,有必要将参数转移一些数值,并检查在最佳点附近的运行结果。

优化空间可以是多维的,但维度的数量在这里不起作用。如果我们处于一个稳定的参数点,他们的转变不会急剧改变TS的行为。重要的是要明白,在实际交易中,这种转变会发生。在历史上,我们围绕一个静态市场转移TS参数。在真实的市场上,市场将围绕之前发现并由我们固定的参数移动其特征。

如果不了解这个系统是如何运作的,你就无法检查它。一个期权的敏感性也是由这种理解决定的。有些选项可能是敏感的,有些可能是 "厚 "的。例如,你有一个模式,在一个小的开放时间 范围内工作,而这个区域的宽度是一个选择。当这种选择有哪怕是轻微的变化时,它就没有理由工作。

是的,而且变化的规模是有条件的。

 
Слава:
你不能在不了解一个系统如何运作的情况下看它。一个最佳的敏感性也是通过这种理解。有些选择可能是敏感的,有些可能是 "厚 "的。例如,你有一个模式,在一个小的开放时间 范围内工作,而这个区域的宽度是一个选择。当这种选择有哪怕是轻微的变化时,它就没有理由工作。
在这里,它确实如此。没有人说范围可以凭空选择,或者至少是自动选择。这就是自动交易系统的专业性,寻找有意义的参数和它们的范围。
 
Vasiliy Sokolov:
在这里,是的。没有人说范围可以凭空选择,或者至少是自动选择。这就是自动交易系统的专业性,寻找有意义的参数和它们的范围。

同意)))

 
Vasiliy Sokolov:

我们正在交易一个几乎总是在幕后的原因的后果。

2013年4月,由于关于奥巴马去世的 "谣言",道琼斯指数在一瞬间下跌了13%。他们说阅读新闻的机器人被触发了。然后,这些机器人,本身就成了非常幕后的原因。

IMHO 测试的目的不是为了得到一组参数,而是为了尝试回答3个问题。

为专家顾问选择哪种金融工具。

在哪个市场交易。(趋势、平坦、挥发.....)

什么时候?- 在什么时候,考虑到不同时间段和季节的市场特点。

 
Avals:

一个EA在一定时期内工作--粗略地说是一个对它有利的阶段。这就是为什么随机抽取过多的历史或根本没有意义的原因。而你的方法需要很多倍的统计和测试期。即任务是尽快找到工作主题,同时消除拟合,而将历史分割成独立的片段,为其做出决定,导致系统所依据的历史已经工作了很长时间(关于统计有效性的论点在前文中)。


我的方法是不同的)我不采取任何比例,也不使用正向测试。我通过公平的质量来分析系统的质量。


而 "过多 "的历史意味着什么?你甚至不知道哪一个历史间隔对你的系统来说是最佳的。你永远不会明白,如果股票曲线显示的是 "工作主题 "或修正,无论你采取什么历史时期。
 
Youri Tarshecki:
而 "太多的 "历史意味着什么?你甚至不知道什么是你系统的最佳历史时期。

有这样一种东西,即统计学上的有效性。当涉及到交易时--为了相信在回溯测试中获得的结果,需要的最低交易数量是多少。这个数字取决于许多事情。例如,从平均盈利交易与平均亏损交易的比率来看。更简单地说, 这取决于tp/sl比率。当它等于1时,需要最小的交易数。与1相差越多,需要的交易就越多。但即使在tp/sl=1的情况下,交易也需要至少100个(这可以用montecarlo检查)。在你对12个回测中的每个回测的方法中,应该保留统计有效性。因此,我们需要至少1200笔交易用于回溯测试+相同数量的远期交易(其结果在统计学上也应该是正确的)。这导致的结果是,即使是日内交易,用这种方法我们也需要从国王戈罗克的时间开始测试))


尤里-塔舍基

无论你采取什么历史时期,你永远不会明白,如果你发现了一个 "工作主题",或根据股权曲线发生了修正。

好吧,你需要看一下不止一个股权))。如上所述,重要的是最佳区域的宽度和某些参数的系统改进的均匀性。例如,系统使用前一天的范围宽度,系统是突破性的。我们把它作为一个最佳选择。即,过滤--在Range_width<=X时交易。X-option的值越小,交易就越少(因为这样的日子比较少)。但如果系统质量提高了(如FF等参数),这就证实了系统和这个过滤器的稳健性。还有其他的统计方法来检查稳健性,例如多工具性。

 
Avals:

有这样一种东西,即统计学上的有效性。在交易方面--要相信回测中得到的结果,最少需要多少次交易。这个数字取决于许多事情。例如,从平均盈利交易与平均亏损交易的比率来看。更简单地说, 这取决于tp/sl比率。当它等于1时,需要最小的交易数。与1相差越多,需要的交易就越多。但即使在tp/sl=1的情况下,交易也需要至少100个(这可以用montecarlo检查)。在你对12个回测中的每个回测的方法中,应该保留统计有效性。因此,我们需要至少1200笔交易用于回溯测试+相同数量的远期交易(其结果在统计学上也应该是正确的)。它的结果是,即使是日内交易,用这样的方法我们也要测试自沙皇戈罗哈时代以来的情况)。


嗯,你必须要看的不仅仅是股权))))。如上所述,重要的是最佳区域的宽度和某些参数的系统改进的均匀性。例如,系统使用前一天的范围宽度,系统是突破性的。我们把它作为一个最佳选择。即,过滤--在Range_width<=X时交易。X-option的值越小,交易就越少(因为这样的日子比较少)。但如果系统质量提高了(如FF等参数),这就证实了系统和这个过滤器的稳健性。还有其他的统计方法来检查稳健性,例如多工具性。

我应该补充的是,需要一个长期的历史,不仅是因为对所获结果的统计意义的要求,而且也是为了测试不同市场条件下的TS。例如,欧元兑美元在半年多的时间里一直处于大幅下跌的趋势。即使是10 000次交易也会表明,在这个领域,空头是有利可图的。为了理解我们没有适应某种罕见的市场条件,我们需要一个长期的历史。

我注意到,对于转发,你只是从一种模式跳到另一种模式,真诚地不理解为什么你的TS在测试中赚了,而在转发中输了。答案很简单,与其为其中一个市场模式创建TS,不如创建TS,其结果不取决于当前选定的时间间隔。换句话说,不要交易市场,而是交易其低效率。

 
Avals:

有这样一种东西,即统计学上的有效性。

统计学中没有这种东西。
 
Yury Reshetov:
统计学中没有这样的概念。
更多的是翻译为 "统计学意义"
 
Vasiliy Sokolov:

我想补充的是,需要长期的历史,不仅是因为对所获结果的统计学意义的要求,而且也是为了测试不同市场条件下的TS。

比方说,你已经用 "蒙特卡尔 "确定了最小值。你的故事必须有多长?你的故事应该有多长?在你展示一个真正的计算优化截止点的方法之前--所有说的都只是一种SAMOUBMAN和对常识性话题的抒情方式。我已经说过,股票并不能使你免于适应。你所有的逻辑只导致了一个解决方案--对所有的历史进行测试。尽管如此,你确实把自己限制在这个范围内。为什么?如果你不需要转发--在所有可用的历史上测试,你的 "统计有效性 "将是最大的。

我的方法很简单,我比较在同一幅图上获得的前向之和,但步骤不同。最好的结果给出了最好的测试步骤。由于我不想要抽象的推理,而是要使利润最大化,所以我比较了前锋所显示的利润。那你用什么来比较呢?