交易中的机器学习:理论、模型、实践和算法交易 - 页 789

 

我的理解是否正确,AUTO ARIMA自己计算一切,我只需要加载报价。

我在几个网站上检查过,ARIMA(0,1,0)模型到处都出现。

 
阿纳托利-扎因奇科夫斯基

这是一张图片,只是因为你之前看到了这个下降三条,并不意味着你现在考虑到了这个问题。


不错的照片,我将用它作为一个例子......

如果预测中没有误差,如果我们看到会有下跌,我们怎么能得到减分。当零线以相反符号收盘时,我们仍然知道会有下跌。我希望对这幅画不会有任何疑问.....我们随机选择了一个窗口,但我们预测了这个窗口中的每一个柱子,因此,当第三个柱子为零时,我们看到预测中的巨大差异,我们就卖出。但是,当我们在第一条预测中看到轻微的模数差异时,我们已经知道在哪个条上会有明显的增长。只是有两个误解是问题所在。首先,我通过省略一些我认为是显而易见的观点来解释我自己。第二,由于缺乏经验,你不了解它。但提出问题是正常的,所以让我们继续......。

 
Mihail Marchukajtes:

照片不错,我就用它来做例子...

因此,在预测没有错误的情况下,如果我们能看到将有一个秋天,我们怎么能得到一个减分。当零线以相反符号收盘时,我们仍然知道会有下跌。我希望对这幅画不会有任何疑问.....我们随机选择了一个窗口,但我们预测了这个窗口中的每一个柱子,因此,当第三个柱子为零时,我们看到预测中的巨大差异,我们就卖出。但是,当我们在第一条预测中看到轻微的模数差异时,我们已经知道在哪个条上会有明显的增长。只是有两个误解是问题所在。首先,我通过省略一些我认为是显而易见的观点来解释我自己。第二,由于缺乏经验,你不了解它。但问问题是对的,所以我们继续吧......

如果我看一下统计数据,我不认为它们是基于预测的,我也不认为它们应该基于预测,但它们可能是基于预测的。但所有这一切在100%的预测中只是超级好的,但当有甚至90%的预测时该怎么办,因为10%的错误预测会使天平倾斜得太厉害。

 

我想我今天会晚点回家,但我已经有几天想写一篇长文章了。我现在就去做,看看。但首先是一个小插曲。

文章的书面部分确实会在博客上发布并链接到它。然后我开始写另一篇文章,而不是这篇文章,听起来像是 "在机器学习中工作的方法论指南"。有一天,我在城市里散步,我想,如果有一种方法,就像在大学里一样,在没有水的情况下,描述你能做什么和不能做什么的基本规则,那就好了。那么,正如他们所说的那样,等着瞧吧。现在是长帖的主题。它的全部意义.....

在这一个月里,我取得了突破性进展,你看得很清楚,有人认可,有人反驳,但没有人有疑问,Reshetova的优化器我早就有了,但得到一个好的模型,我开始时,医生给我填了P的命令,并附有解释,第二天我收到的测试结果,我在所有15年里从未见过。我知道这与卷轴无关,优化者做得很好,但这与他无关。我只是100%肯定,它不是世界上唯一的优化器,它的工作做得最好。当然不是。大多数P套餐和它一样好用。那么问题出在哪里。为什么结果这么差,整个机器学习分支的骨干力量还在被搜索,找不到。答案很简单。在准备模型的过程中,你在某个阶段犯了错误。从逻辑上讲,你认为你在选择某种预测或转变时是正确的,但你犯了一些小错误,以为自己是正确的,但事实上你不是。

这就是为什么我开始谈论退步,弄清楚你能做什么和不能做什么。我以下列方式面对自己的错误观念。从逻辑上讲,如果你想一想。那个有更多输入和更长多项式的模型据说更聪明,更有参数性,但实践表明结果恰恰相反,在反馈上输入数量最少的模型比输入更多的模型赚得更多。这是一个例子,当你认为你的逻辑是正确的,但在实践中却发现你不是。

但机器学习的问题原来并不在于获得模型的方法或使用一些超级秘密的变换。主要的阿基里斯之踵是别的东西,我可以用一个例子来解释,这将是可以理解的,我将同时砸碎马克西姆的照片。

假设我们创建了一个系统来获得回归或分类模型。而且我们相信,我们在设计 过程中没有犯任何严重的错误。假设。

我们有一份培训文件。我们运行它进行优化10次,得到10个模型。因此,对我来说,最困难的问题是。如何选择没有被过度训练和训练不足的模型,但又能满足市场的需要,等等。正是这个问题是阿喀琉斯之踵。你可能做了一个人工智能系统并在其中犯了一些错误,但这并不意味着你的系统不能产生一个泛化模型。

人工智能系统的质量正是由充分的模型数量与优化的总数量来定义的。假设一个系统在100次优化中只给出了一个可以使用的模型,而第二个系统在同样的100次优化中给出了20个适合使用的模型。很明显,第二个系统比第一个系统好,因为在相同的优化量下,它比第一个系统有更多的正确模型。例如,优化器Reshetova在四个模型中(原则上不超过四个)给出一个到两个合适的模型。有时四个人是不够的。没问题,在第五次、第六次或第十次优化时,它将给出一个足以满足市场的模型。而现在最有趣的事情是如何识别和找到这个模型。我已经找到了一个方法。我是按以下方式进行的。我生成了一个训练文件并进行了四次训练。然后我对这些模型进行评估,并选择一个足够的模型,为此我只需要在跳闸的过程中进行验证或测试的部分。我以3-4个信号的形式留下一小段OOS,最终确信这就是它,然后我把它放在路上。这就是为什么模型选择问题是准备TS时最重要的问题之一。我将继续。

 
forexman77:

我的理解是否正确,AUTO ARIMA自己计算一切,我只需要加载报价。

我在几张图上检查了一下,到处都显示为ARIMA(0,1,0)。

auto.arima {forecast}
> y <- dd$OPEN
> auto.arima(y)
Series: y 
ARIMA(3,1,5) 

Coefficients:
         ar1     ar2      ar3      ma1      ma2     ma3      ma4      ma5
      0.3956  0.4421  -0.6151  -0.4159  -0.4165  0.6288  -0.0257  -0.0515
s.e.  0.0904  0.0701   0.0827   0.0905   0.0708  0.0797   0.0105   0.0115

sigma^2 estimated as 3.406 e-06:  log likelihood=66279.3
AIC=-132540.6   AICc=-132540.6   BIC=-132473
 

我写了,论坛闪了一下,所以这样读。我不能改写它......


 
Mihail Marchukajtes:

我想我今天会晚点回家,但我已经有几天想写一篇长文章了。我现在就去做,看看。但首先是一个小插曲。

文章的书面部分确实会在博客上发布并链接到它。然后我开始写另一篇文章,而不是这篇文章,听起来像是 "在机器学习中工作的方法论指南"。有一天,我在城市里散步,我想,如果有一种方法,就像在大学里一样,在没有水的情况下,描述你能做什么和不能做什么的基本规则,那就好了。那么,正如他们所说的那样,等着瞧吧。现在是长帖的主题。它的全部意义.....

在这一个月里,我取得了突破性进展,你看得很清楚,有人认可,有人反驳,但没有人有疑问,Reshetova的优化器我早就有了,但得到一个好的模型,我开始时,医生给我填了P的命令,并附有解释,第二天我收到的测试结果,我在所有15年里从未见过。我知道这与卷轴无关,优化者做得很好,但这与他无关。我只是100%肯定,它不是世界上唯一的优化器,它的工作做得最好。当然不是。大多数P套餐和它一样好用。那么问题出在哪里。为什么结果这么差,整个机器学习分支的骨干力量还在被搜索,找不到。答案很简单。在准备模型的过程中,你在某个阶段犯了错误。从逻辑上讲,你认为你在选择某种预测或转变时是正确的,但你犯了一些小错误,以为自己是正确的,但事实上你不是。

这就是为什么我开始谈论退步,弄清楚你能做什么和不能做什么。我以下列方式面对自己的错误观念。从逻辑上讲,如果你想一想。那个有更多输入和更长多项式的模型据说更聪明,更有参数性,但实践表明结果恰恰相反,在反馈上输入数量最少的模型比输入更多的模型赚得更多。这是一个例子,当你认为你的逻辑是正确的,但在实践中却发现你不是。

但机器学习的问题原来并不在于获得模型的方法或使用一些超级秘密的变换。主要的阿基里斯之踵是别的东西,我可以用一个例子来解释,这将是可以理解的,我将同时砸碎马克西姆的照片

假设我们创建了一个系统来获得回归或分类模型。而且我们相信,我们在设计过程中没有犯任何严重的错误。假设。

我们有一份培训文件。我们运行它进行优化10次,得到10个模型。因此,对我来说,最困难的问题是。如何选择没有被过度训练和训练不足的模型,但又能满足市场的需要,等等。正是这个问题是阿喀琉斯之踵。你可能做了一个人工智能系统并在其中犯了一些错误,但这并不意味着你的系统不能产生一个泛化模型。

人工智能系统的质量正是由充分的模型数量与优化的总数量来定义的。假设一个系统在100次优化中只给出了一个可以使用的模型,而第二个系统在同样的100次优化中给出了20个适合使用的模型。很明显,第二个系统比第一个系统好,因为在相同的优化量下,它比第一个系统有更多的正确模型。例如,优化器Reshetova在四个模型中(原则上不超过四个)给出一个到两个合适的模型。有时四个人是不够的。没问题,在第五次、第六次或第十次优化时,它将给出一个足以满足市场的模型。而现在最有趣的事情是如何识别和找到这个模型。我已经找到了一个方法。我是按以下方式进行的。我生成了一个训练文件并进行了四次训练。然后我对这些模型进行评估,并选择一个足够的模型,为此我只需要在跳闸的过程中进行验证或测试的部分。我以3-4个信号的形式留下一小段OOS,最终确信这就是它,然后我把它放在路上。这就是为什么模型选择问题是准备TS时最重要的问题之一。我将继续。

我不能再看这些乱七八糟的东西了,你让我很难受。

其余的明显的队长和清晰的宪兵们

开溜 )

 
马克西姆-德米特里耶夫斯基

我不能再看这些疯子的胡言乱语了,你让我很难受。

其余的 "显而易见 "的队长和 "清晰 "的宪兵们

开溜 )

他写道,他喝醉了,两夜没睡。他想 "谈谈"))。

Mihail Marchukajtes:
一般来说,米哈伊尔,你应该在晚上睡觉。

 
Maxim Dmitrievsky:

我不能再读这些疯狂的废话了,你快把我逼疯了。

其余的 "显而易见 "的队长和 "清晰 "的宪兵们

(I'm outta here.)

马克斯肯定找到了一个圣 杯))。

 
Maxim Dmitrievsky:

这个话题已经超出了理性的范畴--有些人早已变得僵化,迷恋于过度训练和 "包"。

有些人还是和国防部的那个蠢货一样。

这并不是说这个话题已经不存在了--它是 "模糊 "的。没有定期的节制。有些堆积,甚至比我的线程更糟糕。

但是,我们必须等待那个带着圣杯 的人走到前台。

我们等待。