交易中的机器学习:理论、模型、实践和算法交易 - 页 3285

 
Maxim Dmitrievsky #:
继续量化 😵‍💫

终于有了一些合理的建议!

 
Aleksey Vyazmikin #:

结果如下--最后两列

结果确实有所改善。我们可以假设,样本越多,训练结果就越好。

我们有必要尝试对训练样本的 1 部分和 2 部分进行训练,如果结果不会比 2 部分和 3 部分差很多,那么样本新鲜度的因素就可以被认为没有样本量那么重要。

好了,训练已经完成,结果如下表所示--最后两列。


我们可以初步得出结论,训练的成功与否确实取决于样本的大小。不过,我注意到"-1p1-2 "样本的结果与"-1p2-3"样本相当,甚至在某些标准上更好,而 "0p1-2 "样本的结果在符合给定标准的模型数量上是"-1p2-3 "样本的两倍。

现在,我运行了一个时间顺序颠倒的样本,其中 train 样本由初始考试+测试+train_p3 样本组成,测试样本为train_p2,考试样本为 train_p1 这样做的目的是想看看是否有可能在较新的数据上建立一个 10 年前就能成功的模型。

您认为结果会如何?

 
Aleksey Vyazmikin #:

好了,培训结束了,结果见下表最后两栏。


我们可以初步得出结论,训练的成功与否确实取决于样本的大小。 不过,我注意到"-1p1-2 "样本的结果与"-1p2-3"样本不相上下,在某些标准下甚至更好,而 "0p1-2 "样本的结果在符合给定标准的模型数量上要差一倍。

现在,我运行了一个时间顺序颠倒的样本,其中 train 样本由初始考试+测试+train_p3 样本组成,测试样本为train_p2,考试样本为 train_p1 这样做的目的是想看看是否有可能在较新的数据上建立一个 10 年前就能成功的模型。

您认为结果会如何?

再多一点点,就会得到最微不足道的结果......也可能不会得到,但会有颠覆 ME 世界的发现!

该走了!

 
СанСаныч Фоменко #:

我曾多次写过关于 "预测因子的预测能力 "的文章。

我发现了一个计算距离的工具列表:

除了标准工具外,它还有自己的距离集

不错的构建
 
这是一项没有输入的任务:...
您认为结果会是什么?😀

就像之前一样:这里是没有特征的特征值.....

然后他会写道:没有人猜到,结果是这样的😁😁😁😁🥳
 
Maxim Dmitrievsky #:
这是一项没有输入的任务:...
您认为结果会是什么?😀

就像之前一样:这里是没有特征的特征值.....

然后他会写道:没有人猜到,结果是这样的😁😁😁😁🥳

马克斯,我不明白你为什么要取笑我。

如果没有假设--就不要说,如果有假设--就说出来,比如 "结果会很糟糕"。

 
Aleksey Vyazmikin #:
...

你认为结果会怎样?

我不知道,但我很想知道。

 
СанСаныч Фоменко #:

只要再多一点点,就会得到一个微不足道的结果......或许不会,但会有一个颠覆 ME 世界的发现!

该走了!

那么,你认为前两列的模型数量会有可比性吗?尽管它们相差两倍。请更具体地说明琐碎性。

 
Andrey Dik #:

麦克斯,我不明白你为什么要取笑我。

如果没有假设,那就什么都别说;如果有假设,那就说出来,比如 "结果会很糟糕"。

我上面写的是 matstat。在此之前,我写过关于 kozul 的文章。甚至在此之前,我还写过关于 Oracle 错误(标记错误)的文章,当数据以一种你无法理解的方式标记出来时。从这些文章中,我们可以清楚地认识到,在不同的大块数据和不同长度的训练中,结果会有所不同。这取决于没有提供或描述的数据。
标记错误会影响结果和时间段。哪只鸡用哪只爪子做标记,就会得出哪只鸡的结果。

这里的人喜欢谈论学习的基本支柱:预处理、量化、判定者与目标的关系....。但是,他们并没有写到用哪只爪子做标记,左爪还是右爪。这比上述所有内容都更重要。
 
Maxim Dmitrievsky #:
上面我写了 matstat。在此之前,我写过关于 kozul 的文章。更早之前,我还写过关于 Oracle 错误(标记错误)的文章,即当数据以一种你无法理解的方式标记时。从这些文章中,我们可以清楚地认识到,在不同的大块数据和不同长度的训练中,结果会有所不同。这取决于没有提供或描述的数据。
标记错误会影响结果和时间段。哪只鸡用哪只爪子做标记,就会得出哪只鸡的结果。

这里的人喜欢谈论训练、预处理、判定器与目标的关系等基本支柱....。但他们并没有提到用哪只爪子做标记,左爪还是右爪。这比上述所有内容都更重要。

好吧,这听起来已经像是专业人士的观点了(对错是另一个问题)。
也没必要取笑。