交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2023.10.06 09:34 #32841

Maxim Dmitrievsky #:
继续量化 😵‍💫

终于有了一些合理的建议！

Aleksey Vyazmikin 2023.10.06 09:49 #32842

Aleksey Vyazmikin #:

结果如下--最后两列

结果确实有所改善。我们可以假设，样本越多，训练结果就越好。

我们有必要尝试对训练样本的 1 部分和 2 部分进行训练，如果结果不会比 2 部分和 3 部分差很多，那么样本新鲜度的因素就可以被认为没有样本量那么重要。

好了，训练已经完成，结果如下表所示--最后两列。

我们可以初步得出结论，训练的成功与否确实取决于样本的大小。不过，我注意到"-1p1-2 "样本的结果与"-1p2-3"样本相当，甚至在某些标准上更好，而 "0p1-2 "样本的结果在符合给定标准的模型数量上是"-1p2-3 "样本的两倍。

现在，我运行了一个时间顺序颠倒的样本，其中 train 样本由初始考试+测试+train_p3 样本组成，测试样本为train_p2，考试样本为 train_p1。这样做的目的是想看看是否有可能在较新的数据上建立一个 10 年前就能成功的模型。

您认为结果会如何？

СанСаныч Фоменко 2023.10.06 11:09 #32843

Aleksey Vyazmikin #:

好了，培训结束了，结果见下表最后两栏。

我们可以初步得出结论，训练的成功与否确实取决于样本的大小。 不过，我注意到"-1p1-2 "样本的结果与"-1p2-3"样本不相上下，在某些标准下甚至更好，而 "0p1-2 "样本的结果在符合给定标准的模型数量上要差一倍。

现在，我运行了一个时间顺序颠倒的样本，其中 train 样本由初始考试+测试+train_p3 样本组成，测试样本为train_p2，考试样本为 train_p1。这样做的目的是想看看是否有可能在较新的数据上建立一个 10 年前就能成功的模型。

您认为结果会如何？

再多一点点，就会得到最微不足道的结果......也可能不会得到，但会有颠覆 ME 世界的发现！

该走了！

mytarmailS 2023.10.06 11:10 #32844

СанСаныч Фоменко #:

我曾多次写过关于 "预测因子的预测能力 "的文章。

我发现了一个计算距离的工具列表：

除了标准工具外，它还有自己的距离集

不错的构建

Maxim Dmitrievsky 2023.10.06 11:19 #32845

这是一项没有输入的任务：...

您认为结果会是什么？😀

就像之前一样：这里是没有特征的特征值.....

然后他会写道：没有人猜到，结果是这样的😁😁😁😁🥳

Andrey Dik 2023.10.06 11:51 #32846

Maxim Dmitrievsky #:
这是一项没有输入的任务：...

您认为结果会是什么？😀

就像之前一样：这里是没有特征的特征值.....

然后他会写道：没有人猜到，结果是这样的😁😁😁😁🥳

马克斯，我不明白你为什么要取笑我。

如果没有假设--就不要说，如果有假设--就说出来，比如 "结果会很糟糕"。

Andrey Dik 2023.10.06 11:51 #32847

Aleksey Vyazmikin #:
...

你认为结果会怎样？

我不知道，但我很想知道。

Aleksey Vyazmikin 2023.10.06 12:03 #32848

СанСаныч Фоменко #:

只要再多一点点，就会得到一个微不足道的结果......或许不会，但会有一个颠覆 ME 世界的发现！

该走了！

那么，你认为前两列的模型数量会有可比性吗？尽管它们相差两倍。请更具体地说明琐碎性。

Maxim Dmitrievsky 2023.10.06 12:06 #32849

Andrey Dik #:

麦克斯，我不明白你为什么要取笑我。

如果没有假设，那就什么都别说；如果有假设，那就说出来，比如 "结果会很糟糕"。

我上面写的是 matstat。在此之前，我写过关于 kozul 的文章。甚至在此之前，我还写过关于 Oracle 错误（标记错误）的文章，当数据以一种你无法理解的方式标记出来时。从这些文章中，我们可以清楚地认识到，在不同的大块数据和不同长度的训练中，结果会有所不同。这取决于没有提供或描述的数据。

标记错误会影响结果和时间段。哪只鸡用哪只爪子做标记，就会得出哪只鸡的结果。

这里的人喜欢谈论学习的基本支柱：预处理、量化、判定者与目标的关系....。但是，他们并没有写到用哪只爪子做标记，左爪还是右爪。这比上述所有内容都更重要。

Andrey Dik 2023.10.06 12:22 #32850

Maxim Dmitrievsky #:
上面我写了 matstat。在此之前，我写过关于 kozul 的文章。更早之前，我还写过关于 Oracle 错误（标记错误）的文章，即当数据以一种你无法理解的方式标记时。从这些文章中，我们可以清楚地认识到，在不同的大块数据和不同长度的训练中，结果会有所不同。这取决于没有提供或描述的数据。

标记错误会影响结果和时间段。哪只鸡用哪只爪子做标记，就会得出哪只鸡的结果。

这里的人喜欢谈论训练、预处理、判定器与目标的关系等基本支柱....。但他们并没有提到用哪只爪子做标记，左爪还是右爪。这比上述所有内容都更重要。

好吧，这听起来已经像是专业人士的观点了（对错是另一个问题）。

也没必要取笑。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3285