交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2023.10.04 13:29 #32811

Aleksey Vyazmikin #:

我从 2010 年到 2023 年抽取了一个样本（4.7 万行），按时间顺序分成 3 部分，并决定看看如果我们交换这些部分会发生什么。

子样本的大小为：训练 - 60%，测试 - 20%，考试 - 20%。

我做了这些组合（-1）--这是标准顺序--时间顺序。每个子样本都有自己的颜色。

对每组样本使用不同的 Seed 训练了 101 个模型，结果如下

所有指标都是标准的，可以看出，很难确定模型的平均利润（AVR 利润），以及在未参与训练的最后一个样本上利润超过 3000 点的模型的百分比。

也许应该减少训练样本中 -1 和 0 变体的相对成功率？总的来说，Recall 似乎对此有所反应。

您认为，在我们的情况下，这种组合的结果是否应该具有可比性？还是说数据已经无法挽回地过时了？

另一个自己动手做的...

有交叉验证，一切都经过咀嚼和咀嚼......，广泛使用....

Aleksey Vyazmikin 2023.10.04 13:42 #32812

СанСаныч Фоменко #:

另一个自制的...

交叉验证，事事咀嚼......，广泛应用.....

这就是问题所在，交叉验证在这里可能无法有效发挥作用。

那么这种自我设计又有什么意义呢？马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验表明了这一谬误。或者说，一切都是个别的，验证可能会发现整个样本中存在随机的模式或现象。

Maxim Dmitrievsky 2023.10.04 14:09 #32813

Aleksey Vyazmikin #:

这就是问题所在，交叉验证在这里可能无法有效发挥作用。

自我交易又在哪里呢？马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验显示了这一谬误。或者说，一切都是个别的，验证可能会揭示整个样本的随机模式或发生情况。

不要把箭头移到马克西姆身上，尤其是当他没有做甚至没有想过任何建议的事情时。

Aleksey Vyazmikin 2023.10.04 14:12 #32814

Maxim Dmitrievsky #:

你不应该和马克西姆翻脸，尤其是他并没有做你建议的任何事情。

他没做是什么意思？你不是已经在用最近的历史训练模型了吗？

Maxim Dmitrievsky 2023.10.04 14:15 #32815

fxsaber #:

当没有矩阵可以处理它时。

在一个 10M 的字符串中找到长度为 30K 的相似字符串需要 3 秒钟。

这并不是计算所有可能的相关模式，而是将源数据与其他数据进行比较。你不需要矩阵，只需要一个向量。

Maxim Dmitrievsky 2023.10.04 14:16 #32816

Aleksey Vyazmikin #:

什么叫我没有？你不是已经根据最近的历史对模型进行了训练吗？

我不记得是谁先发现的了某个书呆子对我来说无所谓

Aleksey Vyazmikin 2023.10.04 14:17 #32817

Maxim Dmitrievsky #:

我不记得是谁先挑起的。这对我来说并不重要。

你的情况和我的有什么不同？

Maxim Dmitrievsky 2023.10.04 14:19 #32818

Aleksey Vyazmikin #:

你的情况与我的有何不同？

因为我不喜欢与文盲诡辩家和心理学家交流 )

这种人不会产生有用的内容

Aleksey Vyazmikin 2023.10.04 14:29 #32819

Maxim Dmitrievsky #:

因为我不喜欢与文盲诡辩家和心理学家交谈 )

这种人不会产生有用的内容

你的 "爱 "会以某种神奇的方式影响数据吗？

fxsaber 2023.10.04 14:39 #32820

Maxim Dmitrievsky #:

这并不是在计算所有可能的相关模式，而是将源数据与其他数据进行比较。这里不需要矩阵，一个向量就足够了。

这是逐行计算矩阵的核心。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3282