交易中的机器学习:理论、模型、实践和算法交易 - 页 3282

 
Aleksey Vyazmikin #:

我从 2010 年到 2023 年抽取了一个样本(4.7 万行),按时间顺序分成 3 部分,并决定看看如果我们交换这些部分会发生什么。

子样本的大小为:训练 - 60%,测试 - 20%,考试 - 20%。

我做了这些组合(-1)--这是标准顺序--时间顺序。每个子样本都有自己的颜色。


对每组样本使用不同的 Seed 训练了 101 个模型,结果如下


所有指标都是标准的,可以看出,很难确定模型的平均利润(AVR 利润),以及在未参与训练的最后一个样本上利润超过 3000 点的模型的百分比。

也许应该减少训练样本中 -1 和 0 变体的相对成功率?总的来说,Recall 似乎对此有所反应。

您认为,在我们的情况下,这种组合的结果是否应该具有可比性?还是说数据已经无法挽回地过时了?

另一个自己动手做的...

有交叉验证,一切都经过咀嚼和咀嚼......,广泛使用....

 
СанСаныч Фоменко #:

另一个自制的...

交叉验证,事事咀嚼......,广泛应用.....

这就是问题所在,交叉验证在这里可能无法有效发挥作用。

那么这种自我设计又有什么意义呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验表明了这一谬误。或者说,一切都是个别的,验证可能会发现整个样本中存在随机的模式或现象。

 
Aleksey Vyazmikin #:

这就是问题所在,交叉验证在这里可能无法有效发挥作用。

自我交易又在哪里呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验显示了这一谬误。或者说,一切都是个别的,验证可能会揭示整个样本的随机模式或发生情况。

不要把箭头移到马克西姆身上,尤其是当他没有做甚至没有想过任何建议的事情时。

 
Maxim Dmitrievsky #:

你不应该和马克西姆翻脸,尤其是他并没有做你建议的任何事情。

他没做是什么意思?你不是已经在用最近的历史训练模型了吗?

 
fxsaber #:

当没有矩阵可以处理它时。

在一个 10M 的字符串中找到长度为 30K 的相似字符串需要 3 秒钟。

这并不是计算所有可能的相关模式,而是将源数据与其他数据进行比较。你不需要矩阵,只需要一个向量。

 
Aleksey Vyazmikin #:

什么叫我没有?你不是已经根据最近的历史对模型进行了训练吗?

我不记得是谁先发现的了某个书呆子对我来说无所谓

 
Maxim Dmitrievsky #:

我不记得是谁先挑起的。这对我来说并不重要。

你的情况和我的有什么不同?

 
Aleksey Vyazmikin #:

你的情况与我的有何不同?

因为我不喜欢与文盲诡辩家和心理学家交流 )

这种人不会产生有用的内容

 
Maxim Dmitrievsky #:

因为我不喜欢与文盲诡辩家和心理学家交谈 )

这种人不会产生有用的内容

你的 "爱 "会以某种神奇的方式影响数据吗?

 
Maxim Dmitrievsky #:

这并不是在计算所有可能的相关模式,而是将源数据与其他数据进行比较。这里不需要矩阵,一个向量就足够了。

这是逐行计算矩阵的核心。