交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2023.08.02 14:47 #31651

СанСаныч Фоменко #:

你真烦人，大师！我不知道，但你知道--看看你的市场！

除了对周围世界的痛苦感知和对包装的神圣信仰，你还剩下什么吗？)

每天我都能读到你一无所知的包裹。

还是土拨鼠日？

mytarmailS 2023.08.02 14:57 #31652

Forester #:

是时候结束这项试图从随机数据中找出规律的史诗般的努力了。

是啊

或者说，是时候停止惯性思维，冷静看待结果了。

Maxim Dmitrievsky 2023.08.02 15:40 #31653

Forester #:

通过胸衣学习的结果往往不差

从第 10 年到第 21 年，找到束腰的比例为 30%（该网站 30% 的随机历史记录参与了学习），其他年份一般都是纯 OOS。

在终端中是这样的

Maxim Dmitrievsky 2023.08.02 15:50 #31654

确定核心集的方法有很多。下面是一些最常用的方法：

随机子集： 从原始数据集中随机选择一个点子集。这是最简单的获取核心集的方法，但并不总能提供最好的质量。
参考点： 从原始数据集中选择对机器学习算法的预测影响较大的点。与随机子集相比，这是一种更有效的获取核心集的方法，但可能更加复杂。
聚类： 根据原始数据集中各点的相似性对其进行分组。从每组中选择一个点作为核心集。这是一种高效的方法，可以获得很好地代表原始数据集的核心集，但可能会更加复杂。
测血核： 使用测血核从源数据集中选取点。这是一种获取核心集的强大方法，可用于提高机器学习算法的质量。
扩展随机子集： 这种方法从原始数据集中随机选取点，但以更高的概率选取对机器学习算法预测影响较大的点。这是一种获取核心集的有效方法，可提供良好的质量，并可用于各种机器学习任务。

需要注意的是，并不存在适用于所有机器学习任务的通用核心集获取方法。选择何种方法获取核心集取决于具体任务和可用的计算资源。

*巴德

Forester 2023.08.02 18:31 #31655

Maxim Dmitrievsky #:

通过紧身胸衣学习的效果往往不错

从第 10 年到第 21 年，发现束衣的比例为 30%（该网站 30%的随机历史记录参与了学习），其余年份一般都是纯 OOS

在终端中是这样的

嗯，也有持续六个月到一年的缩水期。您准备好了吗？尤其是在实际启动时立即开始缩水的情况下？

Ivan Butko 2023.08.02 20:09 #31656

Forester #:

嗯，也有持续六个月到一年的缩水期。你准备好了吗？尤其是当您开始真正投资时，缩水就会立即开始？

通常要分散投资。

这些图在其他工具上也能获利。如果所有这些工具的总体趋势都与上图相同，就能保证投资的稳定性。

您只需创建一个能创造最大恢复因素的工具组合。

Maxim Dmitrievsky 2023.08.02 20:09 #31657

Forester #:

嗯，也有持续六个月到一年的缩水期。你准备好了吗？尤其是当您开始真正投资时，缩水就会立即开始？

我还没准备好赌 20 年：）这更像是一个案例研究。

我可以接受 10 年的培训 - 1 年的 OOS，没问题。

但有很多噪音，有时模型会把几乎所有样本都当作无用样本扔掉，只剩下 3 笔交易。

还有一些历史数据从未被正常预测过。

总之，这不是一项很有意义的活动。

这就像转动老式接收器，一不小心就会碰到一些带噪声的波浪。

mytarmailS 2023.08.04 09:17 #31658

我再一次确信，预测需要一个模型。

模型可以去除不必要的（噪音），留下必要的（信号），如果可能的话，还可以放大必要的（信号），而且模型更具有确定性，在模式.... 中具有更高的可重复性。

举个例子。

高-低 minutka 价格。

然后，我们对价格进行最简单的简化（创建模型）。

然后，我们借助已知的简单降维算法去除多余部分（改进模型），这样模型的重复性就更高了。

最后也许是点缀。

我想知道如何在这样的数据上训练 MO？

这是一个测试样本。

Confusion Matrix and Statistics

          Reference
Prediction    -1     1
        -1 24130  2780
        1   4478 23613
                                          
               Accuracy : 0.868           
                 95% CI : (0.8652, 0.8709)
    No Information Rate : 0.5201          
    P-Value [Acc > NIR] : < 2.2e-16       
                                          
                  Kappa : 0.7363          
                                          
 Mcnemar's Test P-Value : < 2.2e-16       
                                          
            Sensitivity : 0.8435          
            Specificity : 0.8947          
         Pos Pred Value : 0.8967          
         Neg Pred Value : 0.8406          
             Prevalence : 0.5201          
         Detection Rate : 0.4387          
   Detection Prevalence : 0.4893          
      Balanced Accuracy : 0.8691          
                                          
       'Positive' Class : -1

你以前见过这样的数据吗？

Vladimir Perervenko 2023.08.04 10:34 #31659

СанСаныч Фоменко #:

具体叫什么名字？还是自制的？

我使用各种 "木制 "模型多年，从未见过这样的模型。

什么叫自制？有一个理论依据，一篇好文章。有个软件包叫 RLTv3.2.6，效果不错。你应该注意一下版本。

关于 Python 中的木质模型 ONNX。参见软件包skl2onnx。

支持的 scikit-learn 模型。最后支持的选项集是 15。

祝好运

skl2onnx

2023.05.09
pypi.org

Convert scikit-learn models to ONNX

Maxim Dmitrievsky 2023.08.04 10:48 #31660

而自作主张、自作主张的主要是布雷曼，因为他没有用R语言写作。他真是个黑客。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3166