交易中的机器学习:理论、模型、实践和算法交易 - 页 3166

 
СанСаныч Фоменко #:

你真烦人,大师!我不知道,但你知道--看看你的市场!

除了对周围世界的痛苦感知和对包装的神圣信仰,你还剩下什么吗?)

每天我都能读到你一无所知的包裹。

还是土拨鼠日?
 
Forester #:

是时候结束这项试图从随机数据中找出规律的史诗般的努力了。

是啊

或者说,是时候停止惯性思维,冷静看待结果了。

 
Forester #:

通过胸衣学习的结果往往不差

从第 10 年到第 21 年,找到束腰的比例为 30%(该网站 30% 的随机历史记录参与了学习),其他年份一般都是纯 OOS。

在终端中是这样的


 

确定核心集的方法有很多。下面是一些最常用的方法:

  • 随机子集: 从原始数据集中随机选择一个点子集。这是最简单的获取核心集的方法,但并不总能提供最好的质量。
  • 参考点: 从原始数据集中 选择 对机器学习算法的预测影响较大的点。与随机子集相比,这是一种更有效的获取核心集的方法,但可能更加复杂。
  • 聚类: 根据原始数据集中各点的相似性对其进行 分组 。从每组中选择一个点作为核心集。这是一种高效的方法,可以获得很好地代表原始数据集的核心集,但可能会更加复杂。
  • 测血核: 使用测血核从源数据集中 选取 点。这是一种获取核心集的强大方法,可用于提高机器学习算法的质量。
  • 扩展随机子集: 这种 方法从原始数据集中随机选取点,但以更高的概率选取对机器学习算法预测影响较大的点。这是一种获取核心集的有效方法,可提供良好的质量,并可用于各种机器学习任务。

需要注意的是,并不存在适用于所有机器学习任务的通用核心集获取方法。选择何种方法获取核心集取决于具体任务和可用的计算资源。

*巴德

 
Maxim Dmitrievsky #:

通过紧身胸衣学习的效果往往不错

从第 10 年到第 21 年,发现束衣的比例为 30%(该网站 30%的随机历史记录参与了学习),其余年份一般都是纯 OOS

在终端中是这样的


嗯,也有持续六个月到一年的缩水期。您准备好了吗?尤其是在实际启动时立即开始缩水的情况下?

 
Forester #:

嗯,也有持续六个月到一年的缩水期。你准备好了吗?尤其是当您开始真正投资时,缩水就会立即开始?

通常要分散投资。

这些图在其他工具上也能获利。如果所有这些工具的总体趋势都与上图相同,就能保证投资的稳定性。

您只需创建一个能创造最大恢复因素的工具组合。
 
Forester #:

嗯,也有持续六个月到一年的缩水期。你准备好了吗?尤其是当您开始真正投资时,缩水就会立即开始?

我还没准备好赌 20 年:)这更像是一个案例研究。

我可以接受 10 年的培训 - 1 年的 OOS,没问题。

但有很多噪音,有时模型会把几乎所有样本都当作无用样本扔掉,只剩下 3 笔交易。

还有一些历史数据从未被正常预测过。

总之,这不是一项很有意义的活动。

这就像转动老式接收器,一不小心就会碰到一些带噪声的波浪。

 

我再一次确信,预测需要一个模型。

模型可以去除不必要的(噪音),留下必要的(信号),如果可能的话,还可以放大必要的(信号),而且模型更具有确定性,在模式.... 中具有更高的可重复性。

举个例子。

高-低 minutka 价格。


然后,我们对价格进行最简单的简化(创建模型)。

然后,我们借助已知的简单降维 算法去除多余部分(改进模型),这样模型的重复性就更高了。

最后也许是点缀。


我想知道如何在这样的数据上训练 MO?

这是一个测试样本。

Confusion Matrix and Statistics

          Reference
Prediction    -1     1
        -1 24130  2780
        1   4478 23613
                                          
               Accuracy : 0.868           
                 95% CI : (0.8652, 0.8709)
    No Information Rate : 0.5201          
    P-Value [Acc > NIR] : < 2.2e-16       
                                          
                  Kappa : 0.7363          
                                          
 Mcnemar's Test P-Value : < 2.2e-16       
                                          
            Sensitivity : 0.8435          
            Specificity : 0.8947          
         Pos Pred Value : 0.8967          
         Neg Pred Value : 0.8406          
             Prevalence : 0.5201          
         Detection Rate : 0.4387          
   Detection Prevalence : 0.4893          
      Balanced Accuracy : 0.8691          
                                          
       'Positive' Class : -1  

你以前见过这样的数据吗?




 
СанСаныч Фоменко #:

具体叫什么名字?还是自制的?

我使用各种 "木制 "模型多年,从未见过这样的模型。

什么叫自制?有一个理论依据,一篇好文章。有个软件包叫 RLTv3.2.6,效果不错。你应该注意一下版本。

关于 Python 中的木质模型 ONNX。参见软件包skl2onnx

支持的 scikit-learn 模型 最后支持的选项集是 15。

祝好运

skl2onnx
  • 2023.05.09
  • pypi.org
Convert scikit-learn models to ONNX
 
而自作主张、自作主张的主要是布雷曼,因为他没有用R语言写作。他真是个黑客。