交易中的机器学习：理论、模型、实践和算法交易

JeeyCi 2022.09.17 05:58 #27481

elibrarius #:

弗拉基米尔的文章也有 10%-20%左右的误差，但平衡线并不乐观。

这可能还取决于培训.... "a-post "的解释。

mytarmailS 2022.09.17 05:59 #27482

Maxim Dmitrievsky #:

在上一篇中补充

#299

有人删除了我发布视频的帖子......我不知道怎么会这样。

Maxim Dmitrievsky 2022.09.17 06:04 #27483

mytarmailS #:

有人删除了我发布视频的帖子......我不知道怎么会这样。

好吧，好吧，好吧，我猜你炫耀了很多。

这里有一个关于木制模型的。

#4469

#4467

关于猫扑搜索？谁发起了这个主题

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Продолжаю переобучать каждую неделю

2017.07.12
www.mql5.com

Самое интересное что я не понимаю почему он открывает сделки туда или обратно. экспериментирую с предикторами и разными способами открытия поз. тем более что оно копирует механизм работы настоящих нейронов очень примитивно и не так как на самом деле это происходит в мозгу Единственное из НС что нормально работает и перспективно это сверточные нс для распознавания всяких образов

mytarmailS 2022.09.17 06:10 #27484

Maxim Dmitrievsky #:

好吧，好吧，好吧，你一定炫耀了很多。

这里是木制模型

#4469

#4467

关于 catbusters 搜索？😄谁发起了这个主题

听着，"木头 "根本不是争论的焦点...国防部 95% 的教程都是从木头开始的，这是初学者最先了解的东西，你并不负责它。

Maxim Dmitrievsky 2022.09.17 06:12 #27485

mytarmailS #:

听着，木头根本就不是理由......国防部 95% 的教程都是从木头开始的，初学者都是先学木头，这不是你的错。

这里以前主要是用 NS，我想知道为什么不是用树。我做了测试，结果发现树木也不差。我以前没有在这里看到过这样的信息，否则我也不会问这个问题。

后来我改用 bousting，找到了 katbust 库，并开始在这里复制它。

JeeyCi 2022.09.17 06:23 #27486

Maxim Dmitrievsky #:

以前在这里讨论的主要是 NS，我想知道为什么不是树。我做了测试，结果发现它们并不差。我以前没有在这里看到过这样的信息，否则我也不会问这个问题。

顺便说一句，树可以作为聚类和 FS 的替代品--"二合一"。

Maxim Dmitrievsky#�

然后我改用了 bousting，找到了 katbust 库，并开始在这里复制它

关于算法：它在数学上提供了另一个二阶导数（或残差平均--统计学上）--但它对你个人的训练有什么帮助，在什么情况下？......除了商业广告中的标准陈词滥调 "catboost 会给出更好、更准确的结果 "之外，....因为点精度并不总是很重要，有时模型的生成能力可能更重要。

Maxim Dmitrievsky 2022.09.17 06:28 #27487

JeeyCi #:

顺便说一句，树可以作为聚类和 FS 的替代品。

关于算法：它在数学上提供了另一种二阶导数（或统计上的残差平均）--但它对训练有什么帮助，在什么情况下？因为并不是每个点的精度都很重要，有时模型的生成能力可能更重要？

因果推断也有木质模型，但还没来得及弄清楚

提升模型可以减少偏差和方差，而森林模型只能减少方差。它的优势已经得到证实，你可以谷歌一下。而且这个库本身就是开发出来的，使用起来很方便。

至于生成式，目前还不太清楚，也许有时它们更重要。但是，如果我们谈论的是生成合成数据，NS 生成式在 Forex 上效果并不好。

Forest Based Estimators — econml 0.13.1 documentation

econml.azurewebsites.net

Orthogonal Random Forests are a combination of causal forests and double machine learning that allow for controlling for a high-dimensional set of confounders , while at the same time estimating non-parametrically the heterogeneous treatment effect , on a lower dimensional set of variables . Moreover, the estimates are asymptotically normal and...

JeeyCi 2022.09.17 06:34 #27488

Maxim Dmitrievsky #:

如果我们说的是生成合成数据的话。

不 - 这是关于概括......是的，错了，表示....对不起。

我认为是为了区分 "有风险 "和 "无风险 "的环境 -- 我还在考虑如何概括这种划分......都是我自己的想法（无意中在论坛上看到的）...

感谢您的回复！

Maxim Dmitrievsky 2022.09.17 06:38 #27489

JeeyCi #:

不是 - 是以偏概全.....是的，错了，快讯....对不起

我认为是为了区分风险上/风险下的环境 -- 还在考虑如何概括这种划分...都是我自己的想法（无意中在论坛上看到的）...

感谢您的回复！

试试吧，catbusta 有很多不同的功能，我很喜欢。

基于验证样本的误差，预训练可以提前停止。泛化效果并不比 NS 差，NS 还需要编写自己的函数来停止学习。

而且它的学习速度很快，无需等待数小时。

mytarmailS 2022.09.17 06:52 #27490

随机森林能否在一串数据中找出最大值，即模拟函数 mach() ？

我只是想知道，MO 能否模拟 JA 中的原始函数？

有一个矩阵，矩阵的每一行都是一个训练示例。

head(X)
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    1    3    1
[2,]    3    1    4    5    3
[3,]    1    2    4    4    1
[4,]    1    1    5    3    5
[5,]    3    4    1    3    3
[6,]    4    4    5    1    2

我们需要找出每一行的最大值，样本大小为 20k 行。

通过回归解决问题

 pred actual
1  4.967619      5
2  4.996474      5
3  4.127626      4
4  4.887233      5
5  5.000000      5
6  4.881568      5
7  4.028334      4
8  4.992406      5
9  3.974674      4
10 4.899804      5
11 4.992406      5

四舍五入以求清晰

 pred actual
1     5      5
2     5      5
3     4      4
4     5      5
5     5      5
6     5      5
7     4      4
8     5      5
9     4      4
10    5      5
11    5      5

相当不错，在 50 行新线路的测试中只有几处错误

但矩阵 X 中的数据非常简单，从 1 到 5 只有 5 个唯一值，只有 5 列，但已经出现了错误。

不过我认为，如果我们进行分类，就不会出现错误，您可以顺便检查一下。

嗯，是的，没错，但如果我们要寻找数据中的最大值，那么分类就不合适了，因为值的散布可能是巨大的....。

所以，让我们回到回归法，把数据复杂化。

head(X)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  0.93 -2.37 -0.35  0.16 -0.11
[2,] -0.53  0.19 -0.42  1.35 -0.16
[3,]  1.81  0.19 -0.68  0.31 -0.05
[4,]  0.08 -1.43  0.15 -0.96  0.43
[5,]  0.40  1.36  1.17 -0.99 -0.18
[6,] -2.19 -0.65  0.42 -1.12  1.46

我们会得到这样的结果。

  pred actual
1   1.75   1.78
2   1.33   1.31
3   1.67   1.69
4   1.15   1.16
5   0.51   0.41
6   1.00   0.99
7   0.80   0.78
8   1.75   1.76
9   0.35   0.36
10  1.78   1.79
11  2.02   2.13
12  1.26   1.21
13  1.60   1.57
14  0.19   0.06

原则上这并不坏，但常用的函数 mach() 可以做得更好，而且可以取代所有这些模型....

顺便说一下，我想知道其他模型将如何工作，它们是否能够在不出错的情况下创建mach() 函数

交易中的机器学习：理论、模型、实践和算法交易 - 页 2749