交易中的机器学习:理论、模型、实践和算法交易 - 页 2749

 
elibrarius #:

弗拉基米尔的文章 也有 10%-20%左右的误差,但平衡线并不乐观。

这可能还取决于培训.... "a-post "的解释。

 
Maxim Dmitrievsky #:

在上一篇中补充

#299

有人删除了我发布视频的帖子......我不知道怎么会这样。

 
mytarmailS #:

有人删除了我发布视频的帖子......我不知道怎么会这样。

好吧,好吧,好吧,我猜你炫耀了很多。

这里有一个关于木制模型的。

#4469

#4467

关于猫扑搜索?谁发起了这个主题

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Продолжаю переобучать каждую неделю
Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Продолжаю переобучать каждую неделю
  • 2017.07.12
  • www.mql5.com
Самое интересное что я не понимаю почему он открывает сделки туда или обратно. экспериментирую с предикторами и разными способами открытия поз. тем более что оно копирует механизм работы настоящих нейронов очень примитивно и не так как на самом деле это происходит в мозгу Единственное из НС что нормально работает и перспективно это сверточные нс для распознавания всяких образов
 
Maxim Dmitrievsky #:

好吧,好吧,好吧,你一定炫耀了很多。

这里是木制模型

#4469

#4467

关于 catbusters 搜索?😄谁发起了这个主题

听着,"木头 "根本不是争论的焦点...国防部 95% 的教程都是从木头开始的,这是初学者最先了解的东西,你并不负责它。

 
mytarmailS #:

听着,木头根本就不是理由......国防部 95% 的教程都是从木头开始的,初学者都是先学木头,这不是你的错。

这里以前主要是用 NS,我想知道为什么不是用树。我做了测试,结果发现树木也不差。我以前没有在这里看到过这样的信息,否则我也不会问这个问题。

后来我改用 bousting,找到了 katbust 库,并开始在这里复制它。

 
Maxim Dmitrievsky #:

以前在这里讨论的主要是 NS,我想知道为什么不是树。我做了测试,结果发现它们并不差。我以前没有在这里看到过这样的信息,否则我也不会问这个问题。

顺便说一句,树可以作为聚类和 FS 的替代品--"二合一"。

Maxim Dmitrievsky#�

然后我改用了 bousting,找到了 katbust 库,并开始在这里复制它

关于算法:它在数学上提供了另一个二阶导数(或残差平均--统计学上)--但它对你个人的训练有什么帮助,在什么情况下?......除了商业广告中的标准陈词滥调 "catboost 会给出更好、更准确的结果 "之外,....因为点精度并不总是很重要,有时模型的生成能力可能更重要。
 
JeeyCi #:

顺便说一句,树可以作为聚类和 FS 的替代品。

关于算法:它在数学上提供了另一种二阶导数(或统计上的残差平均)--但它对训练有什么帮助,在什么情况下?因为并不是每个点的精度都很重要,有时模型的生成能力可能更重要?

因果推断 也有木质模型,但还没来得及弄清楚

提升模型可以减少偏差和方差,而森林模型只能减少方差。它的优势已经得到证实,你可以谷歌一下。而且这个库本身就是开发出来的,使用起来很方便。

至于生成式,目前还不太清楚,也许有时它们更重要。但是,如果我们谈论的是生成合成数据,NS 生成式在 Forex 上效果并不好。

Forest Based Estimators — econml 0.13.1 documentation
  • econml.azurewebsites.net
Orthogonal Random Forests are a combination of causal forests and double machine learning that allow for controlling for a high-dimensional set of confounders , while at the same time estimating non-parametrically the heterogeneous treatment effect , on a lower dimensional set of variables . Moreover, the estimates are asymptotically normal and...
 
Maxim Dmitrievsky #:

如果我们说的是生成合成数据的话。

不 - 这是关于概括......是的,错了,表示....对不起。

我认为是为了区分 "有风险 "和 "无风险 "的环境 -- 我还在考虑如何概括这种划分......都是我自己的想法(无意中在论坛上看到的)...

感谢您的回复!

 
JeeyCi #:

不是 - 是以偏概全.....是的,错了,快讯....对不起

我认为是为了区分风险上/风险下的环境 -- 还在考虑如何概括这种划分...都是我自己的想法(无意中在论坛上看到的)...

感谢您的回复!

试试吧,catbusta 有很多不同的功能,我很喜欢。

基于验证样本的误差,预训练可以提前停止。泛化效果并不比 NS 差,NS 还需要编写自己的函数来停止学习。

而且它的学习速度很快,无需等待数小时。

 
随机森林 能否在一串数据中找出最大值,即模拟函数 mach() ?

我只是想知道,MO 能否模拟 JA 中的原始函数?

有一个矩阵,矩阵的每一行都是一个训练示例。

head(X)
     [,1] [,2] [,3] [,4] [,5]
[1,]    2    4    1    3    1
[2,]    3    1    4    5    3
[3,]    1    2    4    4    1
[4,]    1    1    5    3    5
[5,]    3    4    1    3    3
[6,]    4    4    5    1    2

我们需要找出每一行的最大值,样本大小为 20k 行。


通过回归解决问题

 pred actual
1  4.967619      5
2  4.996474      5
3  4.127626      4
4  4.887233      5
5  5.000000      5
6  4.881568      5
7  4.028334      4
8  4.992406      5
9  3.974674      4
10 4.899804      5
11 4.992406      5

四舍五入以求清晰

 pred actual
1     5      5
2     5      5
3     4      4
4     5      5
5     5      5
6     5      5
7     4      4
8     5      5
9     4      4
10    5      5
11    5      5

相当不错,在 50 行新线路的测试中只有几处错误


但矩阵 X 中的数据非常简单,从 1 到 5 只有 5 个唯一值,只有 5 列,但已经出现了错误。

不过我认为,如果我们进行分类,就不会出现错误,您可以顺便检查一下。

嗯,是的,没错,但如果我们要寻找数据中的最大值,那么分类就不合适了,因为值的散布可能是巨大的....。

所以,让我们回到回归法,把数据复杂化。

head(X)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,]  0.93 -2.37 -0.35  0.16 -0.11
[2,] -0.53  0.19 -0.42  1.35 -0.16
[3,]  1.81  0.19 -0.68  0.31 -0.05
[4,]  0.08 -1.43  0.15 -0.96  0.43
[5,]  0.40  1.36  1.17 -0.99 -0.18
[6,] -2.19 -0.65  0.42 -1.12  1.46

我们会得到这样的结果。

  pred actual
1   1.75   1.78
2   1.33   1.31
3   1.67   1.69
4   1.15   1.16
5   0.51   0.41
6   1.00   0.99
7   0.80   0.78
8   1.75   1.76
9   0.35   0.36
10  1.78   1.79
11  2.02   2.13
12  1.26   1.21
13  1.60   1.57
14  0.19   0.06

原则上这并不坏,但常用的函数 mach() 可以做得更好,而且可以取代所有这些模型....

顺便说一下,我想知道其他模型将如何工作,它们是否能够在 不出错 的情况下创建mach() 函数