交易中的机器学习:理论、模型、实践和算法交易 - 页 883

 
马克西姆-德米特里耶夫斯基

常规森林和随机森林以及树状森林是一样的 :)森林是树木的集合体

塌陷的特征是指很少变化和/或分类的特征,如1和0(好吧,这是一个高层次的理解)。

不,折叠的意思是一个变量有很多值,但组合的数量不变。我附上了一个文件,与去年的购物文件相似,但以另一种方式表示。

附加的文件:
 
Vizard_

二进制化杀死了很多有用的信息。

信息的呈现方式有什么区别,它并没有改变......????

 
马克西姆-德米特里耶夫斯基

我个人并不反对桑桑尼茨,他是一个非常能干和谨慎的人,在做一些他自己不知道的事情,他可能需要R

我直觉上更喜欢Python,虽然我没有发明什么特别的东西来让它哗众取宠,但我一直在静静地研究它,看看它是否有帮助 :D

R是一个很好的环境,它比Python有很多优势。最重要的是,R是一个建模环境。与Python相比,你可以在R中获得更快、更容易的结果。

很明显,Python与模块结合在一起,有其自身的优势。

顺便说一下,对于RF来说,似乎在这里以及在NS中,我们可以不对预测因子进行尝试性的选择,而直接使用归一化的BP,因为如此。

 
桑桑尼茨-弗门科

正态森林或随机森林,还是两者都有?

在 rattle 中,运行名为 tree 和 ada 的两个森林模型。打开日志标签,可以看到R代码,对所使用的包的引用,你可以了解它们的区别。

我理解树和脚手架之间的区别(或者我认为我理解),当数据中存在更多的不确定性时,脚手架更好用,即不太稳定的模式,因为脚手架通过投票做出决定,而这是由随机(因缩短而独立)树完成的,还是我错了?而 "adad "选项我没有,它不在截图中,有 "森林"--不是吗?

桑桑尼茨-弗门科

我把Rattle和R(好吧,和glitches所有这些东西......)。

我不明白是什么 故障,最近运行了大量的模型--全部正常。

我在下载软件包方面遇到了一些问题--他说他已经开始了,但不会下载它们,然后他把它们放下,说他没有他需要的库,然后在从文件中读取数据时被挂起......那么,工作过程是不可见的--不清楚要等多长时间才能完成。到目前为止,我正在谈论这样的错误。一旦从调度器中删除一个任务...

桑桑尼茨-弗门科


从拨浪鼓的图片,你有未完成的。至少你需要进入下一个标签,看看那里的结果。

但最重要的是将源文件分成两部分,并使用不同的名称(很可能你必须在R中完成)。

第一个文件 中,你建立了所有六个模型,并查看了它们的估计测试,验证。 然后你把第二个文件的名称写到R数据集字段中。而在这上面你又得到了分数。所有的估计必须是大致相同的!

如果这些估计值不一致,而且第二个文件显示模型的结果更差,那么这意味着模型被过度训练,其原因是噪声(与目标变量无关)预测器。


这是关键时刻:要么你有一组与特定目标变量相关的预测器,要么你没有。而且没有任何模型可以解决这个不幸的情况。然后开始了选择一对 "目标预测因子 "的愚蠢工作,模型根本就不有趣,找到一对,那么模型在R中只是种子,你会在一天内找到一打,并把它们组成合奏。

那么,如何用R切割文件,是否需要使用一种特殊的算法?有意思的是,看看最后会发生什么。

 
桑桑尼茨-弗门科


2.使用R型EA没有问题:一切正常,而且非常稳定。

它也适用于MT5吗?我在哪里可以找到代码的例子?我认为使用指标 来发送信息会更好,因为在优化器中,连接到EA时更容易比较它们,并直观地显示森林在任何特定时间对市场情况的看法。

 
尤里-阿索连科

R是一个美妙的环境,与Python相比有很多优势。最主要的是,R是一个建模环境。与Python相比,R语言的结果可以更快、更容易得到。

很明显,Python与模块结合在一起,有其自身的优势。

顺便说一下,对于RF,似乎在这里,以及在NS中,有可能不选择预测因子,而直接使用归一化的BP,就是这样。

你甚至可以使用非标准化的

 
马克西姆-德米特里耶夫斯基

你甚至可以在没有配给的情况下做到这一点。

这是不可能的。必须有一个明确的BP部分的参考,比如说,零的水平。

 
阿列克谢-维亚兹米 金。


我理解树木和森林的区别(或者我认为我理解),当数据中存在更多的不确定性时,森林更好用,即不太稳定的模式,因为森林是通过投票做出决定的,而随机(由于缩短而独立)的树木是通过投票做出决定的,或者我错了?

我不知道,我是根据结果来判断的。

而 "adad "选项我没有,它不在截图中,有 "森林"--这不是它吗?

按顺序排列。


树木

rpart "包提供了 "rpart "功能


晋升

# 极限提升

# `xgboost' 包实现了极端梯度提升算法。


证券公司

# 支持向量机。

# "kernlab "软件包提供了 "ksvm "功能。


线性

# 回归模型

# 建立一个回归模型。


神经网络

# 神经网络

# 使用nnet包建立一个神经网络模型。

library(nnet, quietly=TRUE)


顺便说一句,我为你做了这项工作--你可以自己在日志中看到这一切。如果你有另一个版本的拨浪鼓,清单可能有所不同。


那么,如何用R来切割文件,你需要使用特殊的算法?我们很想知道结果会是什么。

以指数为例。[1:2000,], [2001:4000,].重要的是不要打破第二个文件中的自然时间顺序

 
阿列克谢-维亚兹米 金。

它也适用于MT5吗?我在哪里可以找到代码的例子?我认为按指标 提供信息会更好,因为优化者在连接到EA时可以很容易地进行比较,并直观地看到森林在任何时候对市场形势的看法。

这个库是根据我的要求修改的--我需要一个来自MT5的测试器。我算过了,我懒得去找了,也许我已经把它清理干净了。

看一看弗拉基米尔-佩雷文科的 文章

如果你对网络感兴趣,他是这一领域最新的,R,顾问,这个人在网站上是可以找到的
 
阿列克谢-维亚兹米 金。

不,是折叠的,这意味着一个变量有很多值,但组合的数量不变。我附上了一个类似于上次购物的文件,但以不同的方式表示。

你想怎么试就怎么试 :) 最主要的是不要忘记阅读不会做傻事的理论,你需要的软件包并不难,它们都是满满的,甚至在网上 - 你不需要安装任何东西。datasens的蓬勃发展,"它 "无处不在

我没有时间分析档案,我在忙我自己的事。