交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2018.05.07 10:09 #8821

马克西姆-德米特里耶夫斯基。

常规森林和随机森林以及树状森林是一样的 :)森林是树木的集合体

塌陷的特征是指很少变化和/或分类的特征，如1和0（好吧，这是一个高层次的理解）。

不，折叠的意思是一个变量有很多值，但组合的数量不变。我附上了一个文件，与去年的购物文件相似，但以另一种方式表示。

附加的文件：

Pred_004_02_Buy.zip 324 kb

Aleksey Vyazmikin 2018.05.07 10:12 #8822

Vizard_。

二进制化杀死了很多有用的信息。

信息的呈现方式有什么区别，它并没有改变......？???

Yuriy Asaulenko 2018.05.07 10:26 #8823

马克西姆-德米特里耶夫斯基。

我个人并不反对桑桑尼茨，他是一个非常能干和谨慎的人，在做一些他自己不知道的事情，他可能需要R

我直觉上更喜欢Python，虽然我没有发明什么特别的东西来让它哗众取宠，但我一直在静静地研究它，看看它是否有帮助 :D

R是一个很好的环境，它比Python有很多优势。最重要的是，R是一个建模环境。与Python相比，你可以在R中获得更快、更容易的结果。

很明显，Python与模块结合在一起，有其自身的优势。

顺便说一下，对于RF来说，似乎在这里以及在NS中，我们可以不对预测因子进行尝试性的选择，而直接使用归一化的BP，因为如此。

Aleksey Vyazmikin 2018.05.07 10:28 #8824

桑桑尼茨-弗门科。

正态森林或随机森林，还是两者都有？

在 rattle 中，运行名为 tree 和 ada 的两个森林模型。打开日志标签，可以看到R代码，对所使用的包的引用，你可以了解它们的区别。

我理解树和脚手架之间的区别（或者我认为我理解），当数据中存在更多的不确定性时，脚手架更好用，即不太稳定的模式，因为脚手架通过投票做出决定，而这是由随机（因缩短而独立）树完成的，还是我错了？而 "adad "选项我没有，它不在截图中，有 "森林"--不是吗？

桑桑尼茨-弗门科。

我把Rattle和R（好吧，和glitches所有这些东西......）。

我不明白是什么 故障，最近运行了大量的模型--全部正常。

我在下载软件包方面遇到了一些问题--他说他已经开始了，但不会下载它们，然后他把它们放下，说他没有他需要的库，然后在从文件中读取数据时被挂起......那么，工作过程是不可见的--不清楚要等多长时间才能完成。到目前为止，我正在谈论这样的错误。一旦从调度器中删除一个任务...

桑桑尼茨-弗门科。

从拨浪鼓的图片，你有未完成的。至少你需要进入下一个标签，看看那里的结果。

但最重要的是将源文件分成两部分，并使用不同的名称（很可能你必须在R中完成）。

在第一个文件中，你建立了所有六个模型，并查看了它们的估计测试，验证。然后你把第二个文件的名称写到R数据集字段中。而在这上面你又得到了分数。所有的估计必须是大致相同的!

如果这些估计值不一致，而且第二个文件显示模型的结果更差，那么这意味着模型被过度训练，其原因是噪声（与目标变量无关）预测器。

这是关键时刻：要么你有一组与特定目标变量相关的预测器，要么你没有。而且没有任何模型可以解决这个不幸的情况。然后开始了选择一对 "目标预测因子 "的愚蠢工作，模型根本就不有趣，找到一对，那么模型在R中只是种子，你会在一天内找到一打，并把它们组成合奏。

那么，如何用R切割文件，是否需要使用一种特殊的算法？有意思的是，看看最后会发生什么。

Aleksey Vyazmikin 2018.05.07 10:31 #8825

桑桑尼茨-弗门科。

2.使用R型EA没有问题：一切正常，而且非常稳定。

它也适用于MT5吗？我在哪里可以找到代码的例子？我认为使用指标来发送信息会更好，因为在优化器中，连接到EA时更容易比较它们，并直观地显示森林在任何特定时间对市场情况的看法。

Maxim Dmitrievsky 2018.05.07 10:38 #8826

尤里-阿索连科。

R是一个美妙的环境，与Python相比有很多优势。最主要的是，R是一个建模环境。与Python相比，R语言的结果可以更快、更容易得到。

很明显，Python与模块结合在一起，有其自身的优势。

顺便说一下，对于RF，似乎在这里，以及在NS中，有可能不选择预测因子，而直接使用归一化的BP，就是这样。

你甚至可以使用非标准化的

Yuriy Asaulenko 2018.05.07 10:44 #8827

马克西姆-德米特里耶夫斯基。

你甚至可以在没有配给的情况下做到这一点。

这是不可能的。必须有一个明确的BP部分的参考，比如说，零的水平。

СанСаныч Фоменко 2018.05.07 10:57 #8828

阿列克谢-维亚兹米 金。

我理解树木和森林的区别（或者我认为我理解），当数据中存在更多的不确定性时，森林更好用，即不太稳定的模式，因为森林是通过投票做出决定的，而随机（由于缩短而独立）的树木是通过投票做出决定的，或者我错了？

我不知道，我是根据结果来判断的。

而 "adad "选项我没有，它不在截图中，有 "森林"--这不是它吗？

按顺序排列。

树木

rpart "包提供了 "rpart "功能。

晋升

# 极限提升

# `xgboost' 包实现了极端梯度提升算法。

证券公司

# 支持向量机。

# "kernlab "软件包提供了 "ksvm "功能。

线性

# 回归模型

# 建立一个回归模型。

神经网络

# 神经网络

# 使用nnet包建立一个神经网络模型。

library(nnet, quietly=TRUE)

顺便说一句，我为你做了这项工作--你可以自己在日志中看到这一切。如果你有另一个版本的拨浪鼓，清单可能有所不同。

那么，如何用R来切割文件，你需要使用特殊的算法？我们很想知道结果会是什么。

以指数为例。[1:2000,], [2001:4000,].重要的是不要打破第二个文件中的自然时间顺序

СанСаныч Фоменко 2018.05.07 11:02 #8829

阿列克谢-维亚兹米 金。

它也适用于MT5吗？我在哪里可以找到代码的例子？我认为按指标提供信息会更好，因为优化者在连接到EA时可以很容易地进行比较，并直观地看到森林在任何时候对市场形势的看法。

这个库是根据我的要求修改的--我需要一个来自MT5的测试器。我算过了，我懒得去找了，也许我已经把它清理干净了。

看一看弗拉基米尔-佩雷文科的文章

如果你对网络感兴趣，他是这一领域最新的，R，顾问，这个人在网站上是可以找到的

Maxim Dmitrievsky 2018.05.07 11:08 #8830

阿列克谢-维亚兹米 金。

不，是折叠的，这意味着一个变量有很多值，但组合的数量不变。我附上了一个类似于上次购物的文件，但以不同的方式表示。

你想怎么试就怎么试 :) 最主要的是不要忘记阅读不会做傻事的理论，你需要的软件包并不难，它们都是满满的，甚至在网上 - 你不需要安装任何东西。datasens的蓬勃发展，"它 "无处不在

我没有时间分析档案，我在忙我自己的事。

交易中的机器学习：理论、模型、实践和算法交易 - 页 883