交易中的机器学习:理论、模型、实践和算法交易 - 页 803

 

什么是平衡班级的最佳方法,谁使用哪些方法?

我还想问一下,你认为哪些预测因素是有趣的,我可以把它作为个人说明吗?)

 
forexman77:
什么是平衡类的最好方法,谁使用哪些方法?

有一些功能

 caret:: downSample() - обрезает большой класс до меньшего

downSample将对一个数据集进行随机抽样,使所有类别的频率都与

少数族裔阶层。用替换法对样本进行上样,以使类的分布相等

 caret:: upSample() - добавляет меньший класс до большего


一般来说,我建议关注caret:它可以作为一个 "what-if "的教程--它包含整个周期的工具。

  • 原始数据的准备。
  • 预测器选择(非常酷的工具)。
  • 在200个模型(回归和分类模型)和
  • 模型评估(与测试员无关)。

你可以得到相当的工业设计。



PS。

我不认为有人会揭示预测者--这是最重要的事情,而模型是一个技术和勤奋的问题。

 
桑桑尼茨-弗门科


我不认为有人会透露预测因素--这是最重要的事情,而模型是技术和勤奋的问题。

好吧,我只是在问一个愚蠢的问题。毕竟,他们创造了愚蠢的分支,"如何使存款翻三倍","告诉我一个能赚钱的专家顾问",等等。

但是,我需要一些关于指标的建议,很明显,这是第一个想到的问题。但这里有一些不寻常的东西,很少有人挖过的地方。

 
forexman77:

好吧,这只是一个 "愚蠢的任务"。毕竟,他们创造了愚蠢的分支,"如何使存款翻三倍","告诉我一个能赚钱的专家顾问",等等。

但是,我需要一些关于指标的建议,很明显,这是第一个想到的问题。但这里有一些不寻常的东西,很少有人挖过的地方。

文章 最后部分的数字过滤器为例。我认为阅读以前的所有部分也将是有益的。

祝好运

 
桑桑尼茨-弗门科

有一些功能

downSample将对一个数据集进行随机抽样,使所有类别的频率都与

少数族裔阶层。用替换法对样本进行上样,以使类的分布相等


一般来说,我建议关注caret:它可以作为一个 "what-if "的教程--它包含整个周期的工具。

  • 原始数据的准备。
  • 预测器选择(非常酷的工具)。
  • 在200个模型(回归和分类模型)和
  • 模型评估(与测试员无关)。

你可以得到相当的工业设计。



PS。

我不认为有人会披露预测因素--这是最重要的事情,而模型是一个技术和勤奋的问题。

模型是由现成的东西创建的,而在这里,你可以从头开始创建它们。

 
forexman77:

好吧,这只是一个 "愚蠢的任务"。毕竟,他们创造了愚蠢的分支,"如何使存款翻三倍","告诉我一个能赚钱的专家顾问",等等。

但是,我需要一些关于指标的建议,很明显,这是第一个想到的东西。但这里有一些不寻常的东西,很少有人挖过的地方。

在最简单的情况下,作为预测器,我使用一组条形图--由给定公式计算的积分值,在训练期间作为输入数据铺设。


平衡是通过从训练标记的末端深入到历史中的采样来完成的,在一个循环中,直到采样的数量达到一个设定的数字并进行比较。

 
Ivan Negreshniy:
在最简单的情况下,我使用一组条形图作为预测器--由一个给定的公式计算出的积分值,在训练中作为输入数据使用。

实际上,最好的预测因素是价格系列本身。任何处理都是对信息的损失和延迟。而当你考虑到我们并不真正知道我们需要什么样的信息时,那么...

我在1米上工作,即使是30秒的延迟对系统来说也是死亡。而即使是非常简单的指标也会给出1-3米的延迟。

即使你在每小时的时间框架上工作,指标上的延迟将是1-3小时)。通过任何手段,1-3支蜡烛,无论你如何旋转它。

ZSY2时间序列的 另一个优点--我们不需要挑选预测因素。只要学会这样使用BP本身就可以了。

 
尤里-阿索连科

实际上,最好的预测因素是价格范围本身。任何处理都是一种损失和信息的延迟。而当你考虑到我们并不真正知道我们需要什么样的信息时,那么...

我的工作是1米,即使是30秒的延迟对系统来说也是死亡。而即使是非常简单的指标也会给出1-3米的延迟。

即使你在每小时的时间框架上工作,指标上的延迟将是1-3小时)。通过任何手段,1-3支蜡烛,无论你如何旋转它。

ZSY2 时间序列的另一个优点--我们不需要挑选预测因素。只要学会这样使用BP本身就可以了。

你怎么能不用这样的一句话来回应。每小时的图表可以在放大镜下观看,15米,5米,1米。先生们,这很可悲。

 
乌拉基米尔-伊泽斯基

你怎么能不用这样的一句话来回应。每小时的图表可以在放大镜下观看,15米,5米,1米。可悲的是,先生们。

不要伤心,我知道)。但如果你觉得舒服,你可以继续。

 
请告诉我,在初始阶段寻找与目标数据的相关性来选择数据是否足够,如果是的话,应该使用什么相关的阈值?