交易中的机器学习:理论、模型、实践和算法交易 - 页 1236

 
亲爱的林务人员。是否有必要对树木和森林进行类别平衡(使不同类别的例子数量相等)?
 
elibrarius
亲爱的林务人员。是否有必要对树木和森林进行类别平衡(使不同类别的例子数量相等)?

没有

 
迪米特里

没有

我正在读: Flach P. - 机器学习。构建从数据中提取知识的算法的科学和艺术 - 2015年

那里有好几页专门讨论这个话题。这里是底线。

第1点指出说,平衡是有用的。

但也有第2点,从中我们可以得出结论,在大样本的情况下,当一个小类的例子足够多时,那么它的样本就会变得有代表性。然后平衡就没有必要了。
有多少个例子可以被认为是BP的代表?

然后是段落。3.但很难知道在选择使用的程序中,树的具体实现是否有这样的修正。

 
elibrarius

我正在读: Flach P. - 机器学习。构建从数据中提取知识的算法的科学和艺术 - 2015年

那里有好几页专门讨论这个话题。这里是底线。

第1点指出说,平衡是有用的。

但也有第2点,从中我们可以得出结论,在大样本的情况下,当一个小类的例子足够多时,那么该类的样本就会变得有代表性。然后平衡就没有必要了。

然后是段落。3.但很难知道在所选择的程序中的树的特定实现中是否有这样的修正。

在我看来,该官员是在为MO陈述大数法则。

显然,如果你有10个观察值到第一类,6个观察值到第二类,那么在第二类中加入4个观察值会改变模型(不一定会改善它),但它仍然没有代表性。

 
迪米特里

在我看来,该官员是在为MO陈述大数法则。

显然,如果你有10个观察值到第一类,6个观察值到第二类,那么在第二类中增加4个观察值会改变模型(不一定会改善它),但它仍然没有代表性。

不大,他在小数字上的解释是10:8:2与6:4。但我们有大量的数据。


有多少个例子可以被认为是BP的代表?我通常不使用低于10000的,小班应该至少有1000的。

 
elibrarius
是的,他只是在看10 vs 8:2 vs 6:4的例子。但我们有大量的数据。


有多少个例子可以被认为是BP的代表?

HZ。我采取了最大的,但我是为树木和森林的日常 数据工作的--至少2年。

问问A_K--他用切比雪夫不等式来确定最优(如果我没记错的话),但只适用于连续变量。

尽量从变量的数量入手--每个变量至少有100个。

一般来说,如果你想找到一个 "永久 "的模式,越多越好。如果 "模式 "是浮动的,你需要寻找最佳窗口。

 
elibrarius
不大,他在小数字上的解释是10:8:2与6:4。但我们有大量的数据。


有多少个例子可以被认为是BP的代表?我通常不会使用低于10000的数字,一个小班至少应该有1000个。

虽然我们会加入成千上万的人,然后模式也可能会改变。

也许这也是对的。正如他们所说,市场正在发生变化,所以让模式也发生变化。

 
elibrarius
虽然我们会以数千为单位进行补充,然后模式也可能发生变化。

你用木头做的吗?

 
迪米特里

你用木头做的吗?

对于BP的分析,为了赚钱。
我还没有使用它,但我正准备这样做。我仍在阅读该理论以了解其优点和缺点。我对结果不满意,所以我决定与森林合作。在我看来,它似乎更适合于BP。
 
elibrarius
对于BP的分析,为了赚钱。
我还没有使用它,但我正准备这样做。我仍然在阅读该理论,以了解其优点和缺点。我对结果不满意,所以我决定从事林业工作。在我看来,它似乎更适合于BP。

两年前,我在这里写过Maximka,NS是一个像核弹一样的玩具。如果其他任何模型都能提供至少令人满意的结果,就不建议使用NS--他们发现了不存在的东西,而你对此无能为力。

树木是个好东西,但最好是使用脚手架。