交易中的机器学习：理论、模型、实践和算法交易

Forester 2018.12.26 06:22 #12351

亲爱的林务人员。是否有必要对树木和森林进行类别平衡（使不同类别的例子数量相等）？

Дмитрий 2018.12.26 06:33 #12352

elibrarius。
亲爱的林务人员。是否有必要对树木和森林进行类别平衡（使不同类别的例子数量相等）？

没有

Forester 2018.12.26 07:37 #12353

迪米特里。

没有

我正在读: Flach P. - 机器学习。构建从数据中提取知识的算法的科学和艺术 - 2015年

那里有好几页专门讨论这个话题。这里是底线。

第1点指出说，平衡是有用的。

但也有第2点，从中我们可以得出结论，在大样本的情况下，当一个小类的例子足够多时，那么它的样本就会变得有代表性。然后平衡就没有必要了。
有多少个例子可以被认为是BP的代表？

然后是段落。3.但很难知道在选择使用的程序中，树的具体实现是否有这样的修正。

Дмитрий 2018.12.26 07:47 #12354

elibrarius。

我正在读: Flach P. - 机器学习。构建从数据中提取知识的算法的科学和艺术 - 2015年

那里有好几页专门讨论这个话题。这里是底线。

第1点指出说，平衡是有用的。

但也有第2点，从中我们可以得出结论，在大样本的情况下，当一个小类的例子足够多时，那么该类的样本就会变得有代表性。然后平衡就没有必要了。

然后是段落。3.但很难知道在所选择的程序中的树的特定实现中是否有这样的修正。

在我看来，该官员是在为MO陈述大数法则。

显然，如果你有10个观察值到第一类，6个观察值到第二类，那么在第二类中加入4个观察值会改变模型（不一定会改善它），但它仍然没有代表性。

Forester 2018.12.26 07:52 #12355

迪米特里。

在我看来，该官员是在为MO陈述大数法则。

显然，如果你有10个观察值到第一类，6个观察值到第二类，那么在第二类中增加4个观察值会改变模型（不一定会改善它），但它仍然没有代表性。

不大，他在小数字上的解释是10：8：2与6：4。但我们有大量的数据。

有多少个例子可以被认为是BP的代表？我通常不使用低于10000的，小班应该至少有1000的。

Дмитрий 2018.12.26 07:56 #12356

elibrarius。
是的，他只是在看10 vs 8:2 vs 6:4的例子。但我们有大量的数据。

有多少个例子可以被认为是BP的代表？

HZ。我采取了最大的，但我是为树木和森林的日常数据工作的--至少2年。

问问A_K--他用切比雪夫不等式来确定最优（如果我没记错的话），但只适用于连续变量。

尽量从变量的数量入手--每个变量至少有100个。

一般来说，如果你想找到一个 "永久 "的模式，越多越好。如果 "模式 "是浮动的，你需要寻找最佳窗口。

Forester 2018.12.26 08:00 #12357

elibrarius。
不大，他在小数字上的解释是10：8：2与6：4。但我们有大量的数据。

有多少个例子可以被认为是BP的代表？我通常不会使用低于10000的数字，一个小班至少应该有1000个。

虽然我们会加入成千上万的人，然后模式也可能会改变。

也许这也是对的。正如他们所说，市场正在发生变化，所以让模式也发生变化。

Дмитрий 2018.12.26 08:02 #12358

elibrarius。
虽然我们会以数千为单位进行补充，然后模式也可能发生变化。

你用木头做的吗？

Forester 2018.12.26 08:04 #12359

迪米特里。

你用木头做的吗？

对于BP的分析，为了赚钱。
我还没有使用它，但我正准备这样做。我仍在阅读该理论以了解其优点和缺点。我对结果不满意，所以我决定与森林合作。在我看来，它似乎更适合于BP。

Дмитрий 2018.12.26 08:07 #12360

elibrarius。
对于BP的分析，为了赚钱。
我还没有使用它，但我正准备这样做。我仍然在阅读该理论，以了解其优点和缺点。我对结果不满意，所以我决定从事林业工作。在我看来，它似乎更适合于BP。

两年前，我在这里写过Maximka，NS是一个像核弹一样的玩具。如果其他任何模型都能提供至少令人满意的结果，就不建议使用NS--他们发现了不存在的东西，而你对此无能为力。

树木是个好东西，但最好是使用脚手架。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1236