交易中的机器学习:理论、模型、实践和算法交易 - 页 3128

 

意味着洗得不好

偏差 - 方差权衡

 
Maxim Dmitrievsky #:

这说明洗牌的过程很糟糕

偏差 - 方差权衡

马克西姆,考虑到你的陈述和对市场的了解,让我来向你解释一下 " 狗尾续貂 "这句话的含义。

我知道这会引起你的愤怒和不满。这吓不倒我。

让我来解释一下。

狗的尾巴就是你在 左边 看到的零条后面的图形,但这只非常哒的狗会在右边。

狗必须像论坛的其他部分一样得到理解和尊重。这样你才有成功的机会。阅读心理学书籍.)))))))

 
Maxim Dmitrievsky #:

这说明洗牌的过程很糟糕

偏差 - 方差权衡

这就是问题所在,如果存在数据漂移,就不能洗牌。你需要预测它,如果它有明显的矢量,而不仅仅是范围内的波动,还可能生成考虑到它的符号。

在这里,我发现了一种有趣的算法 "隔离森林",理论上它可以捕捉样本中的异常值/离群值,用于训练和新数据。

理论上,当新数据到来时,如果信号与训练时的数据有很大差异,它就可以用来过滤原始样本并忽略信号。

您想一起研究这个问题吗?

您可以在这里 了解更多信息。

Примечания к машинному обучению Python алгоритм обнаружения аномальных точек - Isolation Forest - Русские Блоги
  • russianblogs.com
Примечания к машинному обучению Python алгоритм обнаружения аномальных точек - Isolation Forest, Русские Блоги, лучший сайт для обмена техническими статьями программиста.
 
Aleksey Vyazmikin #:

问题是,如果存在数据漂移,就不能洗牌。有必要对其进行预测,并在可能的情况下将其纳入考虑范围,如果它有明显的矢量,而不仅仅是范围内的波动的话。

在这里,我发现了一种有趣的算法 "隔离森林"(Isolation Forest),从理论上讲,它可以修复样本中的异常值/离群值,用于训练和新数据。

从理论上讲,当新数据到来时,如果信号与训练时的数据有很大差异,它可以用来过滤原始样本并忽略信号。

你们愿意一起研究这个问题吗?

例如,您可以在这里 了解更多信息。

在根据其可变性确定偏差的阶段,我们需要进行洗牌。为此,我们需要进行交叉拟合(根据 Sanych,类似于稳定性)。这种偏差的变异性可能根本不是线性的,因此无法通过简单的推论来解决这个问题。我已经学会了部分解决这个问题,但我总是希望有更好的解决方案。

我还研究了异常现象的方向,但到目前为止,Kozul 更有意思。
 
Maxim Dmitrievsky #:
终于禁止这些病人了 )
他们正在把论坛变成垃圾场。

如果我在两篇帖子里就把论坛变成了垃圾场,那么你就制造了一个你说了算的大垃圾场。

那我们就进入正题吧。

您认为国防部能够多长时间做出高质量的预测

 
Maxim Dmitrievsky #:
在确定偏差的可变性阶段,必须进行洗牌。为此,需要进行交叉拟合(类似于 Sanych 所说的稳定性)。这种偏差的变异性可能根本不是线性的,因此无法通过简单的推论来解决这个问题。我已经学会了部分解决这个问题,但我总想做得更好。

在没有找到原因的情况下,使用不同的流行方法是没有成效的。因此,我希望在了解变化原因的情况下,不是通过模型,而是通过单个预测因子来衡量数据的可变性。

 
Maxim Dmitrievsky #:
闭上你的臭嘴。

我知道你对预测能力有意见,但你又是怎么教人们学习 MO 的?

比方说,在汽车行业,有 MO 和硬件可以依靠的道路,而在 0 bar 后面的市场,有通向地平线四面八方的清晰道路。

如果你认为缩小或拓宽狗尾部分会给你带来优势。根本不会。

 
Aleksey Vyazmikin #:

在没有找到原因的情况下,使用各种流行的方法是没有成效的。因此,我希望在了解变化原因的情况下,不是通过模型,而是通过单个预测因子来测量数据的可变性。

我们可以用这种方法来衡量每个预测因子。想象力是无限的。这只是 Matstat 和 MO,你应用什么就会得到什么。

试试异常值吧,它更简单。我不会再向那些什么都没读过的人解释更多关于 kozul 的事情了。
 
Aleksey Vyazmikin #:

如果不找出原因,使用各种流行方法都不会有成效。因此,我们希望在了解变化原因的情况下,不是通过模型,而是通过单个预测因子来测量数据的变化性。

正确使用检测器非常重要。这是运动的基础。

附注

不同的因素都可以作为检测器,不一定是技术性的,也可以与 FA、新闻、谣言等结合使用。

如果您感兴趣,我会在适当的时候给您提示,当然,免费))))。

 

如果用户不同意正在讨论的某些理论(或某个主题的主题/具体内容),而且不同意的内容超过一/三个帖子,那么我强烈建议采取以下行动:

  • 创建自己的主题。
  • 在主题的第一篇帖子中,概述主题的规则(讨论什么,不讨论什么,以及如何讨论等等)。
  • 如果一切正常,版主将根据分支规则对分支进行监督。


但这是在不 "相互触碰 "的情况下发展不同方面的唯一途径。
--------------------

供参考。