交易中的机器学习:理论、模型、实践和算法交易 - 页 501

 
桑桑尼茨-弗门科

你没有从我的帖子中理解任何东西。完全没有。


而且因为你的存在,对支部来说是个遗憾。


是的,你再给那些声称能够推断的领域的同志们下定义 :))

 
愿意

事实上,提出的问题是一个有趣的问题。

在回归y = f(x)的情况下,森林真的不能 "推断 "出没有训练点的地方,而MLP 可以,尽管它也不做,最多是以多项式回归的方式,这在树的图表常数上是 "更漂亮"。


但在某些方面Sansanych和Leha也是对的,因为回归y=f(x)并不是我们交易者所需要的,因为如果x是来自出生地的时间,那么我们对这种关系不感兴趣,在其他特征的空间中,来自未来时间的点不一定会在我们指标特征的学习样本之外。

为什么一棵树的森林会给出一个常数,我很清楚,线性回归 也很明显,但为什么MLP会给出一个伪多项式 回归,我 "不认为 "是透明的。 我们需要搞清楚...


那么一个简单的例子,如果你预测价格并在一个不完整的价格区间上训练支架,那么当你需要预测训练区间以外的价格时,它就不会预测。很明显,这些情况是特殊的,我们应该使用正确的培训。

在你的图片中,正是我的意思

 
(我看不到 它。

怎么洒的?


绘画))。

 
当时没有仔细思考。

完全没有问题,因为没有线性时间迹象,"训练间隔外 "只有非常罕见的异常值,一些不应该出现的东西,他妈的黑天鹅 :)


啊,我以为是目标区间......没有仔细思考

 
我想向支部中受人尊敬的成员询问这个问题

关于交易、自动交易系统和交易策略测试的论坛

表中有1000只交易量最大的股票的报价。过去一年的数据。

fxsaber, 2017.10.04 14:19

"定期重新平衡portafl,一切都会好起来的",这是很多人的说法,直到他们把SB(随机走动)滑入他们的计数系统,而不是原始价格系列。

绝大多数人在SB之后看到的情况与真实数据完全相同。但通过说关于再平衡的那句话来得出同样的结论已经不可能了,因为它是SB。而 "会好的 "则被排除在外。

在我看来,问题的关键在于:真实的价格数据与SB有多大差别? 如果我理解正确的话,差异越大,挤出利润的机会就越多。反之亦然,直至 "无差异-无利润"。

 
有毒

为什么MLP会给出 多项式回归,我 "看不出来",因为它是透明的,需要弄清楚......

弄清楚为什么1个神经元做线性回归,它是如何在低水平上发生的,然后很容易理解在多神经元和多层集合中是如何获得非线性变体的。而随机森林以及Knn和其他内核工具只做局部插值,这可能是在其他投影中的外推,不是重点,但RF并没有在大范围内建立(扫频)函数,但多层渗透器却做了。

 
fxsaber:

在我看来,关键问题是:真实的价格数据与SB有多大差别? 如果我理解正确的话,差异越大,挤出利润的机会就越多。反之亦然,直至 "无差异-无利润"。

它们是不同的,但非常微不足道,所以我们甚至不能用眼睛来注意它。此外,大部分的差异已经包含在贸易成本中。

 
fxsaber:
我想就这个问题请教尊敬的与会者

在我看来,关键问题是:真实的价格数据与SB有多大差别? 如果我理解正确的话,差异越大,挤出利润的机会就越多。反之亦然,直至 "无差异-无利润"。


差别在于价格系列中存在相对较大的排放,以及存在微弱的 "季节性" - 小时/交易时段、一周中的几天,等等。

嗯,也是 "胖 "尾巴。

 
迪米特里

这些差异包括在价格序列中有一个相对较大的排放,以及存在弱的 "季节性" - 小时/交易时段,一周中的几天,等等。

可以在不同的时间间隔将几个SB拼接起来,以获得相同的效果。

嗯,也是 "胖 "尾巴。

以一个 "粗尾 "的SB为例。

 
fxsaber:

你可以在不同的时间间隔将几个SB粘在一起,以获得同样的效果。

采取 "厚尾 "的SB。


有可能将SB适合于价格范围的标志,但在所有这些转变之后,它将不再是一个SB。

这有什么意义呢?