交易中的机器学习:理论、模型、实践和算法交易 - 页 2602

 
mytarmailS#:
一个具体的例子。
有一个逻辑规则,在训练和测试以及交叉验证等方面都以80%的概率预测某事。但在验证数据(绝对未知的新数据)上,该规则在随机水平上工作...

还有一条规则在火车上的表现与第一条规则相同,测试和通过验证也没有问题,这是一个真正的模式。

问题:我怎样才能在训练、测试、交叉验证阶段将一条规则与另一条规则区分开来......在验证阶段之前......。

我想知道是否有任何迹象可以让我们在两者之间划清界限,也许有一些随机性或决定性的统计测试等等。

随机性/连续性的问题是整个算法和算法中的ML的基石。

很多各种各样的花招和技巧。


最简单的是看你是如何得到结果的。如果你得到的最好结果是...通过从集合中挑选出最好的结果--当然,拟合的概率非常高(尤其是当其他大多数结果都是关于什么的时候)。测试的结果。你是如何得到它们的?- 当然,如果你把托盘上最好的前5%的人,都在测试中运行,选择测试中最好的人--当然,符合的概率还是不小的(尤其是在其他人的平均结果不多)。我敢肯定,这种 "如何不做 "的做法将非常体面地减少被过度装备的概率。正是由于这个原因,我不明白其他人的机器人/模型如何能在公平的基础上得到评价--没门。


更进一步,如前所述,各种花样百出。

 
Replikant_mih#:

随机性/非法性问题是所有algo和algo中的ML的基石问题。

有各种各样的窍门和技巧。

最简单的是看你是如何得到结果的。如果你得到的最好结果是...通过从集合中挑选出最好的结果--当然,拟合的概率非常高(尤其是当其他大多数结果都是关于什么的时候)。测试的结果。你是如何得到它们的?- 当然,如果你把托盘上最好的前5%,都在测试中运行,选择测试中最好的一个--当然,符合的概率还是不小的(尤其是在其他人的平均结果不多)。我敢肯定,这种 "如何不做 "的做法将非常体面地减少被过度装备的概率。正是由于这个原因,我不明白其他人的机器人/模型如何能在公平的基础上得到评价--没门。

更进一步,如前所述,各种花样百出。

这都是显而易见的东西,上了油的...对具体的窍门感兴趣

==============================

例如,作为一种变体,对TC、规则、AMO等的优化面(RP)进行分析...。

例如,按目标 "恢复系数 "计算的两辆货车的OD TC交叉点。

当然,这个TS是不工作的,过去和将来都不会。


=======================================

这里有一个PP工作的TS,非常稳定,到目前为止还在盈利(Valery知道:) )。


可以这么说,感受到了差异。

 

所以我有一个执着的想法,如果你看到TC的OD,你就可以知道它是什么,以及它是否能在新的数据上工作......

但计算OD的时间很长,也很复杂,也许从计算资源的角度来看,可以用一种更优雅、更省时的方式绕过。

 
mytarmailS#:

所以我有一个执着的想法,如果你看到TC的OD,你就可以知道它是什么,以及它是否能在新的数据上工作......

但计算OP的时间很长,也很复杂,也许可以更优雅地绕过它,在计算资源方面也不那么费劲。

我有一些想法,阿尔戈交易商是如何做到这一点的。我不知道数据科学家是如何做到这一点的。而且我很清楚我是怎么做的))。


根据我的理解,优化面(在这种情况下)是一个3维空间,其中2个轴是参数(模型、策略)的轴,一个是目标指标。是的,你当然可以从那里进去。我有几个办法,如果需要的话,我可以想出其他办法。不过,我现在从另一个角度来看待这个问题。当然,也没有人愿意与一个以"这都是显而易见的东西,黄油手 " 的人分享有用的信息)。

 
mytarmailS#:
追踪因果关系并非总是可能的

然后只能对原因和模式的存在作出假设。原因是主要的,行为是次要的。在TA中,他们有时忘记了原因的首要性,把随机重复的行为当作模式,其实不然。

 
Replikant_mih#:

我有一些想法,阿尔戈交易商是如何做到这一点的。我不知道数据科学家是如何做到这一点的。而且我很清楚我是怎么做的)。


根据我的理解,优化面(在这种情况下)是一个3维空间,其中2个轴是参数轴(模型、策略),一个是目标指标。是的,你当然可以从那里进去。我有几个办法,如果需要的话,我可以想别的办法。不过,我现在从另一个角度来看待这个问题。当然,也没有意愿与一个以"这都是显而易见的东西,蝴蝶。")的 人分享有用的信息。

看,如果你对这个问题的回答是: ,很多技巧和窍门。再往后,如前所述,各种花样百出。

谢谢你的这些深入的知识,这绝对不是 "黄油"。

试着在SA或CV这样的特殊网站上回答,你会得到多少赞许,这很有趣......

如果你如此烦恼,你总是可以哭的))。

 
mytarmailS#:

看,如果你对这个问题的回答是: ,很多花招和技巧。并进一步,如你所说,各种技巧和技术。

谢谢你的这些深入的知识,这绝对不是 "黄油手"。

试着在SA或CV这样的特殊网站上回答,你会得到多少赞许,这很有趣......

如果它让你感到那么困扰,你可以随时哭出来))

很高兴你喜欢它)。

 
Valeriy Yastremskiy#:

那么就只能是对原因的假设和模式的存在。原因是主要的,行为是次要的。在TA中,他们有时忘记了原因的首要性,把随机重复的行为当作模式,其实不然。

我同意,这是个复杂的问题...

这就是为什么必须进入数学才能有一个答案,而不是 "许多技巧和窍门"。

 

1)我认为很明显,没有也不可能有办法证明历史上建立的模式在未来一定会起作用。

2)存在一种方法,根据过去的数据为未来建立一个确定的(非随机的)模式,将是对(1)的否定。

我们只有交叉验证,它只能确定一个模式在历史上的同质性。我们只能对模式进行内插,而不能推断。我们只有一个非常弱的假设,即一个良好的插值模式将变成良好的推断。这不是演绎推理,而只是归纳推理--类比推理的一个变种。

 
Aleksey Nikolayev#:

1)我认为很明显,没有也不可能有办法证明历史上建立的模式在未来一定会起作用。

2)通过过去的数据来确定未来模式的确定性(非随机性)的方法的存在将是对(1)的否定。


那么,(1)的明显性是什么,其有效性的论据是什么?