交易中的机器学习：理论、模型、实践和算法交易

Replikant_mih 2022.03.25 06:08 #26011

mytarmailS#:
一个具体的例子。

有一个逻辑规则，在训练和测试以及交叉验证等方面都以80%的概率预测某事。但在验证数据（绝对未知的新数据）上，该规则在随机水平上工作...

还有一条规则在火车上的表现与第一条规则相同，测试和通过验证也没有问题，这是一个真正的模式。

问题：我怎样才能在训练、测试、交叉验证阶段将一条规则与另一条规则区分开来......在验证阶段之前......。

我想知道是否有任何迹象可以让我们在两者之间划清界限，也许有一些随机性或决定性的统计测试等等。

随机性/连续性的问题是整个算法和算法中的ML的基石。

很多各种各样的花招和技巧。

最简单的是看你是如何得到结果的。如果你得到的最好结果是...通过从集合中挑选出最好的结果--当然，拟合的概率非常高（尤其是当其他大多数结果都是关于什么的时候）。测试的结果。你是如何得到它们的？- 当然，如果你把托盘上最好的前5%的人，都在测试中运行，选择测试中最好的人--当然，符合的概率还是不小的（尤其是在其他人的平均结果不多）。我敢肯定，这种 "如何不做 "的做法将非常体面地减少被过度装备的概率。正是由于这个原因，我不明白其他人的机器人/模型如何能在公平的基础上得到评价--没门。

更进一步，如前所述，各种花样百出。

mytarmailS 2022.03.25 07:11 #26012

Replikant_mih#:

随机性/非法性问题是所有algo和algo中的ML的基石问题。

有各种各样的窍门和技巧。

最简单的是看你是如何得到结果的。如果你得到的最好结果是...通过从集合中挑选出最好的结果--当然，拟合的概率非常高（尤其是当其他大多数结果都是关于什么的时候）。测试的结果。你是如何得到它们的？- 当然，如果你把托盘上最好的前5%，都在测试中运行，选择测试中最好的一个--当然，符合的概率还是不小的（尤其是在其他人的平均结果不多）。我敢肯定，这种 "如何不做 "的做法将非常体面地减少被过度装备的概率。正是由于这个原因，我不明白其他人的机器人/模型如何能在公平的基础上得到评价--没门。

更进一步，如前所述，各种花样百出。

这都是显而易见的东西，上了油的...对具体的窍门感兴趣

==============================

例如，作为一种变体，对TC、规则、AMO等的优化面（RP）进行分析...。

例如，按目标 "恢复系数 "计算的两辆货车的OD TC交叉点。

当然，这个TS是不工作的，过去和将来都不会。

=======================================

这里有一个PP工作的TS，非常稳定，到目前为止还在盈利（Valery知道:) ）。

可以这么说，感受到了差异。

mytarmailS 2022.03.25 07:52 #26013

所以我有一个执着的想法，如果你看到TC的OD，你就可以知道它是什么，以及它是否能在新的数据上工作......

但计算OD的时间很长，也很复杂，也许从计算资源的角度来看，可以用一种更优雅、更省时的方式绕过。

Replikant_mih 2022.03.25 08:30 #26014

mytarmailS#:

所以我有一个执着的想法，如果你看到TC的OD，你就可以知道它是什么，以及它是否能在新的数据上工作......

但计算OP的时间很长，也很复杂，也许可以更优雅地绕过它，在计算资源方面也不那么费劲。

我有一些想法，阿尔戈交易商是如何做到这一点的。我不知道数据科学家是如何做到这一点的。而且我很清楚我是怎么做的））。

根据我的理解，优化面（在这种情况下）是一个3维空间，其中2个轴是参数（模型、策略）的轴，一个是目标指标。是的，你当然可以从那里进去。我有几个办法，如果需要的话，我可以想出其他办法。不过，我现在从另一个角度来看待这个问题。当然，也没有人愿意与一个以"这都是显而易见的东西，黄油手 " 的人分享有用的信息）。

Valeriy Yastremskiy 2022.03.25 08:46 #26015

mytarmailS#:
追踪因果关系并非总是可能的

然后只能对原因和模式的存在作出假设。原因是主要的，行为是次要的。在TA中，他们有时忘记了原因的首要性，把随机重复的行为当作模式，其实不然。

mytarmailS 2022.03.25 08:59 #26016

Replikant_mih#:

我有一些想法，阿尔戈交易商是如何做到这一点的。我不知道数据科学家是如何做到这一点的。而且我很清楚我是怎么做的）。

根据我的理解，优化面（在这种情况下）是一个3维空间，其中2个轴是参数轴（模型、策略），一个是目标指标。是的，你当然可以从那里进去。我有几个办法，如果需要的话，我可以想别的办法。不过，我现在从另一个角度来看待这个问题。当然，也没有意愿与一个以"这都是显而易见的东西，蝴蝶。"）的人分享有用的信息。

看，如果你对这个问题的回答是：，很多技巧和窍门。再往后，如前所述，各种花样百出。

谢谢你的这些深入的知识，这绝对不是 "黄油"。

试着在SA或CV这样的特殊网站上回答，你会得到多少赞许，这很有趣......

如果你如此烦恼，你总是可以哭的））。

Replikant_mih 2022.03.25 08:59 #26017

mytarmailS#:

看，如果你对这个问题的回答是：，很多花招和技巧。并进一步，如你所说，各种技巧和技术。

谢谢你的这些深入的知识，这绝对不是 "黄油手"。

试着在SA或CV这样的特殊网站上回答，你会得到多少赞许，这很有趣......

如果它让你感到那么困扰，你可以随时哭出来))

很高兴你喜欢它）。

mytarmailS 2022.03.25 09:01 #26018

Valeriy Yastremskiy#:

那么就只能是对原因的假设和模式的存在。原因是主要的，行为是次要的。在TA中，他们有时忘记了原因的首要性，把随机重复的行为当作模式，其实不然。

我同意，这是个复杂的问题...

这就是为什么必须进入数学才能有一个答案，而不是 "许多技巧和窍门"。

Aleksey Nikolayev 2022.03.25 10:31 #26019

1）我认为很明显，没有也不可能有办法证明历史上建立的模式在未来一定会起作用。

2）存在一种方法，根据过去的数据为未来建立一个确定的（非随机的）模式，将是对（1）的否定。

我们只有交叉验证，它只能确定一个模式在历史上的同质性。我们只能对模式进行内插，而不能推断。我们只有一个非常弱的假设，即一个良好的插值模式将变成良好的推断。这不是演绎推理，而只是归纳推理--类比推理的一个变种。

mytarmailS 2022.03.25 10:59 #26020

Aleksey Nikolayev#:

1）我认为很明显，没有也不可能有办法证明历史上建立的模式在未来一定会起作用。

2）通过过去的数据来确定未来模式的确定性（非随机性）的方法的存在将是对（1）的否定。

那么，（1）的明显性是什么，其有效性的论据是什么？

交易中的机器学习：理论、模型、实践和算法交易 - 页 2602