交易中的机器学习:理论、模型、实践和算法交易 - 页 2651

 
mytarmailS #:



这样更好吗?


=====================

您可以将表达式进一步复杂化

是的,列表是个好主意。

要做一个真正的 double,你需要代数数据类型。我还没见过它们在 R 中的实现,而且遗传优化对它们不起作用 目前还 清楚什么样的优化能对它们起作用)。

 

我不知道你怎么想,但我对这种算法很着迷...底部的简单变量是如何累加到顶部的复杂表达式的,这是一个层次结构,就像自然....

 
Aleksey Nikolayev #:

是啊,列清单是个好主意。

要实现真正的 double,你需要代数数据类型。我还没见过它们在 R 中的实现,而且遗传优化对它们不起作用 现在还 清楚什么样的优化能对它们起作用)。

是的,有一些限制,因为 GP 的每个数字都是列表中的一个单独元素,所以如果数字很多,就会有麻烦(),但你可以摆脱这种情况,正如我所展示的那样

 
mytarmailS #:

我不知道你怎么想,但我对这种算法很着迷...底部的简单变量是如何累加到顶部的复杂表达式的,这是一个层次结构,就像自然....

它比 MSUA 好在哪里?你可以对任何东西着迷,只要它有用。)
 
Maxim Dmitrievsky #:
它比 MSUA 好在哪里?只要对你有好处,你可以对任何事情着迷)。
嗯,它与众不同。
符号回归是一个框架,你可以在其中实现任何逻辑,它只是方便了你,因为你不必自己写....。

而这种规则的实现,是的,它与 mgua 非常相似--特征独创 + 特征选择 + 制作模型
就像 mgua 一样集于一身。
那么,如果把这个特定的实现与 mgua 进行比较:
MGUA 无法处理大量特征,因为它完全是矫枉过正。
这很糟糕,但 mgua 找到了一个有保证的最佳解决方案,这很好。

而这种实现恰恰相反
 
mytarmailS #:
嗯,这是不同的。
符号回归是一个框架,你可以在其中实现任何逻辑,它只是方便了你,因为你不必自己写....。

而这种规则的实现,是的,它与 mgua 非常相似--特征独创 + 特征选择 + 制作模型。
就像 mgua 一样,集所有功能于一身。
好吧,如果把这个特定的实现与 mgua 相比:
MGUA 无法处理大量特征,因为它完全是矫枉过正。
这是不好的,但 mgua 找到了一个有保证的最佳解决方案,这是好的。

而这个实现恰恰相反
哦,是的,这是遗传学上的矫枉过正,而且可能有标准的性状组合方案。
 

关于事件不变性的小 知识

假设我们要描述 一个头肩顶 模式(假设存在这样的 模式,我们的算法会查看最后一个 H 点,例如示例中的 7 点。

绿色矩形表示算法的范围。最后一个 H 点,本例中为 7 个。

我们将处理这种形式的数据,并将其输入 AMO 等滑动窗口等。

如果我们用规则来描述规律性,那么它就会像 x[1] < x[2] & x[2] > x[3] 等.....。

但在现实中,市场是变化的,会拉伸/收缩,振幅也会变化,等等....。


这就是市场的实际情况,我们都看最后 7 个点,并期望我们的规则x[1] < x[2] & x[2] > x[3]... 会起作用 )).

正如你所看到的,有一个模式,它并没有消失,但我们酷酷的 10 层 GPT-5 什么也看不到)。


结论:所有 AMO 算法 "开箱即用 "表格数据,即所有算法都在寻找与索引刚性绑定的模式,这行不通....

1) 有必要转向关联规则等算法,这些算法与事件、事件序列绑定,但不与索引绑定。

2) 要么自己设计 正确的规则,并从中建立模型

3) 或者在 AMO 中使用关联规则/序列算法所使用的数据表示,但这样一来,特征的数量将达到数十亿。

 
Aleksey Nikolayev #:

目前还不清楚什么样的优化能对它们起作用

什么意思?有双倍的连续优化和整数的离散优化。还是我理解错了?

GP 是离散的,这就是为什么双倍优化存在问题的原因。
 

关于多样化的力量

比方说,我们有一家 CU,它的盈利能力并不强,甚至可以说很差。

这就是它的收益率曲线。

实际上,这是一个随机噪音,其中加入了一个非常微弱的趋势,这个趋势非常小,在噪音中肉眼无法看到。

这就是趋势。

这是一种我们不会让其交易的策略)。

但是,如果我们在一个账户上同时交易 100 个这样不相关的策略呢?

这不太好,如果我们有 1000 个策略呢?

10 万个策略呢?

那就太酷了。

有可能用 MO 生成这么多策略吗?....

 
mytarmailS #:
什么意思?连续优化是双倍的,离散优化是整数的。还是我没听懂?

GP 是离散的,这就是为什么双倍优化存在问题的原因。

我在那里写了代数数据类型。它们概括了复杂的数据类型,如列表和树。它们结合了复杂的离散结构和存储在该结构中的实数集(事实证明它的大小是不固定的)。因此,我们必须以某种方式将对结构的离散优化和对结构中存储的数字的连续优化结合起来。至少从理论上讲,我完全不知道如何做到这一点。