交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2023.04.07 22:56 #30041

Maxim Dmitrievsky #:
这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。

问题设置不正确，我在这里已经说了很久，上一次是在 10-20 页之前，所以没什么好教的，我自己完全明白一切......

要转换任务，就必须转换数据...

所以，当你让我考虑的时候，我已经考虑过了，我正在考虑我的选择。

Maxim Dmitrievsky 2023.04.08 00:14 #30042

mytarmailS #:
事实上，任务的设置并不正确，这一点我在这里已经说了很久，上一次是在 10-20 页之前，所以好像没有什么可以教我的，我完全明白一切.....。

要转换任务，就必须转换数据...

所以，当你让我思考的时候，我已经想好了，我正在浏览选项。

同样，你会得到记忆，而不是概括。

Aleksey Vyazmikin 2023.04.08 01:38 #30043

Maxim Dmitrievsky #:
如果数据中存在恒定的信号，则几乎立即意味着泛化，而噪声则会导致错误。如果没有信号，就会出现记忆化，即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。

在有模式（小波、小形状等）但没有信号的情况下，只有分为训练有素和未经训练两种模式才能起作用。可训练的被分类，不可训练的被过滤。在这里，良好的记忆可以起到过滤的作用，而泛化则是模式的泛化。

当没有明显的持续模式（如市场），但存在低效率时，方法必须更加精细，因为低效率不一定能用模式来描述。在这种情况下，你必须从中找出一个：哪些需要记住，哪些需要归纳。算法。

对数据进行转换会改变其表现形式，但本身并不能解决问题，因为最终要交易的是原始数据序列。

规律具有浮动概率，可能是周期性的，也可能完全消失。我工作的时间范围很大，也观察到了这些现象。

我想说的是，有可能训练出一个 2008-2017 年（10 年）的模型，它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%，但这也说明，10 年中能在未来几年（测试样本）发挥作用的模式很少。

但究竟是哪种模式--周期性的还是一次性的（也许周期为数十年）--目前还无法确定，因此也就不可能选择一种持续有效的模式。

理想情况下，有必要找到至少每 3 个月出现一次的周期性模式，这样我们就可以期望模型能够摆脱缩减。

根据不同的周期模式训练出的一揽子此类模型将减少缩减。

因此，重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。

你的方法--摇晃和筛选--类似于探矿者的工作--当然，你可以找到很多有趣的和没有学到的东西，但你怎么能确定这些东西会是稳定的呢？

我喜欢自己破解日期，我有这方面的想法，但现在我想朝着提高模型稳定性概率的方向挖掘。

Maxim Dmitrievsky 2023.04.08 01:44 #30044

Aleksey Vyazmikin #:

你的方法--摇晃和筛选--就像一个探矿者的工作--当然你可以找到很多有趣的和没有学到的东西，但如何确保它的稳定性呢？

我自己喜欢 "摇枣"，也有这方面的想法，但现在我想朝着提高模型稳定性概率的方向挖掘。

我写了一个基本的理解，如果没有这个理解，就根本不值得做任何事情。如果只是为了确认每一点的话（如果你第一次没有理解的话 🙂 )

要验证稳定性，就必须进行测试、测试和更多的测试，除此之外别无他法。MO 最适合做这个。

因为理论界的抱怨者们显然连 MO 的基本原理都不懂，就大谈特谈 tsos 和其他废话。这种娱乐不适合精神和道德上的弱者，发牢骚更容易:)。

Aleksey Vyazmikin 2023.04.08 02:09 #30045

Maxim Dmitrievsky #:
我写了一个基本的理解，没有它就根本不值得做任何事情。如果只是为了确认每一点的话（如果你第一次没有理解的话 🙂）

要验证稳定性，就必须进行测试、测试和更多的测试，除此之外别无他法。MO 最适合做这个。

我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述，尽管实现方式不同。

我的人工实验表明，通常情况下，只要抽取出具有 10 个简单规律性的行（在我的案例中，就是预测值下降的量子段），整个样本的概率就会向 1 的方向移动 15-20%，而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲，这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点，即不是通过统计了解历史，而是通过一些方法只选择虚假/矛盾的模式。

如果我们设定一个任务，根据这个任务，模型应该在任何仪器上都能工作，那么测试是可能的，但这样稳定的模式就更少了。而只是在历史中狂奔，或者更糟糕的是，进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据，但我还没有这种能力。您尝试过吗？

Aleksey Nikolayev 2023.04.08 04:18 #30046

mytarmailS #:
我完全不懂，但我想知道价格是否可以用图表来表示，与通常的二维表示法相比是否有任何优势。

谁知道这方面的情况？

您可以将曼德尔布罗特（Mandelbrot）的价格表示法视为三元树森林，其中每一步棋都分为三步（同方向的两步棋和两步棋之间的修正）。

这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂，难以避免瞻前顾后。

Slava 2023.04.08 06:55 #30047

Stanislav Korotky #:

这与我上面举的 "并行 "平台的矩阵和例子有什么关系？

例如，我从 keras 的链接中获取矩阵，并调用它们：

并得到零。

对照示例不适合。

分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率，其总和为 1。

试试这样一个控制示例

pred: 0.1, 0.1, 0.2, 0.5, 0.1

true: 0, 0, 1, 0, 0, 0

Maxim Dmitrievsky 2023.04.08 07:07 #30048

Aleksey Vyazmikin #:

最多，我们可以通过调整天数，从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗？

我不明白这样的假设是基于什么，而且这又是在利用特质，而不是改进学习方法。所以这是次要的。

这就像学校一样。你可以用一本教科书来教，也可以用另一本教科书来教。信息在本质上不会改变，就像变换一样。但它会飞进一个脑袋，又从另一个脑袋飞出来:)

在最终目标不明确的情况下，很难使用综合法。最好的办法是用它来测试序列的某些属性，将其混合到不同的部分，看看结果会如何变化。比如如果？对齐数据中的偏移。

一般来说，通过减少对原始数据的记忆来提高通用性是很有用的，但就创建现成的 TS 而言，它仍然是不完整的。在原始数据上训练不同的模型集合（包括简单到线性模型），也能得到类似的结果。

好了，你知道大概的答案了吧，通过它仍然不可能得到极好的东西，但改进它是可能的。

mytarmailS 2023.04.08 08:35 #30049

Aleksey Nikolayev #:

我们可以将曼德尔布罗特的价格表示法视为三元树的森林，其中每一次移动都被分解为三次（两次同方向移动和中间的修正）。

这样做的好处是可以收集价格分形结构的统计数据。缺点是算法复杂，难以避免瞻前顾后。

能否以关联规则的形式呈现？

Aleksey Nikolayev 2023.04.08 08:54 #30050

mytarmailS #:
可以用关联规则来表示吗？

我没有想过这个问题，但我认为不太可能，因为运动的顺序对价格很重要。

为了以防万一，我想用一幅图来说明曼德布罗特的想法。如果可能的话，每个价格变动都会被分成三个变动（通过选择其中的最大修正），然后成为树的一个节点。如果运动中没有修正（或修正小于给定值），则成为树的叶子。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3005