交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2023.08.20 10:55 #31901

Aleksandr Slavskii #:

我想阅读有关机器学习的内容，而这里的幽默大师们正在磨练自己的技能。

我希望能在其他地方看到幽默笑话和其他与主题无关的内容。

现在进入正题。

你写道，你认为市场是随机的，这句话的依据是什么？

您有什么有力的理由来证明市场价格变动的随机性吗？

从信息的角度来看，如果我们比较一下 sb 和报价的信息量，市场就是随机的。几年前我就这么做过。从外行的角度来看--市场会随着时间的推移而变化，模式也会随着时间的推移而变化。

这不是幽默，我支持这样的事件，并愿意参与其中。

Aleksey Vyazmikin 2023.08.20 10:57 #31902

Aleksey Nikolayev #:

那么，你那无数个余额稳步上升的 gif 又是为了什么呢？也许你只是不明白问题的答案？

对我来说，这些 gif 是我所描述的量子截止值使用方法发展的新变体。它表明，针对特定样本的 10 个量子截止点也足以在训练样本上获得正平衡。因此，我说，随机选择第一个量子段（从之前选择的量子段中），可以找到在测试样本和考试样本上天平呈现正增长的序列。因此，有些量子片段只对火车样本有效，而有些量子片段对其他样本也有效。而且，如果它们有如此不同的表现，那么其中一些可能描述了一种稳定的模式，而另一些则描述了一种错误的模式。因此，问题在于，在搜索/创建这些量子片段的阶段，是否有可能选择那些虚假的量子片段。很显然，我所使用的标准不足以过滤出虚假的量子片段。混淆目标的想法本质上是一种测试，用来评估在 SB 上选择量子片段的概率。

这就是为什么我不明白，在这里，我已经在一个随机放置的目标上选择了量子片段，现在我还需要构建一个平衡吗？就像我在图片中展示的那样，用同样的方法，但没有随机化？

只是，从我之前在样本中选取的量子片段中选取量子片段序列的方式本身并不被认为是完整的，而是显示了可能性的潜能。

这就是为什么我不明白为什么以及如何通过平衡进行评估的原因。

Maxim Dmitrievsky 2023.08.20 11:09 #31903

我不记得具体数字了，在亚历山大-薛定谔主题中讨论过这个问题。下面是chatgpt 的答案：

在这种情况下，平均熵将表示为一个等于可能路径数对数的数字。这个数字可以是任何正值，取决于徘徊的步数和每一步的长度。例如，如果随机游走发生在步长为 1、步数为 10 的数轴上，则可能的路径数为 2^10 = 1024，平均熵等于 1024 的对数，即约 6.93。

对于一些报价，平均数字与 sb.

Forester 2023.08.20 11:10 #31904

Aleksey Vyazmikin #:

现在，如果我没记错的话，树中的预测器只命中了一半的范围，而没有寻找最佳分割点？

由于疏忽，通常会分成两半。在 Alglibow 森林中，有一个除以 4 的选项。我将自己的选择范围扩大到了任意增量。我不知道 catbusta 的情况，但事情应该很简单。Cutbust 会在随机点搜索分割点。
在 OOS 上，通常除以一半就能获得最佳模型。当间距较小时，它的再训练速度非常快。

mytarmailS 2023.08.20 11:12 #31905

Maxim Dmitrievsky #:
如果比较一下 sb 和报价的信息量，从信息的角度来看，市场是随机的。我在几年前进行过比较。从外行的角度来看--市场是变化的，模式是随时间变化的。。

如果给你一个记录飞机机翼湍流的数据，而你的测试表明它是随机的（而且会是随机的），那么这个数据能被认为是随机的吗？

该数据能被视为随机的吗？

Maxim Dmitrievsky 2023.08.20 11:15 #31906

mytarmailS #:

如果你得到了记录飞机机翼湍流的数据，而你的测试表明它是随机的（它将会是随机的）。

这些数据能被认为是随机的吗？

我不知道。这不是我的测试，这只是数据中的信息量。也就是说，可预测序列的数量。

我的理解是不能。

Aleksandr Slavskii 2023.08.20 11:17 #31907

Maxim Dmitrievsky chatgpt 的回复：

在这种情况下，平均熵将表示为一个等于可能路径数对数的数字。这个数字可以是任何正值，取决于步数和每个徘徊步数的长度。例如，如果随机游走发生在步长为 1、步数为 10 的数轴上，则可能的路径数为 2^10 = 1024，平均熵等于 1024 的对数，即约 6.93。

对于一些报价，平均数字与 sb.

这是个人经验之谈。

这不可能是侥幸，因为我还有很多类似的图片。

市场不是随机的，这是明确的）。

Maxim Dmitrievsky 2023.08.20 11:19 #31908

Aleksandr Slavskii #:

个人经验之谈

这不可能是侥幸，因为我还有很多类似的照片。

4 次交易没有统计学意义

同样，如果这些是勾选，也很难反驳，因为我还没做过。我对成交价进行了测试。

Aleksey Vyazmikin 2023.08.20 11:21 #31909

Forester #:

在沉默中，它通常被分成两半。在阿尔格里布夫森林中，有一种除以 4 的变体。我已经扩展了以任意增量除法的可能性。我不知道卡特布斯塔是如何做到的，但事情很简单，应该是这样的。Cutbust 可以搜索随机点的分割。
在 OOS 上，通常在除以一半时可以获得最佳模型。当间距较小时，它的再训练速度非常快。

对于 katbusta - 通过量子表，它是过度拟合的:)

也许可以尝试同时使用量子表来实现兼容性？

我附上了一个符合 CatBoost 标准的文件--第一列是预测器编号，第二列是分割。

附加的文件：

Quant_CB_Podbor_00.csv 201 kb

mytarmailS 2023.08.20 11:24 #31910

Aleksandr Slavskii #:

个人经验之谈

这不可能是侥幸，因为我还有很多类似的照片。

市场不是随机的，这是肯定的）。

哦......是的，我也多次想举这个例子，但总是忘了。

交易中的机器学习：理论、模型、实践和算法交易 - 页 3191