交易中的机器学习：理论、模型、实践和算法交易

СанСаныч Фоменко 2023.08.31 08:42 #32101

mytarmailS #:

为了避免偷看，Forester 说得很对，在循环的每次迭代中，你都应该在不偷看的情况下计算预测值。

这就是解决方案。

以 ZZ 为例，这是显而易见的。

但在没有 ZZ 的情况下，我经常能得到小于 10% 的分类误差。结果就是垃圾。把它扔了。

Maxim Dmitrievsky 2023.08.31 08:43 #32102

СанСаныч Фоменко #:

你不可能像马克西姆那样，在 INE 文件上运行并快乐地生活，因为它有非常美丽的图片。

你会在梦中梦见很多东西

СанСаныч Фоменко 2023.08.31 08:43 #32103

Maxim Dmitrievsky #:
我对解决别人的精神问题不感兴趣。

你负责的是漂亮的图片，即使是在市场上。所以这是你的主要问题

Maxim Dmitrievsky 2023.08.31 08:45 #32104

СанСаныч Фоменко #:

即使在市场上，你也要负责漂亮的图片。这就是你的主要问题

我没有任何问题，包括心理问题。如果你想创造它们，那就试试吧。

Maxim Dmitrievsky 2023.08.31 10:38 #32105

一个简单的计算方法是，特征选择是从一堆杂乱无章的信息中进行的，而这些信息往往与研究对象无关。

得出的 BP 都与此 BP 相关，你只能选择更好/更差，而这往往毫无意义。

我不是在说偷看，这些都是一些幼稚的问题。显然，这些年来，这样的忽悠毫无结果。但他们还是坚持重复。

甚至在样本中也会出错，因为你根本无法正确标记交易。

在新的数据中，可能会出现一些变种，如趋势导致的偏差，或对不可预测的波动、混乱进行再训练。通过使用 cv 方法对模型误差进行校正可以解决这个问题。

您的文章中哪里提到过简单有效的纠错方法？

让我猜猜：在 P 红宝书中没有指向这种神圣知识的箭头，而且我们不习惯谷歌和思考:)。

СанСаныч Фоменко 2023.08.31 11:08 #32106

Maxim Dmitrievsky #:

一个简单的计算方法是，特征选择是从一堆杂乱无章的信息中进行的，而这些信息往往与研究对象无关。

得出的 BP 都与此 BP 相关，你只能选择更好/更差，而这往往毫无意义。

我不是在说偷看，这些都是一些幼稚的问题。显然，这些年来，这样的忽悠毫无结果。但他们还是坚持重复。

甚至在样本中也会出错，因为你根本无法正确标记交易。

在新的数据中，可能会出现一些变种，如趋势导致的偏差，或对不可预测的波动、混乱进行再训练。通过使用 cv 方法修正模型误差可以治愈。

您的文章中哪里提到过简单有效的纠错方法？

CV 误差不是通过其意义来治愈的，因为它是一种误差最小化的最佳参数搜索。如果教师和他的预测因子是错误相关的，CV 必然会在这些垃圾中找到更好的东西，但它并不能解决垃圾问题。

解决垃圾问题的方法是 "预测能力"，即预测值预测一类或另一类的能力。那么很明显，分类误差是由以下事实决定的：相同的预测值在某些时刻预测一类，而在其他时刻预测另一类。 Rattle 甚至有关于这个主题的图片。

Maxim Dmitrievsky 2023.08.31 11:10 #32107

СанСаныч Фоменко #:

CV 并不能根治其意义上的错误，因为它是一种误差最小化的最佳参数搜索。如果教师和他的预测因子之间存在虚假相关，CV 当然能从这些垃圾中找到更好的东西，但它不能解决垃圾问题。

解决垃圾问题的方法是 "预测能力"，即预测值预测一类或另一类的能力。很显然，分类误差是由以下事实决定的：相同的预测值在某些时刻预测一类，而在其他时刻预测另一类。 Rattle 甚至有关于这个主题的图片。

所以呢？不要寻找相关性，通过随机化和 cv 寻找因果关系。还是要我教你特弗？

如果不进行误差修正，几乎所有固定样本模型都会有缺陷。因为你不知道如何标注图表。如果你会，但你不会不管你怎么想，你都会随机地把较小的部分总是正确地标注出来。

fxsaber 2023.08.31 11:42 #32108

СанСаныч Фоменко #:

上面提到的问题是，有一个模型在训练文件和 OOS 文件上都取得了很好的结果。据我所知，训练文件甚至可以通过逐个样本的随机抽样获得，而 OOS 是训练文件的残差。

但当在外部文件上运行该模型时，结果却非常糟糕。

我想我最近已经多次提到过 OOS。但你所说的 "独立文件 "才是好的 OOS。

SanSanych Fomenko#:

如何检测前瞻性？

如果是多路学习（下一阶段使用上一阶段的计算结果），"前瞻 "的概率就会很高。没有通用的方法，但我在一个案例中采用了以下方法。

为了加快计算速度，有必要去掉不必要的刻度。例如，如果将刻度数减少 10 倍，计算速度也会相应加快。这是很有必要的。

就我而言，我知道哪些刻度需要，哪些几乎不需要。总之，我创建了一个自定义符号，并开始对自定义符号和原始符号进行回溯测试。

在这里，开启 "书呆子 "精神并实现大于 99% 的匹配非常重要。结果发现，一开始我抛出了太多，得到了不同的结果（当然，比原来的要好）。

最后，我开始比原来扔得少，一切都开始匹配了。也就是说，我在训练时实际上使用的是两遍法。

因此，要想在前一遍之后检测到偷看，你甚至可以在认真计算之前使用上述检查方法。此外，还有一种老祖宗发明的方法--"好得不像真的"。初学者会为这样酷的结果而欢欣鼓舞，而成熟的人则会因为意识到他们将不得不长期寻找自己的错误而感到沮丧。

mytarmailS 2023.08.31 12:00 #32109

fxsaber #:

新手们为很酷的结果感到高兴，成熟的人则感到沮丧，因为他们意识到，他们将不得不在很长一段时间内寻找自己的错误。

而专业人士则用怜悯和居高临下的眼光看着他们，悄悄地对自己说：你们什么时候才会想到改变概念，而不是改变场景？

fxsaber 2023.08.31 12:01 #32110

mytarmailS #:

专业人员...

我一个都没见过

交易中的机器学习：理论、模型、实践和算法交易 - 页 3211