交易中的机器学习：理论、模型、实践和算法交易

Maxim Dmitrievsky 2019.02.08 09:07 #13001

阿列克谢-维亚兹米 金。

当应用于一个不熟悉的样本时，模型评估是否不影响模型的性能？

你在做什么，建立一堆不同的模型，并检查哪一个最有效？

这与 "叶子 "和选择最好的叶子等有什么关系？

我只是想了解你在写什么。

还是每一行都对应着一张纸

Aleksey Vyazmikin 2019.02.08 09:18 #13002

马克西姆-德米特里耶夫斯基。

你在做什么？建立一堆不同的模型并检查哪一个最有效？

这与 "叶子 "和选择最佳叶子等有什么关系？

我只是想了解你不时地在写什么。

似乎谈话是关于自动选择模型的，我解释说，可以通过两种方式选择有趣的模型，通过已知的标准和公式（就像我现在做的那样--为每个样本填写最后3列，为每个样本形成一个表格，如果3个过滤列匹配，则选择该模型），或者你可以使用机器学习，当你了解你在独立采样中想要什么模型，但不知道如何实现它。所以对于第二种方式，模型的不同度量指标成为预测器，模型在这些指标上进行训练，通过MO从类似数据中选择合适的模型。那年我也有过类似的培训经历，显示出积极的效果，在准确性方面很好，但在完整性方面就不那么好了，后来我认为我们的样本缺乏多样性，就把这项工作推迟到更好的时候。现在有许多不同的样本正在产生，有可能重新审视这项工作。主要的想法不是从现有的池子里选择最好的，而是按绝对标准选择最好的，无论是MO还是固定指数。

叶子是与选定的模型一起工作。

每条线都是一个独立的模型。

Maxim Dmitrievsky 2019.02.08 09:22 #13003

阿列克谢-维亚兹米 金。

看来谈话是关于自动选择模型的，我解释说可以通过两种方式选择有趣的模型，通过已知的标准和公式（就像我现在做的那样--为每个样本填写最后3列，为每个样本形成这样的表格，如果3个过滤列相吻合，那么模型就被选中），或者通过机器学习，当你明白你在独立样本的工作中想要从模型中得到什么，但不知道如何实现它。所以对于第二种方式，模型的不同度量指标成为预测器，模型在这些指标上进行训练，通过MO从类似数据中选择合适的模型。那年我也有过类似的培训经历，显示出积极的效果，在准确性方面很好，但在完整性方面就不那么好了，后来我认为我们的样本缺乏多样性，就把这项工作推迟到更好的时候。现在有许多不同的样本正在产生，有可能重新审视这项工作。主要的想法不是从现有的池子中选择最好的，而是通过绝对标准选择最好的，无论是MO还是固定指数。

叶子已经在用选定的模型工作。

因此，你就采取了n个模型（如文件中），输入它们的指标作为NS的预测因子，然后得出什么结果？

从经验中得出的一些估计？比如说，对于这样的指标，模型会起作用，但对于这些指标则不会。

然后你通过这些东西过滤新的模型？嗯，就像NS自己选择MI模型一样？

Aleksey Vyazmikin 2019.02.08 10:13 #13004

马克西姆-德米特里耶夫斯基。

也就是说，你然后采取n个模型（如文件中），输入他们的指标作为NS的预测因子，然后得出什么结果？

经验中的一些估计？比如说有这样的指标，模型就能工作，但没有这样的指标就不能工作？

然后你通过这些东西过滤新的模型？嗯，就像NS自己选择MI模型一样？

当我进行实验时，我对测试样本采取了类似的指标，并将测试（独立于训练）样本的结果放入目标样本。目标指标是利润和缩减（分别用于买入和卖出交易），以及模型本身的指标中的其他东西--我不记得具体内容了。现在我需要把训练样本的指标加入到测试样本数据中（当时我还不知道Catbust的结果可能不同），我还需要对目标的那个进行实验。

得到的模型与其他有模型的样本的结果进行了反馈，当时的主要结果是很好地过滤了无利可图的模型。

Maxim Dmitrievsky 2019.02.08 10:19 #13005

阿列克谢-维亚兹米 金。

当我进行实验时，我对测试样本采取类似的指标，并将测试（独立于训练）样本的结果放入目标样本。目标是利润、缩水（分别用于买入和卖出交易）和模型本身的其他东西，我不记得具体内容了。现在，在测试样本数据中，我必须加入训练样本的指标（当时我不知道Catbust的结果可能会有明显的不同），我需要对目标数据进行更多的实验。

这是一个非常奇怪的华丽的解决方案，我从来没有见过这种东西，不能说什么。

但如果工作正常

Aleksey Vyazmikin 2019.02.08 10:40 #13006

马克西姆-德米特里耶夫斯基。

一个非常奇怪的华丽的解决方案，我从来没有见过这样的东西，而且觉得很难说什么。

但如果成功了，就好

我们的想法是，通过模型的结构，它在测试和训练样本上的行为，你可以对实际工作中的行为有一定的预期。

这是一个非常有趣的方向，但需要时间和资源。另一方面，人们可以集体开发并公开交流预测器。

如果你不能从一个模型中说出它的未来表现，那都是在浪费时间--一个机会问题......。

Maxim Dmitrievsky 2019.02.08 10:52 #13007

阿列克谢-维亚兹米 金。

这个想法是，通过模型的结构，它在测试和训练样本上的行为，我们可以对实际工作中的行为有一定的预期。

这是一个非常有趣的方向，但它需要时间和资源。另一方面，人们可以集体开发并公开交流预测器。

如果不能从模型中说出未来的表现，那么所有的MO都是在浪费时间--是一个机会问题......。

随着时间的推移，结果的变化会增加，这一点必须加以考虑。如果模型在新的交易中立即断裂，那么只有这时才是合适的，否则你可以试着把它拧紧。最简单的改进方法是正则化（katbust中的梯度步骤）或直接不调整。

看看人们是如何交易的--各种马丁格尔式的东西。国防部已经给出了某种优势。

我不写复杂的贝叶斯类型的估计模型，因为我自己还没有搞清楚如何使用它们，还有很多东西需要学习和解决。

Aleksey Vyazmikin 2019.02.08 11:03 #13008

马克西姆-德米特里耶夫斯基。

随着时间的推移，结果的传播会增加，这一点必须考虑到。如果在新的交易中模式立即被打破，那么你需要进行微调，否则你可以尝试继续压制

否则就看人们如何交易--所有那些马丁格尔式的东西。MO已经提供了一些优势

昨天我展示了Catbust在叶子（二叉树）中形成的噪音，这些噪音可以被去除，模型将得到改善。我在这个方向上又做了一些实验，增加了过滤，发现在某个阈值之后，会发生一个矛盾的事情--独立样本的改进停止了，但测试和训练样本的改进还在继续。也就是说，在现实中，模型通过在低权重的连接上滚动来保持工作（来自训练的独立样本），实际上是配件，然后有一个问题，要么权重分布不正确，要么模型被过度训练，随机地在白噪声（嗯，不完全是噪声，在二叉树的不太重要的指标上）上工作。我认为也有可能看到这些关系的来源，并在一个简短的考试样本上找出它们的意义。

Maxim Dmitrievsky 2019.02.08 11:06 #13009

阿列克谢-维亚兹米 金。

昨天我展示了Catbust在叶子（二叉树）中产生的噪音，这些噪音可以被去除，模型会得到改善。我在这个方向上做了一些实验，增加了过滤，发现在某个阈值之后，会发生一种矛盾的事情--在独立样本上停止改进，但在测试和训练样本上继续改进。也就是说，在现实中发现，模型在低权重关系上照常工作，实际上是配件，有一个问题是，要么权重分布不正确，要么模型被重新训练，意外地在白噪声（嗯，不完全是噪声，在二叉树的不太重要的指标上）工作。我想你也可以看看这些关系从何而来，并在一个简短的考试样本上确定其意义。

无论你从哪方面挖掘，你都会发现一些虚幻的 "规律性"，你可以在任何现象中找到它们。

让我最高兴的是大量的 "预测器"。引文中的内容会从哪里来？那里有90%的垃圾。

Aleksey Vyazmikin 2019.02.08 11:17 #13010

马克西姆-德米特里耶夫斯基。

我不知道，我不搞树和叶子，也不打算搞......一切都可以在模型本身的层面上完成。

无论你从哪方面挖掘，你都会发现虚幻的 "模式 "无处不在，你可以在任何现象中找到它们。

因此，只要以已知的方式工作。

而我只是受到手工调音的启发--我已经对被动的魔法失去了信心。

我不知道叶子权重的确切算法，但我认为它取决于找到的链接序列，而不仅仅是链接本身，也就是说，如果提升中的一棵新树正在纠正一个错误，那么权重是由错误纠正的delta给出的，而新链接可能比纠正本身更有价值。理想情况下，你应该仔细检查链接和它们的权重，检查参与决策的二进制树的数量，如果有一打树总共给出0.5的概率，那可能是一个薄弱环节...另一方面，你需要考虑树本身的大小（现在我使用深度4，只是为了识别叶子中的短规则）。这只是一个想法，不需要答案 ...

交易中的机器学习：理论、模型、实践和算法交易 - 页 1301