交易中的机器学习:理论、模型、实践和算法交易 - 页 1301

 
阿列克谢-维亚兹米 金。

当应用于一个不熟悉的样本时,模型评估是否不影响模型的性能?

你在做什么,建立一堆不同的模型,并检查哪一个最有效?

这与 "叶子 "和选择最好的叶子等有什么关系?

我只是想了解你在写什么。

还是每一行都对应着一张纸
 
马克西姆-德米特里耶夫斯基

你在做什么?建立一堆不同的模型并检查哪一个最有效?

这与 "叶子 "和选择最佳叶子等有什么关系?

我只是想了解你不时地在写什么。

似乎谈话是关于自动选择模型的,我解释说,可以通过两种方式选择有趣的模型,通过已知的标准和公式(就像我现在做的那样--为每个样本填写最后3列,为每个样本形成一个表格,如果3个过滤列匹配,则选择该模型),或者你可以使用机器学习,当你了解你在独立采样中想要什么模型,但不知道如何实现它。所以对于第二种方式,模型的不同度量指标成为预测器,模型在这些指标上进行训练,通过MO从类似数据中选择合适的模型。那年我也有过类似的培训经历,显示出积极的效果,在准确性方面很好,但在完整性方面就不那么好了,后来我认为我们的样本缺乏多样性,就把这项工作推迟到更好的时候。现在有许多不同的样本正在产生,有可能重新审视这项工作。主要的想法不是从现有的池子里选择最好的,而是按绝对标准选择最好的,无论是MO还是固定指数。

叶子是与选定的模型一起工作。

每条线都是一个独立的模型。
 
阿列克谢-维亚兹米 金。

看来谈话是关于自动选择模型的,我解释说可以通过两种方式选择有趣的模型,通过已知的标准和公式(就像我现在做的那样--为每个样本填写最后3列,为每个样本形成这样的表格,如果3个过滤列相吻合,那么模型就被选中),或者通过机器学习,当你明白你在独立样本的工作中想要从模型中得到什么,但不知道如何实现它。所以对于第二种方式,模型的不同度量指标成为预测器,模型在这些指标上进行训练,通过MO从类似数据中选择合适的模型。那年我也有过类似的培训经历,显示出积极的效果,在准确性方面很好,但在完整性方面就不那么好了,后来我认为我们的样本缺乏多样性,就把这项工作推迟到更好的时候。现在有许多不同的样本正在产生,有可能重新审视这项工作。主要的想法不是从现有的池子中选择最好的,而是通过绝对标准选择最好的,无论是MO还是固定指数。

叶子已经在用选定的模型工作。

因此,你就采取了n个模型(如文件中),输入它们的指标作为NS的预测因子,然后得出什么结果?

从经验中得出的一些估计? 比如说,对于这样的指标,模型会起作用,但对于这些指标则不会。

然后你通过这些东西过滤新的模型?嗯,就像NS自己选择MI模型一样?

 
马克西姆-德米特里耶夫斯基

也就是说,你然后采取n个模型(如文件中),输入他们的指标作为NS的预测因子,然后得出什么结果?

经验中的一些估计? 比如说有这样的指标,模型就能工作,但没有这样的指标就不能工作?

然后你通过这些东西过滤新的模型?嗯,就像NS自己选择MI模型一样?

当我进行实验时,我对测试样本采取了类似的指标,并将测试(独立于训练)样本的结果放入目标样本。目标指标是利润和缩减(分别用于买入和卖出交易),以及模型本身的指标中的其他东西--我不记得具体内容了。现在我需要把训练样本的指标加入到测试样本数据中(当时我还不知道Catbust的结果可能不同),我还需要对目标的那个进行实验。

得到的模型与其他有模型的样本的结果进行了反馈,当时的主要结果是很好地过滤了无利可图的模型。
 
阿列克谢-维亚兹米 金。

当我进行实验时,我对测试样本采取类似的指标,并将测试(独立于训练)样本的结果放入目标样本。目标是利润、缩水(分别用于买入和卖出交易)和模型本身的其他东西,我不记得具体内容了。现在,在测试样本数据中,我必须加入训练样本的指标(当时我不知道Catbust的结果可能会有明显的不同),我需要对目标数据进行更多的实验。

这是一个非常奇怪的华丽的解决方案,我从来没有见过这种东西,不能说什么。

但如果工作正常
 
马克西姆-德米特里耶夫斯基

一个非常奇怪的华丽的解决方案,我从来没有见过这样的东西,而且觉得很难说什么。

但如果成功了,就好

我们的想法是,通过模型的结构,它在测试和训练样本上的行为,你可以对实际工作中的行为有一定的预期。

这是一个非常有趣的方向,但需要时间和资源。另一方面,人们可以集体开发并公开交流预测器。

如果你不能从一个模型中说出它的未来表现,那都是在浪费时间--一个机会问题......。

 
阿列克谢-维亚兹米 金。

这个想法是,通过模型的结构,它在测试和训练样本上的行为,我们可以对实际工作中的行为有一定的预期。

这是一个非常有趣的方向,但它需要时间和资源。另一方面,人们可以集体开发并公开交流预测器。

如果不能从模型中说出未来的表现,那么所有的MO都是在浪费时间--是一个机会问题......。

随着时间的推移,结果的变化会增加,这一点必须加以考虑。如果模型在新的交易中立即断裂,那么只有这时才是合适的,否则你可以试着把它拧紧。最简单的改进方法是正则化(katbust中的梯度步骤)或直接不调整。

看看人们是如何交易的--各种马丁格尔式的东西。国防部已经给出了某种优势。

我不写复杂的贝叶斯类型的估计模型,因为我自己还没有搞清楚如何使用它们,还有很多东西需要学习和解决。
 
马克西姆-德米特里耶夫斯基

随着时间的推移,结果的传播会增加,这一点必须考虑到。如果在新的交易中模式立即被打破,那么你需要进行微调,否则你可以尝试继续压制

否则就看人们如何交易--所有那些马丁格尔式的东西。MO已经提供了一些优势

昨天我展示了Catbust在叶子(二叉树)中形成的噪音,这些噪音可以被去除,模型将得到改善。我在这个方向上又做了一些实验,增加了过滤,发现在某个阈值之后,会发生一个矛盾的事情--独立样本的改进停止了,但测试和训练样本的改进还在继续。也就是说,在现实中,模型通过在低权重的连接上滚动来保持工作(来自训练的独立样本),实际上是配件,然后有一个问题,要么权重分布不正确,要么模型被过度训练,随机地在白噪声(嗯,不完全是噪声,在二叉树的不太重要的指标上)上工作。我认为也有可能看到这些关系的来源,并在一个简短的考试样本上找出它们的意义。

 
阿列克谢-维亚兹米 金。

昨天我展示了Catbust在叶子(二叉树)中产生的噪音,这些噪音可以被去除,模型会得到改善。我在这个方向上做了一些实验,增加了过滤,发现在某个阈值之后,会发生一种矛盾的事情--在独立样本上停止改进,但在测试和训练样本上继续改进。也就是说,在现实中发现,模型在低权重关系上照常工作,实际上是配件,有一个问题是,要么权重分布不正确,要么模型被重新训练,意外地在白噪声(嗯,不完全是噪声,在二叉树的不太重要的指标上)工作。我想你也可以看看这些关系从何而来,并在一个简短的考试样本上确定其意义。

无论你从哪方面挖掘,你都会发现一些虚幻的 "规律性",你可以在任何现象中找到它们。

让我最高兴的是大量的 "预测器"。引文中的内容会从哪里来?那里有90%的垃圾。

 
马克西姆-德米特里耶夫斯基

我不知道,我不搞树和叶子,也不打算搞......一切都可以在模型本身的层面上完成。

无论你从哪方面挖掘,你都会发现虚幻的 "模式 "无处不在,你可以在任何现象中找到它们。

因此,只要以已知的方式工作。

而我只是受到手工调音的启发--我已经对被动的魔法失去了信心。

我不知道叶子权重的确切算法,但我认为它取决于找到的链接序列,而不仅仅是链接本身,也就是说,如果提升中的一棵新树正在纠正一个错误,那么权重是由错误纠正的delta给出的,而新链接可能比纠正本身更有价值。理想情况下,你应该仔细检查链接和它们的权重,检查参与决策的二进制树的数量,如果有一打树总共给出0.5的概率,那可能是一个薄弱环节...另一方面,你需要考虑树本身的大小(现在我使用深度4,只是为了识别叶子中的短规则)。这只是一个想法,不需要答案 ...