交易中的机器学习：理论、模型、实践和算法交易

Andrey Dik 2016.12.01 07:38 #2341

Vizard_。
我看到他们已经开始写关于r的书了））））。
allitebooks.com/automated-trading-with-r-2/。

它的拳头是开始写关于 "如何赚钱 "的书，然后这种方法要么不再起作用，要么以前从未起作用。然而，一个指标。也就是说，当一本书中对某一方法的描述比该方法本身更能赚钱时。

Jaws 2016.12.01 08:50 #2342

Vizard_。
为了运动，我超越了一点，我就不说了。资源自由一点，根本不想，也没有。

只支持 "分行入场券 "的想法。< 0.69，据猜测，没有太大的问题，可以摆脱。< 0.68 不知道，你必须考虑一下））））。

https://numer.ai

请告诉我，什么模式，你是怎么学会的？

СанСаныч Фоменко 2016.12.01 08:59 #2343

lucky_teapot:
请告诉我是哪个模型，是怎么教的？

类别预测误差小于30%。它可以远远低于30%，但低于20%是不可能实现的。但有充分的理由说，这个模型没有被过度训练。重要的是，它没有被过度训练--一个过度训练的模型根本不需要，是危险的垃圾。

模型：随机森林和阿达。一般来说，模型的选择对结果没有什么影响，如果它被训练的话。在我的预测器上，nnet根本就没有被训练。

Jaws 2016.12.01 09:01 #2344

桑桑尼茨-弗门科。

类别预测误差小于30%。它可以远远低于30%，但低于20%是不可能实现的。然而，我们有充分的理由相信，该模型没有被重新训练。最主要的是不要过度训练--过度训练的模型根本就不需要，是危险的垃圾。

模型：随机森林和阿达。一般来说，模型的选择对结果影响不大，如果它是可训练的。在我的预测器上，nnet根本没有被训练。

你那里有什么样的logloss？

СанСаныч Фоменко 2016.12.01 09:03 #2345

lucky_teapot:
你那里有什么样的logloss？

什么是logloss？

Jaws 2016.12.01 09:08 #2346

桑桑尼茨-弗门科。

类别预测误差小于30%。发生率远低于30%，但低于20%的情况无法实现。然而，我们有充分的理由相信，该模型没有被重新训练。最主要的是不要过度训练--过度训练的模型根本就不需要，是危险的垃圾。

模型：随机森林和阿达。一般来说，模型的选择对结果影响不大，如果它是可训练的。在我的预测器上，nnet根本没有被训练。

桑桑尼茨-弗门科。
什么是logloss？

我猜你说的是你在https://numer.ai，但不是用loglose，而是用哈希（%误差）。但loglose 是个棘手的东西，你不仅要猜测类，还要猜测概率。

СанСаныч Фоменко 2016.12.01 09:16 #2347

lucky_teapot:

我理解你在https://numer.ai，但不是以logloss而是以hemming（%误差）来谈论你的仪表，但logloss 是个棘手的东西，你不仅需要猜测等级，还需要猜测概率。

我在写我的EA。它有一个模型。

我使用软件包，它们有一个粗略的估计，这与logloss没有关系。此外，软件包的结果可以通过其他手段进行估计....。我不记得loglos了。

而类，在我看到的那些软件包中，是由概率衍生出来的，也就是说，在现实中，概率是被计算出来的，然后被校准。它的标准是两个班级各占一半，但你可以进入和转向。

Jaws 2016.12.01 09:52 #2348

桑桑尼茨-弗门科。

我在写我的EA。它里面有一个模型。

我使用软件包，其中有一个估值，一看就知道与loglos无关。此外，软件包的结果可以通过其他手段进行评估....。我不记得loglos了。

而类，在我看到的那些软件包中，是由概率派生出来的，也就是说，在现实中，概率是被计算出来的，然后再进行校准。它的标准是两班各一半，但你可以进入和转向。

那就不能说什么了，至少你需要一个数据集，你在这个数据集上得到了这样的结果。Loglos我同意，对于我们的情况来说，这并不是真正正确的选择，这是对kaggle的致敬，没有经过重新训练的20-30%的准确性误差，这在我听来非常强大，坦白说我很难相信。

对于loglos，诀窍是，例如对于两个班级，如果你有0%的错误，那么答案的概率将接近100%和0%，{0,1,0,1....}。当误差为10%时，它不仅影响到错误答案的概率，也影响到正确答案的概率，所以那些正确答案，原来是1和0，现在应该是例如0.8和0.2，当误差为45%时，一切都应该在0.5+-0.1左右震荡，所以对数损失将是最佳的，这样的炼金术....

mytarmailS 2016.12.01 10:27 #2349

Dr.Trader:

刚好看到lucky_teapot的资料，论坛上有一个主题，里面有一个文章的链接。我认为整个事情是从mql4.com论坛转过来的，我几乎没有研究过这个论坛，如果真的是从那里转过来的，那就感谢MetaQuotes。
这篇文章几乎是9年前的了，但我发现很多有用的东西，现在不妨试试。我想我甚至理解了维度滞后空间，关于这一点阿列克谢已经在这个主题中说过几次了。
这篇文章本身，我觉得非常有用 -https://www.mql5.com/ru/articles/1506

我读了...我对一件事很感兴趣，作者说，你可以对数据进行一些修改，从而增加样本，然后模型会更好地工作，因为模型的知识基础会更广泛...

我正在处理价差问题，与总样本相比，价差仍然很小

我认为，如果我们抽出一个百万分之一的样本，并教模型捕捉反转，会有很多例子，我认为反转的模式在两个市场都是一样的（我是说很多模式）。

在这里，我有另一个问题，或者说是一个想法，但还没有解决方案......

我想，如果我们把所有的反转从这几百万个值中分离出来，只留下这些作为训练样本，模型将只学习反转本身，这是如此之快，但当我们需要在新的数据中区分反转和非反转时，如果模型不知道什么是非反转，它将如何做？((.

СанСаныч Фоменко 2016.12.01 10:41 #2350

mytarmailS:

我读了...我对一件事很感兴趣，作者说，你可以对数据进行一些修改，从而增加样本，然后模型会更好地工作，因为模型的知识基础会更广泛...

我正在处理逆转的问题，与总的样本相比，逆转的数量仍然很少。

什么是支点？像ZZ那样的一个酒吧？

我真的很喜欢这个想法（在这里钓出来的线），当反转被认为是某一序列的条形，之后，在未来，将有一个预定的利润。这种方法将大大减少阶层的不平衡。那是一个。二，这个班级本身会有一个明确的预测属性。

交易中的机器学习：理论、模型、实践和算法交易 - 页 235