交易中的机器学习:理论、模型、实践和算法交易 - 页 2589

 
mytarmailS# :
https://stats.stackexchange.com/questions/31513/new-revolutionary-way-of-data-mining

这个问题中提出了非常有趣的想法...

顺便说一句,受访者仍然不理解问题的本质

当选择一个模型时,我建议不是通过OOS上的利润来优化,而是通过这个利润与托盘上的利润之比来优化。或者把这种比例小的模型扔掉,从其余的模型中获取最大的OOS利润。这是指如果你按字面意思理解引文,不加推测。

 
Aleksey Nikolayev#:

在选择模式时,建议不要通过OOS上的利润来优化,而是通过这种利润与托盘上的利润之比来优化。或者扔掉这些比率小的模型,从剩下的模型中获取最大的OOS利润。这是指如果你按字面意思理解引文,不加推测。

阿列克谢,能不能给我一段关于利润、最大利润的引述,抛出模型....。

到目前为止,听起来你把它说成是------。
字面意思,没有推测。
 
Aleksey Nikolayev#:

在选择模式时,建议不要通过OOS上的利润来优化,而是通过这种利润与托盘上的利润之比来优化。或者扔掉这些比率小的模型,在OOS的利润方面采取其余模型的最大值。这是指如果你按字面意思理解引文,不加推测。

在我上面的例子中,有硬币和10000人。让正面为1,反面为0。如果我们按照给定的算法行事,我们也会一无所获。在所描述的背景下,这是很容易理解的。换句话说,如果我们遇到了一些优势,那么我们是否在IS和OOS或其他方面获取利润比例就不那么重要了,如果没有优势,那么这种方法就不会有任何作用。


正是如此!我们需要首先评估边缘的存在。然后,我们应该思考如何选择。例如,以下列方式:我们看IS的模型份额按某种指标高于某个阈值。例如,胜率高于55%-45%的模型。按胜率排名,并采取一些TOP。我们是否在OOS的这个顶部检查结果?在选定的模型中,胜率高于55%的模型给出同样的45%(给出这种胜率的模型与所有选定模型的比率)?- 我认为这组模型可以被安全地抛出。如果我们可以看到,这样的顶级模型的选择是有效的,这意味着有一个优势,通过这种效果有多强,我们可以评估模式的质量。它被决定为足够强大。所有进一步的选择都是一个技术问题--即使按同样的胜率、PF,你也不必费心去研究复杂的指标和逻辑,而按胜率和PF直接在IS上进行。

 
mytarmailS#:
阿列克谢,能不能给我一段话,其中说到利润,最大利润,扔掉模型....。

因为到目前为止,这听起来像一个激烈的诽谤,而你宣布像------。
从字面上看,没有推测

我有一个免费的翻译)重点是,最初要训练许多模型,最后要选择一个工作模型(模型评估)。同志称,大家通常会选择只是在OOS上给出最大结果的模型,而这是错误的做法。他的第二句话说明了应该如何做。

如果样本外模型的平均值是样本内得分的一个重要百分比,你就知道你做得很好。这被翻译为最大限度地提高OOS的利润与轨道上的利润之比。

一般来说,如果样本外的结果超过了样本内的50%,你就真的有了收获。这可以转化为放弃那些OOS的利润与traine的利润之比小于0.5的模型。
 

嗯,这是一个模型选择的问题,是的,就像优化一样。你可以想出你自己的主观标准。

如果有一堆参数稍有不同的模型,即允许有变化,但它们都通过了OOS,这并不坏。但它当然不是万能药。

 
Aleksey Nikolayev#:
阿列克谢,有什么技术可以恢复优化面吗?
你运行搜索参数的算法,它发现了一些东西,你用算法的数据来恢复优化面......
我们谈论的是启发式算法,而不是一个完整的搜索自然...
我在网上搜索了一下,但没有结果。
 
mytarmailS#:
Alexey,有没有什么技术可以恢复优化面?
你运行一个参数搜索算法,它发现了一些东西,然后你用搜索算法的数据来重建优化面......
我们谈论的是启发式算法,而不是一个完整的搜索自然...
我在网上搜索了一下,但没有结果。

补充缺失的输入的模型质量指标,约定俗成的是超参数值的集合?好的提升是简单的教学。那需要什么呢?

 
Replikant_mih#:

补充缺失的传入、条件、超参数值集的模型质量度量?好一个简单的训练助推器。那需要什么呢?

也许一个简单的插值可以做到,我们会看到,我想先看看是否有现成的。
为什么?我很确定,如果我看到模型的OP,我可以预测模型是否能在新的数据上发挥作用


 
mytarmailS#:
Alexey,有没有什么技术可以重构优化面?
你运行一个参数搜索算法,它发现了一些东西,然后你用搜索算法的数据来重建优化面......
我们谈论的是启发式算法,而不是一个完整的搜索自然...
我在网上搜索了一下,但没有结果。

在模型参数空间中?这是一个巨大的层面。这只适用于有少量预测因子的非常简单的模型。

如何在一个巨大维度的空间中建立一个曲面,这一点并不十分清楚。与这种维度相比,我们的点数简直少得可怜。除非通过一些降维的可视化,如PCA等,但这一点并不清楚。

 
Maxim Dmitrievsky#:

嗯,这是一个模型选择的问题,是的,就像优化一样。你可以想出你自己的主观标准。

如果有一堆参数稍有不同的模型,即允许有变化,但它们都通过了OOS,这并不坏。但这当然不是万能的。

早些时候,你有一个关于结合标准和自定义指标的想法,我的理解是:用标准指标训练模型,用自定义指标选择模型。