交易中的机器学习:理论、模型、实践和算法交易 - 页 1957

 
elibrarius:

这就对了。立即描述行动的顺序是个好主意...
再次思考你的描述,我认为有以下顺序。

1.计算所有预测器在训练中的相关性
2.建立树
3.在最后一次劈叉时,要记住例如最后100次的最佳劈叉。储存到100个,以便有足够的选择。
4.从这100个中选择5个与最佳分割的预测器不相关且相互不相关的。

此外,也不清楚在这5种不同的分割中选择哪一种?
如果是随机的,那么它就类似于随机森林,它给每棵树随机的预测因子,并在此基础上建立一棵树。
如果是平均数,那么又是随机森林的类似物,那么森林从随机树中找到算术平均值。

现在你说对了!

这就是为什么随机森林 是随机的,它们充满了垃圾,上面描述的条件不一定是真的,尽管可能有类似的情况,而且有可能一个成功的模型会产生于类似的那种分解。然而,在这里,将有一个更受控制的过程。

当然,片中每个分割的权重都会被权衡,也许我们会给出相同的系数,我们可以在相同的历史上拾取系数。这就是我现在一般在用树叶组装模型时的做法。

 
Valeriy Yastremskiy:

呐,类似的动作有和、减、乘、除,可能还有更复杂的对数依赖,以及幂。而且这些不是计算,而是每个单元的模拟量表。而DAC和ADC是一种输入输出,它们不参与计算,而是提供数字。

在诺伊曼架构中,程序和数据都存储在内存中,没有对程序和数据的并行访问;先访问数据,再访问程序,然后再回到数据,因此数据处理受到限制。而这里的程序是通过小设备存储在每个单元中的,并且有一个对程序的访问,同时也有对数据的访问。

这里有一个我不明白的数据,是不是有条件地讲,每条指令都可以直接访问内存和计算结果,而不需要传送器?

 
Aleksey Vyazmikin:

现在你说对了!

随机森林是随机的,因为它充满了垃圾,所描述的条件不一定满足,尽管可能有类似的情况,而且有可能通过类似的分解得到一个成功的模型。然而,在这里,将有一个更受控制的过程。

当然,片中每个分割的权重都会被权衡,也许我们会给出相同的系数,我们可以在相同的历史上拾取系数。我现在就是这样做的,一般来说,在用树叶组装模型的时候。

我不明白最后一步,即在5个分体中选择哪个?
 
elibrarius:
我不明白最后一步--在5个拆分中选择哪个?

所有5个分片的读数都要考虑在内,这增加了稳定性。

假设最好的分裂被赋予0.6的权重,其他四个被赋予各0.1的权重,如果总和给出0.8或其他分数,由抽样决定,那么答案就是真正的 "1 "或表单中预期的其他类。

我们还需要检查召回率,也就是说,在这个子样本上,拆分有多少召回率。
 
Aleksey Vyazmikin:

我不明白的是,这些数据是名义上的,每条指令都可以直接访问内存和计算结果,没有传送带?

没有 "数据",只有电子,其电流由晶体管等控制。NS架构本身是印在板子上的,不是数字形式的。他们长期以来一直在以协处理器的形式制造这种模拟神经网络,例如在iPhone中。

这篇文章中没有任何新内容。
 
Maxim Dmitrievsky:

没有 "数据",只有电子,其电流由晶体管控制,如此而已。NS架构本身是印在板子上的,不是数字形式的。他们长期以来一直在以协处理器的形式制造这种模拟神经网络,例如在iPhone中。

这篇文章中没有任何新内容。

而且我明白,我们谈论的是动态计算,而不是静态的、预先确定的。

 
Aleksey Vyazmikin:

而我的理解是指动态计算,而不是静态的、预先确定的计算。

例如,来自iPhone相机矩阵的信号被直接送入模拟NS,绕过了数字化处理。NS对图像进行预处理以提高质量(过滤掉噪音等)。

然后将其转换为数字图片

 
Aleksey Vyazmikin:

我的理解是,我们谈论的是动态计算,而不是静态的、预先确定的计算。

一个粗略的比喻是电子闸阀和压缩机。当然,细胞中的设备是静态的,但它们有很多,而且可以并行访问它们)而且计算可以是动态的,如果我们改变输入信号,我们会得到动态的输出。

 
Aleksey Vyazmikin:

应考虑到所有5个分体的读数,这增加了稳定性。

假设我们把0.6的权重给了最好的分割,把0.1的权重给了其他四个,如果总和给出了0.8或其他一些数值,由抽样决定,那么我们就假设答案是真正的 "1 "或工作表中预期的其他类别。

你还需要检查召回率,即分片对该子样本的召回率是多少。
最干净的分裂将与不太干净的分裂混在一起。也就是说,我们恶化了托盘上的结果,这在原则上并不重要。但不确定它是否会改善测试的结果,即普适性。有人应该试试...就个人而言,我不认为泛化会比脚手架的情况好。

限制树的深度,不做最后的分割,在前一个分割处停止,这就容易多了。我们最终会得到同样不那么清晰的床单,比起我们做一个额外的分割。无论我们是否进行拆分,你的选择都会在两者之间提供一些东西。例如,你将用你的方法在第7层的深度上对板材进行平均。它将比第6个深度水平表略为干净。我认为这个概括不会有太大的变化,而且要检验这个想法是很费事的。你也可以对几棵深度为6和7的树进行平均--你会得到与你的方法差不多的结果。
 
Aleksey Vyazmikin:

本质上是对波浪的某种作用?传入的数据被转换为多项式,然后多项式被转换为波,这些波以某种方式被 "碰撞/合并 "了?

嗯,是的。

以前曾有过制造模拟计算机的尝试,但它们要么非常缓慢,要么非常耗能。