Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, ее могут использовать все желающие. Для работы с CatBoost достаточно установить...
https://www.searchengines.ru/yandeks-vylozhil-v-dostup-biblioteku.html
R包在那里,太好了。
安装 -https://tech.yandex.com/catboost/doc/dg/concepts/r-installation-docpage/
1)预装Visual C++ 2015构建工具 -http://landinghub.visualstudio.com/visual-cpp-build-tools
为什么是R,我不喜欢它......命令行或dll :)
我做了一个神经网络回归预测器,它显示了当前价格预测模型的柱状图,用于预测未来的n个柱子(本例中为15个),训练了5000个柱子,每500个柱子重新训练。一看就很好,当然它的工作速度没有我想的那么快,因为我其实想训练他们几个人:)
因此,如果你看一下会议记录--差异相当小,当然它在极端排放上可能很高,但平均在100点(5位数)范围内。
我已经用箭头圈出了最美味的东西
不像我希望的那样快速工作。
在ALGLIB上?
在ALGLIB上?
是的
当然,你可以用外部NS或脚手架得到扭曲,例如GPU上的CatBoost,但我太懒了,没有时间去做。
这一切都归结于速度,你的速度越高,就越难在测试器中运行它。
ALGLIB是一个可怕的学习制动器。
在ALGLIB上提供了240-50-1的净值--等了2天,没等来就关闭了。
我在半小时内训练了70-5-1网络。而来自R的nnet用同样的数据训练了不到1分钟。现在我正试图用R来解决这个问题。
ALGLIB是一个可怕的学习制动器。
在ALGLIB上提供了240-50-1的净值--等了2天,没等来就关闭了。
我在半小时内训练了70-5-1网络。而来自R的nnet用同样的数据训练了不到1分钟。所以现在我坐在这里处理R的问题。
射频或多或少,50个输入5000个,100棵树,平均25秒(在笔记本电脑上)。但对于优化来说,它也是非常长的。NS真的很慢,但它是普通的MLP,你不应该对它有任何期待。
我需要它最多在一秒钟内学会所有东西,在哪里可以得到它?)
我再次确信,脚手架不能推断,不管这里有多少人感叹它不能推断。
红线以上的150个训练价格(进场和出场)。之后,市场开始下跌,出现了新的价格,这些价格不在训练样本中(没有被输入到输出中)。森林开始产生他们在训练时知道的最低价格作为预测,即1.17320,这对应于水平线。这导致残差直方图也出现了偏斜。
森林不知道如何 进行探险。所有聪明的人都被留在第二年,重新学习数学。
- 就像决策树一样,该算法完全无法进行推断。
http://alglib.sources.ru/dataanalysis/decisionforest.php没有任何转换的价格不会被送入模型。
外推的脚手架采取最近的已知值。外推法中的神经元或标尺会根据内部公式计算出一些东西。但实际上所有这些模型在这种情况下都会合并,所以没有什么区别。