交易中的机器学习:理论、模型、实践和算法交易 - 页 514

 
Яндекс выложил в открытый доступ новую библиотеку машинного обучения
Яндекс выложил в открытый доступ новую библиотеку машинного обучения
  • 2017.07.18
  • Оксана Мамчуева
  • www.searchengines.ru
Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, ее могут использовать все желающие. Для работы с CatBoost достаточно установить...
 

R包在那里,太好了。


2)
install.packages('devtools')
devtools::install_github('catboost/catboost', subdir = 'catboost/R-package')

 

为什么是R,我不喜欢它......命令行或dll :)

 

我做了一个神经网络回归预测器,它显示了当前价格预测模型的柱状图,用于预测未来的n个柱子(本例中为15个),训练了5000个柱子,每500个柱子重新训练。一看就很好,当然它的工作速度没有我想的那么快,因为我其实想训练他们几个人:)


因此,如果你看一下会议记录--差异相当小,当然它在极端排放上可能很高,但平均在100点(5位数)范围内。

我已经用箭头圈出了最美味的东西

 
马克西姆-德米特里耶夫斯基

不像我希望的那样快速工作。

在ALGLIB上?

 
elibrarius:

在ALGLIB上?


是的

当然,你可以用外部NS或脚手架得到扭曲,例如GPU上的CatBoost,但我太懒了,没有时间去做。

这一切都归结于速度,你的速度越高,就越难在测试器中运行它。

 

ALGLIB是一个可怕的学习制动器。

在ALGLIB上提供了240-50-1的净值--等了2天,没等来就关闭了。

我在半小时内训练了70-5-1网络。而来自R的nnet用同样的数据训练了不到1分钟。现在我正试图用R来解决这个问题。

 
elibrarius

ALGLIB是一个可怕的学习制动器。

在ALGLIB上提供了240-50-1的净值--等了2天,没等来就关闭了。

我在半小时内训练了70-5-1网络。而来自R的nnet用同样的数据训练了不到1分钟。所以现在我坐在这里处理R的问题。


射频或多或少,50个输入5000个,100棵树,平均25秒(在笔记本电脑上)。但对于优化来说,它也是非常长的。NS真的很慢,但它是普通的MLP,你不应该对它有任何期待。

我需要它最多在一秒钟内学会所有东西,在哪里可以得到它?)

 

我再次确信,脚手架不能推断,不管这里有多少人感叹它不能推断。

红线以上的150个训练价格(进场和出场)。之后,市场开始下跌,出现了新的价格,这些价格不在训练样本中(没有被输入到输出中)。森林开始产生他们在训练时知道的最低价格作为预测,即1.17320,这对应于水平线。这导致残差直方图也出现了偏斜。

森林不知道如何 进行探险。所有聪明的人都被留在第二年,重新学习数学。


  • 就像决策树一样,该算法完全无法进行推断。
http://alglib.sources.ru/dataanalysis/decisionforest.php
 

没有任何转换的价格不会被送入模型。

外推的脚手架采取最近的已知值。外推法中的神经元或标尺会根据内部公式计算出一些东西。但实际上所有这些模型在这种情况下都会合并,所以没有什么区别。