트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 514

 
Яндекс выложил в открытый доступ новую библиотеку машинного обучения
Яндекс выложил в открытый доступ новую библиотеку машинного обучения
  • 2017.07.18
  • Оксана Мамчуева
  • www.searchengines.ru
Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, ее могут использовать все желающие. Для работы с CatBoost достаточно установить...
 

R용 패키지가 있습니다.


2)
install.packages('devtools')
devtools::install_github('catboost/catboost', subdir = 'catboost/R-패키지')

 

하지만 왜 R, 나는 그것을 소화 할 수 없습니다 .. 명령 줄 또는 dll :)

 

신경망 회귀 예측기를 흐리게 처리하고 n개의 막대(이 경우 15개)에 대한 현재 가격 모델 예측을 히스토그램으로 표시하고 5000개 막대에 대해 훈련하고 500개마다 다시 훈련합니다. 언뜻 보기에는 좋아 보이지만 실제로 원하는 만큼 빠르게 작동하지 않습니다. 왜냐하면 실제로는 이 중 몇 개를 원하고 다른 NN을 훈련하기 때문입니다. :)


글쎄요, 그래서 분을 보면 - 다소 작은 분산, 물론 극한 방출에서 높지만 평균적으로 100p(5번째 기호) 범위에 들어갑니다.

화살표로 가장 맛있는 동그라미

 
막심 드미트리예프스키 :

물론 우리가 원하는 만큼 빠르게 작동하지는 않습니다.

ALGLIB에서?

 
도서관 :

ALGLIB에서?


물론 GPU의 CatBoost 와 같이 외부 NS 또는 포리스트로 변태할 수 있지만 지금까지는 게으르고 시간이 없습니다.

모든 것은 속도에 달려 있습니다. 정확도가 높을수록 테스터에서 제거하는 것이 더 비현실적입니다.

 

ALGLIB는 학습에 대한 끔찍한 제동입니다.

ALGLIB 네트워크 240-50-1에서 제공, - 2일 기다렸다가 기다리지 않고 껐습니다.

네트워크 70-5-1은 30분 만에 훈련되었습니다. 그리고 R의 nnet은 1분 미만 동안 동일한 데이터로 훈련되었습니다. 여기 R과 함께 앉았습니다. 이해합니다.

 
도서관 :

ALGLIB는 학습에 대한 끔찍한 제동입니다.

ALGLIB 네트워크 240-50-1에서 제공, - 2일 기다렸다가 기다리지 않고 껐습니다.

네트워크 70-5-1은 30분 만에 훈련되었습니다. 그리고 R의 nnet은 1분 미만 동안 동일한 데이터로 훈련되었습니다. 여기 R과 함께 앉아 있습니다. 이해합니다.


RF 다소간, 5000개의 입력 50개, 트리 100개, 평균 25초(노트북에서). 그러나 최적화를 위해 또한 매우 깁니다. NS 브레이크 카펫 네, 하지만 이것은 그에게서 평범한 MLP입니다. 다른 것을 기대할 수는 없습니다.

최대 1초 동안 모든 것을 배워야 합니다. 어디서 얻을 수 있나요? )

 

다시 한 번 나는 숲이 아무리 외설적으로 외삽할 수 없다는 것을 확신하게 되었습니다.

빨간색 선 위의 150 교육 가격(진입 및 퇴장). 그 후 시장이 하락하기 시작했고 훈련 샘플에 없는 새로운 가격이 나타났습니다(종료를 위해 제출되지 않았습니다). 숲은 훈련 당시 그들에게 알려진 최저 가격, 즉 예측으로 발행하기 시작했습니다. 1.17320, 수평선에 해당합니다. 이 때문에 잔차의 히스토그램이 왜곡되었습니다.

은 외삽하지 않습니다. 모든 현자는 재료를 다시 배우기 위해 2년 동안 남아 있습니다.


  • 의사 결정 트리와 마찬가지로 알고리즘은 완전히 외삽할 수 없습니다.
http://alglib.sources.ru/dataanalysis/decisionforest.php
 

모델로의 변환이 없는 가격은 제출되지 않습니다.

외삽을 위한 포리스트는 가장 가까운 알려진 값을 사용합니다. 외삽할 때 뉴런이나 눈금자는 내부 공식에 따라 무언가를 계산합니다. 하지만 실제로는 이 모든 모델이 이 상황에서 병합되므로 차이가 없습니다.