Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, ее могут использовать все желающие. Для работы с CatBoost достаточно установить...
https://www.searchengines.ru/yandeks-vylozhil-v-dostup-biblioteku.html
Rパッケージがある、素晴らしい。
installation -https://tech.yandex.com/catboost/doc/dg/concepts/r-installation-docpage/
1) Visual C++ 2015 Build Toolsのプリインストール -http://landinghub.visualstudio.com/visual-cpp-build-tools
なぜR、私はそれを掘ることはありません...コマンドラインまたはDLL :)
ニューラルネットワークの回帰予測器を作りました。n本先(この場合は15本先)の現在の価格予測モデルのヒストグラムを表示し、5000本分の学習を行い、500本ごとに再学習を行います。一見良さそうに見えますが、実は何人か育成したいので、当然ながらそんなに早くは動きません :)
それで、議事録を見てみると......かなり分散が小さく、もちろん極端に排出量が多いこともありますが、平均すると100ポイント(5桁)台です。
一番おいしかったものを矢印で囲みました。
思うように動作しない。
ALGLIBで?
ALGLIBで?
うん
もちろん、外部のNSや足場、例えばCPUのCatBoostなどで 工夫することはできますが、私はあまりに怠惰で時間がないので、そのようなことはできません。
結局はスピードの問題で、速くなればなるほど、テスターで動かすのは難しくなります。
ALGLIBは学習に対するブレーキとして最悪です。
ALGLIBで240-50-1 netを提供 - 2日待ち、待たずにシャットダウン。
70-5-1のネットワークを30分でトレーニングしました。また、Rのnnetは、同じデータで1分以内に学習できました。今、Rで考えているところです。
ALGLIBは学習に対するブレーキとして最悪です。
ALGLIBで240-50-1 netを提供 - 2日待ち、待たずにシャットダウン。
70-5-1のネットワークを30分でトレーニングしました。また、Rのnnetは、同じデータで1分以内に学習できました。だから今、私はここに座ってRと向き合っているのです。
RFは多かれ少なかれ、5000の50入力、100の木、平均25秒(ラップトップで)。しかし、最適化のためには、それも非常に長くなります。NSは本当に遅いけど、普通のMLPだから期待しない方がいい。
最大で1秒以内にすべてを学習させたいのですが、どこで手に入りますか?)
足場は外挿できないと、ここでいくら叫んでも、改めて確信した。
赤い線の上 150のトレーニング価格(エントリーとエグジット)。その後、相場が下がり始め、学習サンプルにない(出力に与えられない)新しい価格が現れました。Forestは、学習した時点で知っていた最安値、つまり水平線に相当する1.17320を予測値として出すようになったのです。そのため、残差のヒストグラムも歪んでしまった。
森は "探索 " を知らない。賢い人はみんな2年目に残って、数学を勉強し直すんです。
- 決定木と同じように、このアルゴリズムも外挿が全くできない
http://alglib.sources.ru/dataanalysis/decisionforest.php変換を伴わない価格は、モデルには投入されません。
外挿のための足場は、最も近い既知の値を取る。外挿のニューロンや定規は、内部の計算式に従って何かを計算する。しかし、実際にはこれらのモデルはすべてこの状況で合体するわけですから、違いはありません。