トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2944

 
Aleksey Vyazmikin #:

何とも言えない)数学はこのビデオで見ることができる

いや、空白だ。ブースティングのことを言うのを忘れていた。

 
Stanislav Korotky #:

樹上の分類のアルゴリズム(PDFへのリンク可)において、以下の式がどのように得られるか説明してください:


私がインターネットで見つけたすべての資料では、式は魔法のように「天井から取ってきた」だけです。

クラスで要約する場合、分母はジニ指数またはノードの純度である。小さければ小さいほどよい。分子にはシートの行数を入れる。

この基準は大きければ大きいほど良い-クラスはよりきれいに分けられるが、シートの過剰な切り取りはない。

ジニ指数は、分類エラー率よりも敏感であると考えられるので、選ばれたようです。

 
Aleksey Nikolayev #:

クラス別にまとめると、分母はジニ指数またはノードの純度である。小さいほど良い。分子はシートの行数。

この基準は大きければ大きいほどよい-クラスはよりきれいに分離されるが、シートが過度に破砕されることはない。

ジニ指数は、分類エラー率よりも敏感であると考えられるので、選ばれたようである。

いいえ、ノードにヒットしたレコードを要約しています。質問は情報量の尺度についてではない。それは、ツリー間の「残差」の転送についてです - 確率からロジットへ、そしてまた戻って、一定の再計算があります。

 
Stanislav Korotky #:

いいえ、ノードにヒットした記録で要約しています。この質問は情報量の尺度とは関係ない。確率からロジットへ、そしてまたロジットへと、常に再計算が必要なのだ。

また、一般的にどのように頻度を数えることができるのでしょうか?クラスであれば、その方法は明らかです。

 
Stanislav Korotky #:

いいえ、ノードにヒットした記録で要約しています。この質問は情報量の尺度とは関係ない。それは、ツリー間の「残差」の移動についてです。確率からロジットへ、そしてまたロジットへ、一定の再計算があります。

それともロジスティック回帰による分類のことだろうか?いずれにせよ、どこかから抜き出した式だけでは不十分で、全文が必要です。

 
Aleksey Nikolayev #:

それともロジスティック回帰による分類のことだろうか?いずれにせよ、どこかから抜き出した式だけでは不十分で、全文が必要である。

ln(odds)の意味でのロジット関数。確率値[0,1]の領域をプラスマイナス無限大に変換する必要があります - そうでなければ、勾配による訓練はできません。

例えば、ここにテキストがあります -https://medium.com/swlh/gradient-boosting-trees-for-classification-a-beginners-guide-596b594a14ea

そしてこちらがビデオ -https://www.youtube.com/watch?v=hjxgoUJ_va8.

PS.IMHOは、そこにもそこにも資料に誤りがある。
Gradient Boosting Trees for Classification: A Beginner’s Guide
Gradient Boosting Trees for Classification: A Beginner’s Guide
  • Aratrika Pal
  • medium.com
Introduction Machine learning algorithms require more than just fitting models and making predictions to improve accuracy. Nowadays, most winning models in the industry or in competitions have been using Ensemble Techniques to perform better. One such technique is Gradient...
 
Aleksey Nikolayev #:

クラス別にまとめると、分母はジニ指数またはノードの純度である。小さいほど良い。分子はシートの行数。

この基準は大きければ大きいほどよい-クラスはよりきれいに分離されるが、シートが過度に破砕されることはない。

ジニ指数は、分類エラー率よりも敏感であると考えられるので、選ばれたようである。


やっとジニ指数について知っている人が現れた。18年に調べたんだ、そのコード。https://www.mql5.com/ru/blogs/post/723619
Нужна ли деревьям и лесам балансировка по классам?
Нужна ли деревьям и лесам балансировка по классам?
  • www.mql5.com
Я тут читаю: Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - 2015 там есть несколько страниц посвященных этой теме. Вот итоговая: Отмеченный
 
Stanislav Korotky #:

ln(odds)の意味でのロジット関数。確率値[0,1]の領域をプラスマイナス無限大に変換する必要がある。

そうです,あるクラスに属する確率(それからのロジット関数)を探しているときに,ロジスティック回帰に使われます.

著者は、一般的な方法でboustingの内部を提示したいようですが、彼は問題のあまりに複雑な変形を取りました。彼は、ロジット回帰、ツリー、ブスティングを混ぜており、それだけでは理解しにくい。ブースティングの本質はファンカンなしでは論理的に語れない。ロジット回帰の本質を理解するには,理論家(おそらく2項分布)が必要である.

 
Forester #:

ついにジニ指数について知っている人が現れた。私は18年にそのコードを探していた。https:// www.mql5.com/ru/blogs/post/723619

ジニ係数もある。MOEでも使われているが、それとは違う)。

 
Stanislav Korotky #:

boustingを持つ木の分類のアルゴリズムで、以下の式がどのように得られるか説明してください(PDFにリンクできます):


私がインターネットで見つけたすべての資料では、式は魔法のように「天井から取ってきた」だけです。

どこからその公式を手に入れたのですか?天井から」といういつもの集団農業から判断すると、おそらくソビエトだろう。

あなたは、確立されたアルゴリズムがあるプロの数学を使用する必要があります。

Rには膨大な数の木型があり、プロのR言語と他の多くの言語の違いは、アルゴリズムの著者と対応する出版物への参照を義務付けていることだ。ざっと見たところ、対応する参照文献がないRパッケージの関数は、多かれ少なかれ記憶にない。


R以外のことは忘れてください。今日、Rは統計計算のための唯一のプロフェッショナルな環境である。