トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1194

 
そして、学習アルゴリズムは対数損失を0.5で分解するように設計されています。ですから、そこに大きなクラスタがあるのは、ある意味理にかなっています。
 
アレクセイ・ヴャジミキン
そして、学習アルゴリズムはloglossを0.5ずつ分解していくように研ぎ澄まされています。つまり、そこではクラスタがメインになっているというのは、ある意味理にかなっていると言えますね。

loglossは見てもほとんど意味がない、階級の内訳という点では目立たない指標である

 
マキシム・ドミトリエフスキー

事象の発生確率が高ければ高いほど、信号の精度が高くなるのは、定義からも明らかです :)2 ノイズが多いデータではハンプは発生しないが、少なくともモデルは極値を適切に捉えるべきで、そうでなければ入力について全く確信が持てない。

そう単純にはいかないと思います、学習機能を考えないと...。のように、一般的に確率はその値の後で計算されます(モデルアルゴリズムではそうです)。

今のところ事実が教えてくれるのは、中傷されたモデルは確信が持てないだけで、まだセンターでの失敗には遭遇していないのですが......。

マキシム・ドミトリエフスキー

loglossを見ることはほとんど意味がなく、クラス分けの観点からは重要でない指標である

勾配降下が起こっている...。
 
アレクセイ・ヴャジミキン

そこまで明確には、学習機能を考えないといけないと思うのですが...。というのも、一般的に確率はその値の後に計算されるからです。

今のところ事実が教えてくれるのは、中傷されたモデルは確信が持てないだけで、まだセンターでの失敗には遭遇していないのですが......。

用語がよくわからないのですが、学習関数とは何でしょうか?

失敗についてはわかりませんが、確率の閾値を設定すれば、新しいデータでは不明確なモデルは機能しませんが、スメアードモデルは機能します

 
マキシム・ドミトリエフスキー

用語がよくわからないのですが、学習関数とは何ですか?最後にソフトマックスがあるのか、それとも何ですか?

そこでは、モデルはloglossによって評価され、すべてのgradient boostingは この関数の性能を向上させることを目的としている。モデル自体は、ロジスティック関数で変換する必要がある値を生成する。だから、確率を使ったこの方法は、すべてがそれほど単純ではないのだろう......。

 
アレクセイ・ヴャジミキン

そこでは、モデルはloglossによって評価され、すべてのgradient boostingアクションは、この関数のパフォーマンスを向上させることを目的としています。モデル自体は、ロジスティック関数で変換する必要がある値を生成する。だからこそ、確率を使ったこの手法では、すべてがそう単純にはいかないと思い込んでいるのですが......。

f-ionにはminとmaxがあり、それらは確実にlogit marginsにあるはずです... それがない場合、underrunか何かで(ニューロンやツリーが少ないとか、underrunのたびに出ます)、大きな誤分類とloglossが発生します。

 
マキシム・ドミトリエフスキー

minとmaxのf-ionがあり、それらは必ずlogitの端にある...もし、それがない場合はアンダーフィッティングか何かで(ニューロンやツリーが少ないなどアンダーフィッティングの時は必ずある)、分類誤差やloglossが大きくなる

モデルが出力するこれらの係数についてです https://en.wikipedia.org/wiki/Logit - それは線形分布ではありません。

特にクラス1に絞って、正しく分類された対象のうち、分類にヒットした割合を大きくとれば、オーバートレーニングよりもアンダートレーニングの方が良いように思いますし、適用範囲を限定してモデルを組み合わせれば良いのです。

Logit - Wikipedia
Logit - Wikipedia
  • en.wikipedia.org
In deep learning, the term logits layer is popularly used for the last neuron layer of neural network for classification task which produces raw prediction values as real numbers ranging from [3]. If p is a probability, then is the corresponding odds; the logit of the probability is the logarithm of the odds, i.e. logit ⁡ ( p ) = log ⁡...
 
アレクセイ・ヴャジミキン

モデルが出すこれらの係数についてです。https://en.wikipedia.org/wiki/Logit - 線形分布ではありません。

特にクラス1に着目して、分類に該当する正答率の高いターゲットを多く取り、そのモデルを組み合わせることで、適用範囲を限定しながら、オーバートレーニングよりもアンダートレーニングの方が良いように思います。

要するに...もう一度言いますが、クラウディング(過剰適合)やテールのカットオフ(過小適合)を避けるために、適切に教えるべきなのです。

赤いカーブは、私にはほぼ正常に見えます。

とアンダーフィットが全くないわけではないのですが...。の近辺で、0.5

偏りは、モデルを動かしながら、ベイズによって、条件付き確率で引き出すことができる。具体的にどうすればいいのかはわからないが、直感的にわからないパワーがあるのだ。

ベイズモデルは学習能力がある...ベイズチップを付けて、あまり再学習しないようにしたらどうだろう...まだ、わかっていないんです。

 
マキシム・ドミトリエフスキー

何度も言いますが、ぶつからないように(オーバーフィット)、尻尾が切れないように(アンダーフィット)、普通に教えなければなりません。

赤い曲線は、私にはほぼ正常に見えます。

とアンダーフィットが全くないわけではないのですが...。の近辺で、0.5

偏りは、モデルを動かしながら、ベイズによって、条件付き確率で引き出すことができる。具体的にどうすればいいのかはわからないが、直感的にわからないパワーがあるのだ。

ベイズモデルは再トレーニングが可能です...頻繁に再トレーニングをしなくてもいいように、モデルにベイズチップを付けておけばどうでしょう...まだ思いつきませんね。

そうですね、私も赤の方が好きです。正規分布とか、でも512モデルでは今のところこの分布は目に負けますね...。もうすぐ10万円オーダーのモデルがたくさん出てきますが、どんなものが出てくるか......。理論と実践が一致しないこともある。適応しなければ、そんな風に自分の歯を棚に上げてしまうことも......。

Catbustはベイズ型だけあって、事前学習をサポートしていますが、どうなんでしょうね~延々とツリーを追加していくのは、フィッティングのように見えますが・・・。

 
マキシム・ドミトリエフスキー

木を追加することは、全体の構造を再編成することなく、ちょっと変な感じです......いや、いいのかもしれません。

そして、それ以外にどうやってコツをつかむかというと、やはりブースティングで、それしか選択肢がないのです。もちろん、モデルの最後の3分の1、つまり木の3分の1を捨てて、新しいデータを入力したときに何が出てくるかを見ることもできます。しかし、私は、重要でない「確率」の葉を無効化すること、いわばノイズからクリーンアップすることを考えているのです。一般的には、モデルから収集したアンサンブルを自動化し、モデルの予測能力の良い区間を見つけ、その区間をトリミングし(例えば0.7から0.8)、他のモデルとの組み合わせのために空白を入れるということを考えます。

理由: