トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3175

 
СанСаныч Фоменко 最適化グラフを 持つ。

これはオーバートレーニングの監視に使用できる。

このサーフェスで、1つのセルがほぼ同じ色の他のセルに囲まれている部分を特定することができれば、この中央のセルがオーバートレーニングしていないTCのパラメータを示すことになる。この位置は、発見された最適値がプラトーであるという事実に対応する。

しかし、もし「表面」がヒョウの皮のように見えるなら、TSは絶望的である。なぜなら、テスターは多数の極大値を発見しており、将来その極大値に当たる確率が極めて低いことを示しているからである。

ータはー。

パターン(表面)の性質は、特定の最適化基準に従ったTSの特性についてのみ語る。別の基準をとれば、パターンは違ってくる。このことを誤解していると、最適化(学習)は大域的な最大値まで行うべきではないという誤解につながる。戦略に適した最適化基準の選択こそが、正しい学習の鍵なのである。

このようなことは、これまで何度も議論されてきた。

 
fxsaber #:
そういうものなのだ。私がひとつ質問すると、プロがその答えを持ってやってきた)))))

バツイチの若いバカIT屋のように)))))))))))))))))))))))))))))))))))))))))))))))
 
fxsaber #:

この間隔の意味を教えてください。

今、私はこのスキームを想像しています。

  1. ナンバークラッシャーが列車で走り、テストでフィルタリングする。
  2. ナンバークラッシャーのスイッチを完全に切る。そして、数少ない最良の結果を試験で取る。


最初のポイントは奇妙に思える。テスターの「フォワードテスト」。フィルタリングなしで、train+testの組み合わせで最適化するよりも良いのでしょうか?

医学では、60人のほぼ同じ病気の患者を無作為に3つのグループに分け、最初のグループには新薬、2番目のグループには旧薬、3番目のグループにはプラセボを投与する。そして、最初のグループが2番目と3番目のグループよりも良好であった場合、その薬は良い薬であると認められ、実験は何回かに分けて多数で繰り返され、すなわちモニターされ、その後、自由に浮遊するようになる。

偽陽性、偽陰性の確率が減ることは論理的であるように思えるが、私にとってはエラーに対する万能薬ではない。

また、私はノイズの多い研究の結果を断定的に評価することを全く理解していないし、認めていない)))。

 
Andrey Dik #:

いや、できない。

パターン(表面)の特性は、特定の最適化基準に従った車両の特性を示すだけだ。フレンドリーなフレンドリーなー。このことを誤解していると、最適化(トレーニング)は大域的な最大値まで行うべきではないという誤解を招く。戦略に適した最適化基準の選択こそが、正しいトレーニングの鍵なのだ。

ーこのー

フレンドリーなー。ータはータはータだけがータはータはータはータ

あなたはプラトーを探す必要があるのであって、個々のピークを探す必要はない。

 
Valeriy Yastremskiy #:

医学では、60人のほぼ同じ病気の患者を無作為に3つのグループに分け、最初のグループには新薬、2番目のグループには旧薬、3番目のグループにはプラセボを投与する。そして、最初のグループが2番目と3番目のグループよりも良好であれば、その薬は良い薬であると認められ、実験は何回かに分けて多数で繰り返され、すなわちモニターされ、その後、自由に浮遊するようになる。

偽陽性・偽陰性の確率が減るのは理にかなっているように思えるが、私にとってはエラーに対する万能薬ではない。

また、私はノイズの多い研究の結果を断定的に評価することを全く理解していないし、認めていない)))。

ファイルを異なるセクションに分割し、あなたが示した例では、私のサンプルに対応するグループに患者をランダムに含めることは、予測変数がターゲット変数に関連している場合にのみ機能します。医学では、薬(予測因子)と病気との関係を解明することは、薬を体内に入れる過程の生理学を理解することによって行われる。予測変数とターゲット変数の関係を決定するために、他の方法を持たなければならない。これはすべて前処理であり、モデルをトレーニングする前に行われ、このステップは必須である。

同様に、テスト・アーキテクチャは必須であり、モデルのオーバートレーニングの前に行われなければならない。

 
СанСаныч Фоменко #:

そして、誰もが自分の意見を持っている。あなたは一人の人間だと思う。

個々のピークを探すのではなく、プラトーを探す必要が ある。

私は、自分がたった一人の中の一人であることなど気にしていない。)

プラトーになるかピークになるかは、最適化基準の表面、基準次第だ!なぜ彼らがMOの誤差という基準をよく使うと思う? 表面が単調だからだ)))、つまり彼らは常に、可能な限り単調で、可能であれば大域的な1つの基準を選ぼうとする。

したがって,プラトーを探すのではなく,できるだけ単調な超曲面を持つ基準を探すべきなのである.

ところで,誤差基準は,値0を持つちょうど1つの大域を持つ.また,大域に達することなく訓練を停止する必要があるという事実は,別の問題であり,基準曲面とは何の関係もない.

 
このナンセンスな文章を読んで、ここで賢い人たちが何か賢いことを議論していると思うような、未熟な心を持った哀れな人たちを、私はどれほど憐れむことだろう......。
 
Maxim Dmitrievsky #:
あなたは何年もこれを続けてきたと結論づけることもできる。あるいは、あなたが今やっているようなランダム検索をすることもできる。

ランダムサーチは非生産的なアプローチだと書いただけだ。

私はサンプリングの可能性をテストする際、予測変数の選択にランダム性の要素を加えたランダム化を使用していますし、CatBoostでも何年も使用しています。

無作為化は、予測変数の応答が無作為化されているため、モデルが機能し続けることを期待する正当な理由にはなりません。

 
Aleksey Nikolayev #:

IMHO, it looks like pi-hacking, which Maxim wrote about recently.、フレンドリーなフレンドリーなーニョがーニョのー。

I once gave a simple example when the best hour of the week for trading was selected on SB (when it obviously doesn't exist).ー5*24=120種類しかーしかーしかーしかーしかー(ー時間間隔がー半年だったかなー)、ーそこにはー。そこにも「サンプリングの安定性」がある。

どのような有意性検定を提案しますか?量子セグメント選択アルゴリズムが生半可な生半可な生半可な生半可な生半可な生半可生半可生半可生半可生半可生半可生半可生半可生半可生半可生半可生半可生半可生半可

量子セグメントの選択と、量子セグメント(つまり私が作成したグラフ)によって訓練なしでうまくスクリーニングされた文字列のスクリーニング、具体的にはどの部分ですか?、法木模型のののののののののののののののののののののののののののののののののぶっトーてきな方法でありますけどす。

SBの例については、ここで2つの考慮点があります:

1.、ータしかータがータがータがータがータがータをータをータをータをータをというータをータをのータをというータをそれとも、この仮説を否定する考察があるのでしょうか?

2.ーこれらのー これらのーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー 2.

トレーニングでは、私は大規模な期間(通常は少なくとも10年間)のサンプルを使用します。

 
СанСаныч Фоменко #:

ファイルを異なるセクションに分割し、あなたが与えた例では、私のサンプルに相当するグループにランダムに患者を含めることは、予測変数がターゲット変数に関連している場合にのみ機能します。医学では、薬(予測因子)と病気との関係を解明することは、薬が体内に導入される過程の 生理学を理解する ことによって行われる。予測変数とターゲット変数の関係を決定する他の方法を持たなければならない。これはすべて前処理であり、モデルをトレーニングする前に行われ、このステップは必須である。

同様に、テスト・アーキテクチャは必須であり、モデルのオーバートレーニングの前に行われなければならない。

残念ながらそうではない。ファゴサイトーシスは顕微鏡で見ることができるが、顕微鏡が役に立たない医学の科学は、適切な実験によって確認される仮説である。)

ところで、患者は自分がどのグループに属しているのか知らない。)

一般に、似たような病態は、原因と結果の関係を理解することなく、これらの関係を検索する。

理由: