トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 1304

 
マキシム・ドミトリエフスキー

10k例でテストと トレースごとに10%の誤差、増加すると滑らかに増加する

このエラーで、モデルは新しいデータで動作するようになりました。

バリデーションが異なると、バリアントを実行する必要があります。

アルゴリズムはもう公開されない、ただ伝えるだけ

何か怪しく小さい。ペレヴェンコは、ジグザグに関する論文でも、そのような結果を出していない。

また、テストとトレーニーが10%ずつなのに、検証は「違う」というのも怪しいですね。I.e.もっと、あるいは何?最悪はテストであって、検証ではないはずです。

 
エリブラリウス

何か怪しげな小さいものがある。ペレルヴェンコは、記事のジグザグでもこれを達成できなかった。

また、テストとトレインで、それぞれ10%ずつ、検証が「違う」というのも怪しいですね。つまり、それ以上なのでしょうか?最悪はテストであって、検証ではないはずです。

"ジグザグにも" )))

最悪でも、学習には間接的にでも一切関与していない検証でなければならない。
 
マキシム・ドミトリエフスキー

"ジグザグにも" ))))

最悪は 、間接的にでも学習に一切関与していない検証しかない
そして、なぜテストコーナーではないのか?間接的であっても一切トレーニングに参加していない」から?
 
エリブラリウス
なぜテストサイトではないのですか?結局のところ、「学習には一切、間接的にも関与しない」ということでもあるのです。

テストは常に間接的に学習に関わっている、同じキャットバストを取る...さあ。

 

А...とか、プロットの呼び方が違うとか。

私は電話する

1列車区間
2 valid - これは多くのパッケージで、学習過程での制御や早期停止に使用されているものです。そして、それをValidと呼びます。
3 テスト - 新しいデータでシステムを評価するため

第2部をテストセクションと呼んでいたかもしれませんね。

 
マキシム・ドミトリエフスキー

テストは常に間接的な学習であり、キャットバストを取る...さぁ。

キャットバスト......どうだろう。以下、XGBoostからの引用です。

早回り
NULL の場合、早期停止機能は 発動しない。整数kに設定すると、トレーニング
に対して性能が向上しない場合、検証 セットで停止する。
を丸めたものです。

 
エリブラリウス

А...とか、プロットの呼び方が違うとか。

私は電話する

1 トレーニングデータセット
2有効 - 多くのパッケージで、トレーニング中のモニタリングや早期停止に使用されているものです。それをValidと呼びます。
3 テスト - 新しいデータでシステムを評価するため

第2部をテストパートと呼んでいるようですね。

私は逆にバリデーションが新しいと思います。

ええ、まあ、おわかりでしょう。

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

--テストセット

検証用データセットの記述を含む入力ファイルのカンマ区切りリスト (フォーマットはトレーニング用データセットで使用したものと同じでなければならない).

省略このパラメータが省略された場合、 検証用 データセットは使用されない。


))) 好きなように書けばいいのですが、これは

 
マキシム・ドミトリエフスキー

逆だと思います、バリデーションは新しいもので、そこに書かれているのは

ええ、まあ、おわかりでしょう。

最初は理解できませんでした。
私たちは異なる言葉を使うからです。

一つの用語にこだわるべき。

 
エリブラリウス

最初は理解できませんでした。
私たちは異なる言葉を使うからです。

同じ用語にこだわるべきだ。

2番目のセクション(学習制御や早期停止に使用される)が、検証ではなく、テストと呼ばれているパッケージのドキュメントを見せてください。

上記で紹介した、さらに詳しい内容はこちら

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
マキシム・ドミトリエフスキー

上記をご覧ください。

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

鋸)
全体的に用語の混乱
理由: