カオスにはパターンがあるのか?それを探してみよう!特定のサンプルを例にした機械学習。 - ページ 16

 
Maxim Dmitrievsky #:

通常の状況ではシードはほとんど影響しない。重要なのはアルゴリズムだ。もしシードに悩まされるのであれば、そのデータはすでにゴミのようなものだ

新しいデータをチェックすることで、1000個でなく10個の符号しかなければ、ある程度確信が持てる。

デフォルトの深さは6だと思いますが、臨界値以外はあまり影響しません。

学習深度は、過去のばらつきによって異なる影響を与えます。

そうですね、4つのシード予測ではあまり影響しないかもしれません。くだらないのは誤解です。モデルで使用される予測変数の数を本質的に決定するのはシードです。

すべてのパラメータが影響を受けます。私が言いたかったのは、あなたはおそらく例よりも一桁多い組み合わせを持っているということです。4つの予測変数があれば、学習率0.3-0.5で、1-3のCBツリーのモデルに意味があることがわかります。

 
Aleksey Vyazmikin #:

新しいデータで学習を続けるために、別のサンプルを与えてみればいい。CatBoostでも これができるようだ。モデルをマージする方法も知っているが、調べたことはない。

勾配ブースティング...

つまり、前のモデルのエラーから学習する。

つまり、前のモデルのエラーから学習するということだ。

モデルの違いは、サンプルが時間的にずれていることだけだ。

 
Renat Akhtyamov #:

グラデーションブースティングだ......。

つまり、前作の失敗から学ぶということだ

そして、1つのモデルで数回トレーニングするだけでいい。

モデル間の唯一の違いは、サンプルが時間的にずれていることである。

私の脳はあなたの書いたことを処理できない。

 
Aleksey Vyazmikin #:

ああ、たぶん4つの予測因子ではシードはあまり影響しない。これは誤解です。実際,seedはモデルで使用される予測変数の数を決定する.

すべてのパラメータが影響を受けます。私が言いたかったのは、あなたはおそらく例よりも一桁多い組み合わせを持っているということです。4つの予測変数があれば、学習率0.3-0.5で、1-3のCBツリーのモデルの意味がわかります。

シードは、通常の最適がある場所には影響しません。

+- 短絡は関係ない。

少し調整することはできますが、もはや重要ではありません。

 
Maxim Dmitrievsky #:

通常の最適な場所であれば、シードはどこにも影響しない。

+- 短絡は役割を果たさない

少し調整することはできるが、重要ではない

それはどこですか?

 
Aleksey Vyazmikin #:

それはどこですか?

シードテーマのバリエーションが結果にあまり影響しないところ、かな )

 
Maxim Dmitrievsky #:

シードテーマのバリエーションは結果にあまり影響しないらしい )

我々の場合は明らかに違うが...。

 
Aleksey Vyazmikin #:

私たちの場合は明らかに違う。

まあ、それはそれで楽しみではある。
 
Maxim Dmitrievsky #:
まあ、楽しみはある。

あるよ。でも、これは理想的な世界の話であって、時には既存の世界に適応した方がいいこともある。

 
Maxim Dmitrievsky #:
適当に突っつくのがいいのか、アプリオリに信頼できる 情報にこだわるのがいいのかの問題だ

開始時間と終了時間(セッション、カレンダー)以外は何も思い浮かばない。どういう意味ですか?

理由: