カオスにはパターンがあるのか?それを探してみよう!特定のサンプルを例にした機械学習。 - ページ 12

 
elibrarius #:

これらのモデルは、テストでベストのものを選んでいるのですか?

それとも、数ある中で試験で一番良いものが試験でも一番良いのでしょうか?

具体的には、単純に試験で一番良かったということで選んでいます。

 
Aleksey Vyazmikin #:

具体的には、単純に試験の成績優秀者による選抜があった。

私も試験でベストを尽くしました。実際の取引に入る前に試験はありません。というか、実際にお金を使うことになるのだが......。

今、私は順張り(10000から5000までと、あなたのようなトレインとテスト1つずつ)でサインの選択をしましたが、試験ではその両方が合体しました。

試験で学習しやすいように、試験でどうにか選択する必要があります。

 
elibrarius #:

試験でも最高のものを見せた。実際の取引に入る前に試験はありません。というか、実際のお金を使うことになる......。

今、私は順張り(10000から5000までと、あなたのようなトレインとテスト1つずつ)でサインの選択をしましたが、試験では両方が合体しました。

試験で学習性を維持するために、試験で何とか選択する必要があります。

現時点では、残念ながら正しい選択の確率を上げることしかできません。そのため、多くのモデルを一度に選択するバッチ取引を考えています。平均的な精度が十分で、平均的な利益を得られることを期待しています。

 
何十万もの特徴の中から機能する特徴を見つけ、それがなぜ機能するのかを理解する必要がある。その上で、ブルートフォースではなく、最適なハイパーパラメータを選択することによって、さまざまなTCを記述する必要がある。
そうでなければ、試験に従って何百ものモデルから選ばなければならないときに、やはりフィッティングしてしまうでしょう。
最も重要なことは、その特徴がなぜ機能するのかを、少なくともおおよそ理解することである。そうすれば、それらを改善したり、ラベルを貼ったりすることができる。

不明確なモデルを何個も積み重ねるのも良いアイデアではない。なぜなら、また未知のものをたくさん再トレーニングしなければならないからだ。

良いものを選ぶために特徴選択を総当たりで行い、それがなぜ機能するのかについて熟考する必要がある。そうすれば、次に進むべき道が見えてくる。ブルートフォース自体は、TCの準備には効果がない。
 
Maxim Dmitrievsky #:
何十万もの特徴の中から機能する特徴を見つけ、それがなぜ機能するのかを理解する必要がある。その上で、ブルートフォースではなく、最適なハイパーパラメータを選択することによって、さまざまなTCを記述する必要がある。
そうでなければ、試験に従って何百ものモデルから選ばなければならないときに、やはりフィッティングしてしまうでしょう。
最も重要なことは、その特徴がなぜ機能するのかを、少なくともおおよそ理解することである。そうすれば、それらを改善したり、ラベルを貼ったりすることができる。

不明確なモデルを何個も積み重ねるのも良いアイデアではない。なぜなら、また未知のものをたくさん再トレーニングしなければならないからだ。

良いものを選ぶために特徴選択を総当たりで行い、それがなぜ機能するのかについて熟考する必要がある。そうすれば、次に進むべき道が見えてくる。ブルートフォースそのものは、TCの準備には効果がない。
そうだね。プロセスの理解は、さまざまな角度から達成することができる)
 
Maxim Dmitrievsky #:
何十万もの特徴の中から機能する特徴を見つけ、それがなぜ機能するのかを理解する必要がある。その上で、ブルートフォースではなく、最適なハイパーパラメータを選択することによって、さまざまなTCを記述する必要があります。
そうでなければ、試験に従って何百ものモデルから選択しても、やはりフィッティングしてしまうでしょう。
最も重要なことは、その特徴がなぜ機能するのかを、少なくともおおよそ理解することである。そうすれば、特徴量を改善したり、特徴量に対するラベルを改善したりすることができる。

また、曖昧なモデルをたくさん詰め込むのもよくない。なぜなら、また未知のものをたくさん再トレーニングしなければならなくなるからだ。

良いものを選ぶために特徴選択を総当たりで行い、それがなぜ機能するのかに目を瞑る必要がある。そうすれば、次に進むべき道が見えてくる。ブルートフォースそのものは、TCの準備には効果がない。

要は、プレディクターの効率の理由を理解する作業は非常に難しく、市場行動の解釈の分野にあるということです。その上、プレディクターはプリミティブであるためグループで機能し、グループで機能するプレディクターをどのようにまとめるかは、ブスティングであれば単純な問題ではない。そして、効果的な決定木を構築するためには、サンプルを大幅に削減する必要があり、より良いのは、効果的な関係を形成すると推定される予測変数のみをフィードすることです。そしてここで、モデルが原則として予測変数の一部のみを使用するため、モデル探索の方法は非常に有用である。

フィッティングするかしないか-私は、確率フィッティングの行動はすべてフィッティングだと思う。もうひとつは、予測変数に対するこれらの確率分布の履歴が繰り返されるかもしれないし、長い間忘れ去られるかもしれないということである。そしてここで、これらの段階の推移を決定する何らかの方法を持つことが重要である。

 
Aleksey Vyazmikin #:

CatBoostの箱から出して、以下の設定で呼び出されたものを、シード・ブルート・フォースでトレーニング すると、このような確率分布になる。

1.列車のサンプリング

2.テストの選択

3.試験サンプル

ご覧のように、モデルはほとんどすべてのものをゼロで分類することを好む。

アレクセイ、トレーニングは本質的にフィッティングなんだね?

 
Renat Akhtyamov #:

アレクセイ、トレーニングとは本質的にフィッティングなんだろう?

基本的にはそうです。

テスターにおける最適化とは、アルゴリズムが動作するメトリクスを変更することであり、MOメソッド(ツリーとその亜種、NS)における学習とは、メトリクスの履歴を評価・解釈することでアルゴリズムを変更することです。

共生、それは壮大なことだ。

 
Renat Akhtyamov #:

アレクセイ、トレーニングとは本質的にフィッティングなんだろう?

小学生に教えることもまた、既存の知識に知識を当てはめることなんだ)

 
Aleksey Vyazmikin #:

そこがポイントだ。予想屋のパフォーマンスの理由を理解する作業は非常に難しく、市場行動の解釈の領域にある。その上、プレディクターはプリミティブであるためグループで機能し、グループで機能するプレディクターをどのようにまとめるかは、ブスティングであればともかく、単純な問題ではない。そして、効果的な決定木を構築するためには、サンプルを大幅に削減する必要があり、より良いのは、効果的な関係を形成すると推定される予測変数のみをフィードすることです。そして、ここでモデル探索の手法が非常に有用である。モデルは、原則として予測変数の一部だけを使用するからである。

フィッティングするかしないか - 私は、確率フィッティングの行動はすべてフィッティングだと思う。もうひとつは、予測変数に対するこれらの確率分布の履歴が繰り返されるかもしれないし、長い間忘れ去られるかもしれないということである。そしてここで、これらの段階の推移を決定する何らかの方法を持つことが重要である。

トレーニングは5~10人の小グループで行う。

1~3人が良い。

そのどれもが何も生み出さないのであれば、神話的なつながりを語ることに何の意味があるのだろうか?

理由: