トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2847

 
Aleksey Vyazmikin #:

点があれば、どんな形でも視覚化できる。視覚化は抽象的思考を刺激し、アイデアの創出を促すために必要である。

実際、サンプルの2値予測変数のヒストグラムでは、赤い棒は信号が欠落(ゼロ)していることを意味し、その高さはサンプルに信号「1」がなかった時間を意味する。

サンプル中の信号発生の度数分布の異なる特性は、トレーニングにおけるこの予測変数のさらなる使用を分類するのに役立つと仮定する。したがって、この予測因子は、上位ルート分割の構築のためにのみ、除外または使用を推奨することができる。

これが、予測変数がヒストグラムを記述するために必要とされる理由です。そうです,我々はTP+FPバランスの予測子も作ることができます - よく知られているものを除いて,その記述のアイデアも興味深いです.

これはヒストグラムではなく、ピアソンが発明したような従来の意味でのヒストグラムでもない。

 
Aleksey Nikolayev #:

これはヒストグラムではなく、ピアソンが発明した従来の意味でのヒストグラムでもない。

棒グラフ」と書けば、もっと意味が伝わっただろうか?

狭い界隈で一般的に受け入れられている意味、と明記すればよかったのだが......。

問題の核心に迫ろう :)

 
Aleksey Vyazmikin #:

棒グラフ」と書いた方が納得してもらえるだろうか?

もちろんそうではない。棒グラフのようにも見えないからだ。棒と棒の間隔が不揃いなのだ。棒と棒の間隔が近ければ、通常は色が異なり、比較の対象となる別の値を意味する。

アレクセイ・ヴャズミキン#

狭いサークルで一般的に受け入れられている意味で、指定されているはずだが......。

あなた一人の円は、あなたから見て広いだけです。

アレクセイ・ヴャズミキン#:

質問の本題に入りましょう:)

これまでのあなたの質問の本質は、その理解しがたい誤った定式化にのみある。

 
Aleksey Nikolayev #:

もちろんそうではない。棒グラフのようにも見えないからだ。棒と棒の間隔が不揃いなのだ。棒と棒の間隔が近い場合、通常は色が異なり、比較の対象となる値が異なることを意味する。

では、このようなグラフを何と呼べばいいのでしょうか?スペクトログラムとか?

アレクシー・ニコライエフ

あなた一人の円は、あなたから見て広いだけです。

このトピックについて研究したいですか?エクセルを開いて、幅広いユーザーにとってのヒストグラムとは何かを読んでみてください。

アレクシー・ニコライエフ

今のところ、あなたの質問の本質は、その理解しがたい誤った定式化にある。

明確でないのは、予測因子やグラフを記述する方法とは何かということです。

 
Aleksey Vyazmikin #:

では、このようなグラフを何と呼べばいいのでしょうか?スペクトログラムはどうですか?

このトピックについてちょっと調べてみる?エクセルを開いて、一般向けにヒストグラムとは何かを読んでみてください。

明確でないもの - 予測子やグラフを記述する方法は何ですか?

一見したところ、特に関連性のない2つの値が表示されています。このような場合、散布図を使うのが一般的です。

 
Aleksey Nikolayev #:

一見したところ、特に関連性のない2つの値が表示されている。このような場合、通常は散布図が使われる。

我々は、値が同じであると仮定します - 赤い方だけを見てください。緑 - 予測の応答番号は "1 "で、yは常に1です。

 
Aleksey Vyazmikin #:

我々は、値が同じであると考える - 赤い方だけを見てください。緑 - 予測の応答番号は "1" で、y に対して常に1です。

各棒は,底辺のX座標と高さのY座標を持つので,2つの大きさがある.これらはかなりカオスなので、平面上の分布を見ることができます - ヒートマップか何かです。

 
Aleksey Nikolayev #:

それぞれの棒は、底辺のX座標と高さのY座標を持っているので、2つの値を持っている。これらはかなり混沌としているので、平面上の分布を見ることができる。

xは観測値の序数なので、散乱はグラフを回転させるだけで何もしない。私が思うに、ここで重要なのはダイナミクスにおける観測である。

 
最初のグラフでは、外れ値や行が互いによく似ているのがわかる。樹木の排出量の割合を計算するにはどうすればいいのでしょうか?フェンスの端にできるだけ近い線を引く?
 
Aleksey Vyazmikin 最初のグラフでは、外れ値や行が互いによく似ているのがわかる。樹木の排出量の割合を計算するにはどうすればいいのでしょうか?フェンスの端にできるだけ近い線を引く?

列の高さのサンプルのヒストグラム(通常の慣用的な意味での)を作成してみる。生存関数を 構築してみることもできる。

理由: