反転の確率を計算する

 

数学が得意な人、この問題を解くのを手伝ってください、やり方がわからないんです。

正規分布の確率密度プロットがありますが、正規分布では記憶がなく、次のステップの方向が決まる確率は50%です。

例えば、10歩歩く人がいたとして、その人は右にも左にも歩けるし、次の一歩は前の一歩から独立しており、左右に進む確率は50%である、とします。そして、確率密度の表を作り、10ステップでどの程度の確率で出発点から離れるかを推定することができる。6列目は確率を%で表しています。表から、確率0.0977%でスタート地点から右へ10歩、確率4.39%で6歩移動することがわかります。

単純な話で、反転する確率は常に50%ですが、反転する確率が50%と異なる場合、確率密度グラフは異なるものになるのです。

そこで、確率密度グラフだけで、各ステップで反転する確率をどうやって計算するのか、という問題が出てきます。

例えば、次のような確率密度グラフがあるとします。


ここでは、X軸に、その人が出発点から-10(左)から+10(右)へ何歩進んだか、また、それをどの程度の確率で行ったかを%で符号化して示しています。各ステップが逆転する確率はどのように求めればよいのでしょうか?

 
パスカルの三角形を 使う。各行の値をすべて足し算します。これは100%です。次に、任意の点をその値で取り、結果の値で割る。それが確率です。
 
Ihor Herasko:
パスカルの三角形を 使う。各行の値をすべて足し算するのです。それは100%です。そして、その値で任意の点を取り、その値で割る。それが確率です。

面白いことに、パスカルの三角形は自分で考え出したもので、その存在や名前すら知りませんでした)。しかし、手作業でやるのは現実的ではありません。たった10ステップで、ゼロで252通りの組み合わせになるのですから、とんでもない計算式です。もちろん、コンピュータに全部計算させることもできますが、もっとエレガントな方法があるのでは?

間違っていたのかもしれませんね、書いていただいたようにやってみます。
 
Ihor Herasko:
パスカルの三角形を 使う。各行の値をすべて合計する必要があります。これは100%です。次に、任意の点をその値で取り、結果の値で割る。それが確率です。

いや、すでに確率はパーセントで出ているので、この分布を得るためには、各ステップで反転する確率をどうするか計算する必要がある。

 
Maxim Romanov:

いや、すでに確率はパーセントで出ているので、この分布を得るためには、各ステップで反転する確率をどうするか計算する必要がある。

スタート地点は17.9%(正規分布の頂点)かどうか?というのも、三角形の内側には動きがなく、すべて縁に沿った動きになっているからです。

 
Ihor Herasko:

スタート地点は17.9%(正規分布の頂点)かどうか?また、三角形の件ですが、三角形の内側には動きがなく、すべて縁に沿った動きなので、焦ったのでしょう。

そう、この例では、(出発した)スタート地点に到達する確率は17.9%、つまり分布の頂点に位置しているのです。17.9%の確率で、10ステップで元の場所に戻ることが判明したのです。
 
Maxim Romanov:
そう、この例では、(出発した)スタート地点に到達する確率は17.9%、つまり分布の頂点に位置しているのです。17.9%の確率で、10ステップで元の場所に戻ることが判明したのです。

なるほど、それなら三角形の方が正解でしたね。計算が必要なのは面だけなので、面の各点について、その係数を取ります。例えば、ポイント16.06%と16.01%の場合、2行目は2単位で構成されているので、係数は0.5となる。すると、16.01%の場合は、(17.9 + 0.5 * 16.01) / 2 = 12.9525%、16.06%の場合は、(17.9 + 0.5 * 16.06) / 2 = 12.965% の確率で、それぞれ、16.01%、16.06%になります。

ポイント11.89%と11.9%については、3行目の数値のように0.25のファクターが適用されます。1, 2, 1.すると、11.89%の場合:(12.9525 + 0.25 * 11.89)/ 2 = 7.9625%、11.9%の場合:(12.965 + 0.25 * 11.9)/ 2 = 7.97% となります。

つまり、新しいポイントごとに、前のステップの確率を取り、そのポイント値を加算し、与えられた系列の係数を掛け、2で割るのである。これは、三角測量のインデックスをループすることで解決します。

 
Ihor Herasko:

なるほど、それなら三角形の方が正解でしたね。計算が必要なのは面だけなので、面の各点について、その係数を取ります。例えば、ポイント16.06%と16.01%の場合、2行目は2単位で構成されているので、係数は0.5となる。すると、16.01%の場合は、(17.9 + 0.5 * 16.01) / 2 = 12.9525% となり、16.06%の場合は、 (17.9 + 0.5 * 16.06) / 2 = 12.965% の確率になります。

ポイント11.89%と11.9%については、3行目の数値のように0.25のファクターが適用されます。1, 2, 1.すると、11.89%の場合:(12.9525 + 0.25 * 11.89)/ 2 = 7.9625%、11.9%の場合:(12.965 + 0.25 * 11.9)/ 2 = 7.97% となります。

つまり、新しいポイントごとに、前のステップの確率を取り、そのポイント値を加算し、与えられた系列の係数を掛け、2で割るのである。三角形列のインデックスをループすることで解決。1つの式にすべてを詰め込もうとする必要はない。

写真でその一例をご紹介します。2件あります。上の図では、各ステップで反転する確率が50%、つまりプロセスが記憶を持っていない場合、描かれたような確率密度分布が得られます。(12.5/100)^(1/3)=0.5、つまり極値に対する反転確率は簡単に計算できるが、37.5に対する反転確率はどう計算したらよいか分からない。

下図は、プロセスがすでに記憶を持っているため、より複雑で、次のステップが前のステップと同じ方向になる確率は0.6、反転する確率は0.4となり、分布の確率密度は前のケースと異なっている。そこで、確率密度関数だけを用いて反転の確率をどのように計算するかという問題があります。

ここでも極値(18/100)^(1/3)=0.56を取ることができ、これは最初のステップで0.5だったため、反転の平均確率であると言えるでしょう。

しかし、32の値に対して反転の確率を求めるにはどうしたらよいのでしょうか。

もしかしたら、私の考え方が間違っていて、私が示したものとは大きく異なる方法があるのかもしれませんね?つまり、分布の形状から、その特定の形状の分布で反転(または継続)する平均的な確率がどうなったかを計算する必要があるのです。

 
数学に詳しい方なら、もう少しアドバイスしていただけるかも?問題は複雑ではなく、間違いなくきちんとした解決策を持っています。なぜなら、私自身は「素直な」解決策しか思いつかないからです。いつもと同じように、すべての可能な解答を集めた表を作り、コンピュータに解かせるのです。でも、もっとエレガントなものがいいんです。確率分布密度だけを持っていて、各ステップで反転する確率を求めるという作業を数学でやったのは私だけではないでしょうし、その仕組みは間違いなくあるのでしょう。
 

一見すると、マルコフ連鎖の分野からは、初期分布の時間発展が通常の問題である。連鎖が2次であるため、多少複雑になる(n時点の価格の確率は、n-1時点の価格だけでなく、n-2時点の価格にも依存する)。

計算は数値で行う必要があります。エレガントに(解析的に)定常分布を計算すればよいのですが、ここでは明らかに定義されていません。

 
Maxim Romanov:

の場合、正規分布には記憶がなく、次の各ステップが指示される確率は=50%である。

どのディストリビューションにも、メモリはありません。継続/逆転の確率は、分布の種類ではなく、増分の相関によって決まる(最も一般的な場合)。

増分の分布の種類から、もうひとつ、ある時間内にあるレベルに到達する 確率を決定することができます(私の理解が正しければ、私は数学者ではありません)。

このような問題は、オプションの計算で出てきますので、ググってみてください。

しかし、あなたは価値分布を使いたいようですが、ここでは何も言えません。