[アーカイブ!】純粋数学、物理学、化学など:トレードとは一切関係ない脳トレ問題集 - ページ 383

 
Richie:

WWer、「一塁側サイズ」ってなんだ?メンバーの合計?

要素数(個)。
 
WWer:

新しい塩基から最初の塩基の大きさを(確率的に(例えば2シグマ))決定する必要があるのです。

大きさは、私の理解では、極値の範囲というか、なんというか。この場合、分布が分かれば問題は 解決する。

でも、大きさが数字の大きさだとしたら、理解できない。例を挙げてください。

 
Mathemat:

サイズとは、極端な話、なんでしょうか?この場合、分布が分かっていれば、問題は解決する。

でも、大きさが数字の大きさだとしたら、何か理解できない。例を挙げてください。


簡単のために自然数で考えてみよう。1 2 3 4 5 ...これが、私たちが探すべき "X "です。

この中からランダムに数字を選ぶ。は、任意の数を選ぶ確率=1/Xである。

例 仮に10個の数字があるとします。1 2 3 4 5 6 7 8 9 10 (例として10としましたが、実際はこの数字を求める必要があります)

あなたは20個の数字をサンプリングします:5 2 9 5 3 8 4 10 3 2 7 1 8 5 2 6 1 10 1

ここで、今、1つ目のベースのサイズがあったことを忘れて、2つ目のベースからだけ、サイズを求めましょう。

一塁側はもっと大きくなるし、数字も連続しないことは明らかです。

 

うわー、この問題、全然解決できないんですか?

最初のデータベースの数字に繰り返しがないことを前提に、それ以降のサンプルを調べて要素数を再計算します(同じ数字が繰り返されている場合は、繰り返しは考慮されません - 1回だけ考慮され、それ以降の出現はスキップされます)。しかし、元のデータベースが、再計算できた以上の要素を含んでいないという保証はどこにあるのでしょうか?確率は確率。サンプルをたくさん作らなければならないでしょう。そして、その結果は、(いくらサンプルを作っても)検証されるだけで、どのサンプルにも少なくとも1つの要素が含まれていない確率がある......ということです。

 

正直言って、その発想はない。自然数の2乗、つまり1、4、9、...、625であればどうでしょう。Xは何に相当するのか?

また、元の母集団よりも大きな「サンプル」から、どのように推定できるのでしょうか。

何のために使うのか、実用化のヒントを教えてください。

 
drknn:

うわー、その問題、全然解決できないんですか?

最初の基本番号に繰り返しがないことを条件として、後続の選択に移動し、要素の数を再計算することができます(それらの中で繰り返される1と同じ数の場合は、繰り返しはカウントされません - ちょうど1回、それが含まれており、行方不明のさらなる発生)。しかし、元のデータベースが、再計算できた以上の要素を含んでいないという保証はどこにあるのでしょうか?確率は確率。サンプルをたくさん作らなければならないでしょう。そして、その結果は、(いくらサンプルを作っても)検証されるだけで、どのサンプルにも少なくとも1つの要素が含まれていない確率が ある......ということです。

はい、もちろんです)


だから、「確率的に」と 言ったのです......だから、答えはこうなるはずです:ベースサイズ100000-110000で97%の確率で......。 30万個のサンプルの場合、95%の確率で90%のベースがあることになります。

 
Mathemat:

正直言って、その発想はない。自然数の2乗、つまり1、4、9、...、625であればどうでしょう。Xは何に相当するのか?

また、元の母集団よりも大きな「サンプル」からどのように推定すればよいのでしょうか。

何のために使うのか、実用化のヒントを教えてください。

サーバーにクエリーを送り、その応答としてデータベースからランダムに10個のユーザーIDを取得します。ここで私は、少なくともそこにID、およびどのように多くのクエリを送信する方法を知っているだろう、同時にこのような問題を解決したかった)

zy. 私は今、400,000 ID を持っています。

 
WWer:

こんにちは、どなたかこの問題を解決してください)。

さまざまな数値のベースがあります。その中からランダムに数字を選び、別のベース(つまり、すでにある数字を繰り返すことができる)を形成する。好きなだけ選べますが、資源と時間の無駄です。

新しい塩基から最初の塩基の大きさを(確率的に(例えば2シグマ))決定する必要があるのです。

+ 一塁側の90%以上を取得するためには、何回サンプルを作ればよいかを計算することもできるとよい。


サンプルのMOJに2を掛けたもの
 
Prival:
は、標本からOLSを決定し、2を乗じる。
OLSは何の?
 
WWer:
MOSってなんだ?


あるベースから100個の数字を選んだとき、そのベースが1から...までの数字だとするとXを順番に並べると、この100個の数字のうち*2個がXになるかもしれない。

matad. rnd(2000) 関数は,1 から 2000 までの乱数を生成します.i=0...100の値を100個取り、それらですべてを計算した。 もちろん、この統計量は信頼区間 なので、結果は正確ではないだろう。それを計算して、必要な精度に応じて、正しいサンプルサイズを決定することもできる