Bernoulli, Moab-Laplace-Theorem; Kolmogorov-Kriterium; Bernoulli-Schema; Bayes-Formel; Tschebyscheff-Ungleichungen; Poisson-Verteilungsgesetz; Theoreme von Fisher, Pearson, Student, Smirnov usw., Modelle, einfache Sprache, ohne Formeln. - Seite 6

 
sergeyas:

Hören wir uns zunächst den Vortrag von Alexej an, da er der erste war, der dies getan hat.

Yusuf und alle anderen, bitte verstehen Sie das nicht als eine Beeinträchtigung Ihres Wissens zu diesem Thema.

Anstatt konsequent zu sein, fangen Sie an, zusätzliche Terminologie zu verwenden und sich selbst zu übertreffen.



Es ist eine Krankheit der Händler. Angst, den Knopf nicht drücken zu können. Ich selbst bin auch so.
 

Das Konzept der Normalverteilung aus Kapitel 9 von Bollinger on Bollinger Bands

 
 

Dieser Thread verspricht, ein gutes Wissensreservoir zu sein.

Vor langer Zeit beschloss ich, die Normalverteilung in die Praxis umzusetzen, wozu ich ein numerisches Experiment durchführte. Ich habe 500 kumulative Serien von 10.000 unabhängigen Tests durchgeführt. Wir erhalten 500 zufällige unverbundene Graphen. Wir nehmen für sie denselben Bezugspunkt und schauen, wie sie mit der Zeit, genauer gesagt, mit der Zunahme der Anzahl der Tests, auseinandergehen. Ihre Divergenz wird also dem Gesetz der Normalverteilung gehorchen, und insgesamt werden sie eine Glocke der Normalverteilung bilden:

Interessant ist, dass die durchschnittliche Divergenz gleich der Quadratwurzel aus der Anzahl der Versuche ist. Nach 1.000 Versuchen können wir also mit Recht erwarten, dass eine beliebige Serie im Durchschnitt 32 Punkte von ihrer ursprünglichen Nullposition entfernt ist, während sie nach 10.000 Versuchen nur noch 100 Punkte entfernt ist. Das kann man an der Form der Glocke erkennen. Zunächst divergiert sie stark genug zu den Seiten hin, und dann beginnt die "Geschwindigkeit" der Divergenz abzunehmen.

Eine interessante Tatsache ist, dass die Summe aller 500 Reihen, unabhängig von der Anzahl der Versuche, annähernd Null ist. Dies wird in der Abbildung perfekt veranschaulicht: 50 % der Reihen lagen nach 10.000 Versuchen über Null, während 50 % über Null lagen. Somit tendiert der durchschnittliche Zustand oder die mathematische Erwartung aller Systeme gegen Null.

Ich habe daher eine Frage an Kenner: Wie berechnet man die Abweichung der tatsächlichen mathematischen Erwartung von der theoretischen Null-MO? Schließlich ist natürlich nicht zu erwarten, dass die Summe aller Tests eindeutig gleich 0 ist. Sie kann +3 oder -20 oder so betragen. Und eine zweite Teilfrage: Wird dieser Fehlerwert mit zunehmender Anzahl von Versuchen auf Null zusammenbrechen, oder wird er auf einem Niveau "einfrieren", das proportional zur Quadratwurzel der Anzahl der Versuche ist?

 
C-4:

Wie berechnet man die Abweichung der tatsächlichen mathematischen Erwartung von der theoretischen Null-MO? Schließlich ist natürlich nicht zu erwarten, dass die Summe aller Tests eindeutig 0 ist. Sie kann +3 oder -20 oder so betragen. Und eine zweite Teilfrage: Wird dieser Fehlerwert mit zunehmender Anzahl von Versuchen auf Null zusammenbrechen, oder wird er auf einem Niveau "einfrieren", das proportional zur Quadratwurzel der Anzahl der Versuche ist?


sb ist die Summe der unabhängigen Zufallsvariablen. Die Inkremente sollen normalverteilt sein mit mo=0, sko=X. Dann ist die Summe von N Inkrementen auch NR mit mo=0, sko=SQRT(N)*X, was Sie in der Abbildung sehen (N ist dort 10000).

Nimmt man die Summe von M solchen unabhängigen sbs, so ist sie ebenfalls normalverteilt mit mo=0, sko=SQRT(M*N)*X

Wenn also die Anzahl der Versuche zunimmt, wird die Summe nicht einfrieren oder gegen Null tendieren, sondern im Verhältnis zur Wurzel aus der Anzahl der Versuche zunehmen. Das arithmetische Mittel (ebenfalls geteilt durch die Anzahl der Versuche) konvergiert jedoch gegen Null, wenn die Anzahl der Versuche zunimmt, und zwar aufgrund des bereits erwähnten Satzes von Bernoulli

 
Was sind "Schwänze" in der Verteilung? Handelt es sich um Ausreißer, die deutlich aus der Verteilung herausragen?
 

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

OK, lassen Sie mich versuchen, das Problem zu lösen: Es werden 10 kumulative Serien von jeweils 10.000 Tests gegeben. Das Endergebnis der Reihe lautet wie folgt:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Insgesamt
40

Die Summe der M unabhängigen Geschwister ist +40. Setze das Ergebnis in die Formel ein: SQRT(40*10.000) * 100 = 63.245. Etwas unzureichendes Ergebnis stellt sich heraus. Ich habe wohl missverstanden, was "Summe von M" bedeutet.

Oder bedeutet es, dass alle Experimente einzeln aneinandergereiht werden sollten und die Abweichung des Endergebnisses vom M.O. analysiert werden sollte?

 
C-4: Vor langer Zeit beschloss ich, eine Normalverteilung in der Praxis zu erhalten, wozu ich ein numerisches Experiment durchführte. Ich habe 500 kumulative Serien von 10.000 unabhängigen Tests durchgeführt. Wir erhalten 500 zufällige, nicht zusammenhängende Graphen. Wir nehmen für sie denselben Bezugspunkt und beobachten, wie sie mit der Zeit, oder genauer gesagt, mit der Zunahme der Anzahl der Tests, voneinander abweichen. Ihre Divergenz wird also dem Normalverteilungsgesetz gehorchen, und insgesamt werden sie eine Glocke der Normalverteilung bilden:

Es ist keine gute Idee, eine Normalverteilung zu illustrieren. Ich bin mir nicht sicher, ob das Anhalten des Prozesses bei, sagen wir, 10.000 eine exakte Normalverteilung im Querschnitt ergibt. Außerdem hat diese Verteilung Parameter, die sich ständig ändern.

Wenn ich falsch liege - geben Sie mir einen Link, wo behauptet wird, dass die Verteilung des "Querschnitts" (d.h. der Abweichungen von Null) zumindest asymptotisch normal ist.

SProgrammer: Dies zu verstehen ist der Schlüssel zum Verständnis von 90% im Theorem.

Ohne Formeln werden Sie kein Gefühl für die Leber bekommen. Sie wissen es selbst. Aber Sie können hier keine Formeln verwenden.

yosuf: Dies zeigt, dass die Lösungen der Materialbilanzgleichungen und der Theoretergesetze übereinstimmen und sich bei der Interpretation der Ergebnisse der Analyse von Phänomenen gegenseitig ergänzen.

Haben Sie noch nicht gehört, dass die Gamma-Funktion in allen möglichen Bereichen der Wissenschaft und Technik zu finden ist?

Ich sehe nichts Übernatürliches in seinem Aussehen bei der Lösung von Diphuras. Und Sie haben die Gamma-Verteilung nur erwähnt, weil Sie gesehen haben, wie diese Funktion in Excel genannt wird. Nun, welche Verbindung besteht zwischen deinen Diphuras und einem Terver, Yusuf?

SProgrammer sagt richtig, dass es nur sehr wenige tatsächlich genutzte Verteilungen in der terver/matstat gibt - obwohl man sie nach Belieben erfinden kann. Ich empfehle Ihnen also, wenn Sie immer noch so begeistert von (18) sind, zu versuchen, über Erlang nachzudenken und darüber, woher Sie es haben. Versuchen Sie einfach, Ihre Überlegungen nicht als prägnante Schlussfolgerungen wie die oben zitierte zu formulieren, sondern in einer umfassenderen Form.

Ich habe in Feller, Band 2, nachgeschlagen. Dort steht etwas über Gamma-Verteilung, aber es hat schreckliche Formeln und nur ein paar Worte über Erlang. Also nicht hier.

Aber es gibt etwas Interessantes über die Exponentialverteilung (Feller, Bd. 2, S. 69):


Dies ist besonders interessant, weil die Verteilung der Preisrenditen durch die Laplace-Verteilung gut angenähert wird.
 
C-4:

OK, lassen Sie mich versuchen, das Problem zu lösen: Es werden 10 kumulative Serien von jeweils 10.000 Tests gegeben. Das Endergebnis der Reihe lautet wie folgt:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Insgesamt
40

Die Summe der M unabhängigen Geschwister ist +40. Setze das Ergebnis in die Formel ein: SQRT(40*10.000) * 100 = 63.245. Etwas unzureichendes Ergebnis stellt sich heraus. Ich habe wohl missverstanden, was "Summe von M" bedeutet.

Oder bedeutet es, dass alle Experimente in einer Kette aneinandergereiht werden müssen und die Abweichung des Endergebnisses vom M.O. zu analysieren ist?


Basil, fangen wir ganz am Anfang an. Haben Sie einen Random Walk als kumulative Summe von münzähnlichen Inkrementen modelliert? Zwei Ergebnisse +1 und -1 mit gleichen Wahrscheinlichkeiten 0,5/0,5. Diese Zufallsvariable selbst ist nicht normalverteilt - sie ist eine diskrete Verteilung mit 2 Werten. Sein MO=0 und RMS=SQRT(0,5*0,5)=0,5

Dann betrachten wir den Random Walk bereits als eine Summe dieser Inkremente. Angenommen, wir nehmen 10000 Schritte, wie Sie es tun. Wie hoch wird der Betrag sein? Offensichtlich handelt es sich um eine Zufallsvariable (die zweite). Wenn die Inkremente unabhängig sind, konvergiert diese Verteilung mit zunehmender Anzahl von Versuchen zu einer Normalverteilung mit MO=0, RMS=SQRT(10000)*0.5=50. Daraus und aus der 3x-Sigma-Regel lässt sich zum Beispiel ableiten, dass über 99% der Realisierungen dieser SV in das Intervall -150...+150 fallen werden. D.h. außerhalb dieses Intervalls weniger als 10000*0,01=100 CB-Erkenntnisse.

Dann berücksichtigen Sie bereits die Summe dieser CBs. Sie haben in der Spalte die Summe von 10 Realisierungen dieser CB. Es wird die neue (bereits dritte) SA sein, die ebenfalls normalverteilt ist mit MO=0, RMS=50*SQRT(10) =158. Was Sie insgesamt +40 haben, ist nur eine Realisierung dieser dritten SV. Aber sie variiert sehr stark. Auch hier werden 99 % der Daten im Bereich -474...+474 liegen.

 
Die Theoretiker-Wale haben meine kleine Frage vergessen(