[Archiv!] Reine Mathematik, Physik, Chemie usw.: Gehirntrainingsprobleme, die in keiner Weise mit dem Handel zusammenhängen - Seite 383

 
Richie:

WWer, was bedeutet "First Base Size"? Die Summe der Mitglieder ?

Die Anzahl der Elemente (Zahlen).
 
WWer:

Sie müssen (probabilistisch (z. B. 2sigma)) die Größe der ersten Basis von der neuen Basis aus bestimmen.

Die Größe ist, so wie ich es verstehe, der Bereich der Extremwerte, oder was? In diesem Fall kann das Problem gelöst werden, wenn die Verteilung bekannt ist.

Aber wenn Größe eine Anzahl von Zahlen ist, dann verstehe ich das nicht. Nennen Sie mir bitte ein Beispiel.

 
Mathemat:

Die Größe ist, so nehme ich an, die Spanne der Extreme, oder was? In diesem Fall kann das Problem mit einer bekannten Verteilung gelöst werden.

Aber wenn Größe eine Anzahl von Zahlen ist, verstehe ich etwas nicht. Nennen Sie mir bitte ein Beispiel.


Nehmen wir der Einfachheit halber natürliche Zahlen: 1 2 3 4 5 ... X. Das ist das "X", das wir finden müssen.

Wählen Sie zufällig eine Zahl aus dieser Basis. z.B. "3"... die Wahrscheinlichkeit, eine beliebige Zahl zu wählen = 1/X.

Beispiel. Angenommen, es gibt 10 Zahlen: 1 2 3 4 5 6 7 8 9 10 (ich habe 10 nur als Beispiel gesagt, in Wirklichkeit ist das die Zahl, die wir finden müssen)

Nehmen wir 20 Zahlen als Beispiel: 5 2 9 5 3 8 4 10 3 2 7 1 8 5 2 6 1 10 1

Vergessen wir jetzt, dass wir die Größe der ersten Basis hatten, und wir müssen sie nur von der zweiten Basis aus ermitteln.

Es ist klar, dass die erste Basis viel größer sein wird und die Zahlen nicht fortlaufend sind.

 

Wow, ist dieses Problem überhaupt lösbar?

Unter der Voraussetzung, dass die Zahlen in der ersten Datenbank keine Wiederholungen aufweisen, können wir die nachfolgenden Stichproben durchgehen und die Anzahl der Elemente neu berechnen (wenn sich dieselbe Zahl in ihnen wiederholt, werden die Wiederholungen nicht berücksichtigt - es wird nur ein Mal berücksichtigt, und weitere Vorkommen werden übersprungen). Aber wo ist die Garantie, dass die ursprüngliche Datenbank nicht mehr Elemente enthält, als wir neu berechnen konnten? Wahrscheinlichkeit ist Wahrscheinlichkeit. Wir müssten eine Menge Proben nehmen. Und das Ergebnis wird nur verifiziert (egal wie viele Stichproben wir gemacht haben) - es wird immer eine Wahrscheinlichkeit geben, dass mindestens 1 Element nicht in einer Stichprobe enthalten ist....

 

Ehrlich gesagt, verstehe ich die Idee nicht. Was ist, wenn die Zahlen die Quadrate der natürlichen Zahlen sind, d.h. 1, 4, 9, ..., 625? Was ist X gleich?

Und wie kann sie anhand einer "Stichprobe" geschätzt werden, die größer ist als die Grundgesamtheit?

Können Sie eine praktische Anwendung andeuten - wofür ist sie gedacht?

 
drknn:

Wow, ist dieses Problem überhaupt lösbar?

Vorausgesetzt, dass die ersten Basiszahlen keine Wiederholungen haben, können Sie zu den nachfolgenden Auswahlen gehen und die Anzahl der Elemente neu berechnen (wenn die gleiche Anzahl an Wiederholungen in ihnen vorkommt, dann zählen Wiederholungen nicht - nur 1 Mal wird gezählt, und weitere Vorkommen fehlen). Aber wo ist die Garantie, dass die ursprüngliche Datenbank nicht mehr Elemente enthält, als wir neu berechnen konnten? Wahrscheinlichkeit ist Wahrscheinlichkeit. Wir müssten eine Menge Proben nehmen. Und das Ergebnis wird nur verifiziert (egal wie viele Stichproben wir gemacht haben) - es wird immer eine Wahrscheinlichkeit geben, dass mindestens 1 Element nicht in einer Stichprobe enthalten ist....

Ja, natürlich ist es das)


deshalb sage ich "probabilistisch".... die Antwort sollte also in etwa so lauten: Basisgröße 100000-110000 mit einer Wahrscheinlichkeit von 97%.... und wenn wir 300.000 Stichproben machen, haben wir eine 95%ige Wahrscheinlichkeit von 90% der Basis.

 
Mathemat:

Ehrlich gesagt, verstehe ich die Idee nicht. Was ist, wenn die Zahlen Quadrate von natürlichen Zahlen sind, d.h. 1, 4, 9, ..., 625? Was ist X gleich?

Und wie schätze ich sie anhand einer "Stichprobe", die größer ist als die Grundgesamtheit?

Können Sie einen Hinweis auf die praktische Anwendung geben - wofür ist es gedacht?

Ich sende Abfragen an den Server, und als Antwort erhalte ich 10 zufällige Benutzer-IDs aus der Datenbank. Hier wollte ich ein solches Problem zur gleichen Zeit zu lösen, dass würde wissen, wie viele mindestens dort ID, und wie viele Abfragen zu senden)

zy. ich habe jetzt 400000 id.

 
WWer:

Hallo, wer kann dieses Problem lösen?):

Es gibt eine Basis von verschiedenen Zahlen. Wählen Sie nach dem Zufallsprinzip Zahlen aus und bilden Sie eine weitere Basis (das heißt, es können bereits Zahlen wiederholt werden). Sie können so viele auswählen, wie Sie wollen, aber es ist eine Verschwendung von Ressourcen und Zeit.

Sie müssen (probabilistisch (z. B. 2sigma)) die Größe der ersten Basis aus der neuen Basis bestimmen.

+ Es wäre auch schön, wenn man berechnen könnte, wie viele Proben man nehmen müsste, um mindestens 90 % der ersten Basis zu erhalten.


MOJ der Stichprobe multipliziert mit 2
 
Prival:
die OLS aus der Stichprobe ermitteln und mit 2 multiplizieren.
OLS von was?
 
WWer:
MOS von was?


Sie haben 100 Zahlen aus einer Basis ausgewählt, wenn die Basis von 1 bis .... nummeriert ist. X in der Reihenfolge. dann werden vielleicht *2 dieser 100 Zahlen X sein.

Die Funktion matad. rnd(2000) erzeugt eine Zufallszahl von 1 bis 2000. Wir haben 100 Werte von i=0...100 genommen und alles damit berechnet. Natürlich wird das Ergebnis nicht exakt sein, denn diese Statistik ist ein Konfidenzintervall - man kann es auch berechnen und je nach benötigter Genauigkeit den richtigen Stichprobenumfang bestimmen