[Matematica pura, fisica, chimica, ecc.: problemi di allenamento del cervello non legati in alcun modo al commercio - pagina 383

 
Richie:

WWer, cosa significa "misura della prima base"? La somma dei membri ?

Il numero di elementi (numeri).
 
WWer:

Dovete determinare (probabilisticamente (2sigma per esempio)) la dimensione della prima base dalla nuova base.

La dimensione è, come ho capito, la gamma di valori estremi, o cosa? In questo caso, se la distribuzione è nota, il problema può essere risolto.

Ma se la dimensione è un numero di numeri, non lo capisco. Mi faccia un esempio, per favore.

 
Mathemat:

La dimensione è, immagino, la diffusione degli estremi, o cosa? In questo caso, con una distribuzione nota, il problema può essere risolto.

Ma se la dimensione è un numero di numeri, non capisco qualcosa. Mi faccia un esempio, per favore.


Prendiamo i numeri naturali per semplicità: 1 2 3 4 5 ... X. Questa è la "X" che dobbiamo trovare.

scegliere a caso un numero da questa base. Per esempio "3"... la probabilità di scegliere un numero qualsiasi = 1/X.

Esempio. Supponiamo che ci siano 10 numeri: 1 2 3 4 5 6 7 8 9 10 (ho detto 10 per fare un esempio, in realtà questo è il numero che dobbiamo trovare)

Si campionano 20 numeri: 5 2 9 5 3 8 4 10 3 2 7 1 8 5 2 6 1 10 1

Ecco, ora dimentichiamo che avevamo la dimensione della prima base, e solo dalla seconda base dobbiamo trovarla.

È chiaro che la prima base sarà molto più grande e i numeri non sono consecutivi.

 

Wow, questo problema è risolvibile?

A condizione che i numeri nella prima base non abbiano ripetizioni, possiamo passare attraverso i campioni successivi e ricalcolare il numero di elementi (se lo stesso numero si ripete in essi, allora le ripetizioni non sono prese in considerazione - solo 1 volta è stato preso in considerazione, e le ulteriori occorrenze sono saltate). Ma dove sta la garanzia che il database originale non contenga più elementi di quelli che siamo stati in grado di ricalcolare? La probabilità è la probabilità. Dovremmo fare molti campioni. E il risultato sarà solo verificato (non importa quanti campioni abbiamo fatto) - ci sarà sempre una probabilità che almeno 1 elemento non sia incluso in nessun campione....

 

Onestamente, non capisco l'idea. E se i numeri sono quadrati di numeri naturali, cioè 1, 4, 9, ..., 625? A cosa è uguale X?

E come può essere stimato da un "campione" che è più grande della popolazione originale?

Può accennare a un'applicazione pratica - a cosa serve?

 
drknn:

Wow, questo problema è risolvibile?

A condizione che i primi numeri di base non abbiano ripetizioni, si può andare alle selezioni successive e ricalcolare il numero di elementi (se lo stesso numero di ripetuto in loro, poi le ripetizioni non contano - solo 1 volta ha contato, e ulteriori occorrenze di mancanti). Ma dove sta la garanzia che il database originale non contenga più elementi di quelli che siamo stati in grado di ricalcolare? La probabilità è la probabilità. Dovremmo fare molti campioni. E il risultato sarà solo verificato (non importa quanti campioni abbiamo fatto) - ci sarà sempre una probabilità che almeno 1 elemento non sia incluso in nessun campione....

Sì, certo che lo è)


Ecco perché dico "probabilisticamente".... quindi la risposta dovrebbe essere qualcosa del genere: dimensione della base 100000-110000 con una probabilità del 97%.... e se facciamo 300.000 campioni allora con una probabilità del 95% avremmo approssimativamente il 90% della base.

 
Mathemat:

Onestamente, non capisco l'idea. E se i numeri sono quadrati di numeri naturali, cioè 1, 4, 9, ..., 625? A cosa è uguale X?

E come faccio a stimarlo da un "campione" che è più grande della popolazione originale?

Può dare un accenno di applicazione pratica - a cosa serve?

Mando delle query al server, e in risposta ottengo 10 ID utente casuali dal database. Qui ho voluto risolvere un tale problema allo stesso tempo, che avrebbe saputo quanti almeno ci ID, e quante query inviare)

zy. ho 400000 id ora.

 
WWer:

Ciao, chi può risolvere questo problema?)

C'è una base di numeri diversi. Selezionare casualmente i numeri da esso e formato un'altra base (cioè, c'è già i numeri possono essere ripetuti). Puoi selezionarne quanti ne vuoi, ma è uno spreco di risorse e di tempo.

È necessario determinare (probabilisticamente (2sigma per esempio)) la dimensione della prima base dalla nuova base.

+ Sarebbe anche bello calcolare quanti campioni dovrebbero essere fatti per ottenere almeno il 90% della prima base.


MOJ del campione moltiplicato per 2
 
Prival:
determinare l'OLS dal campione e moltiplicare per 2.
OLS di cosa?
 
WWer:
MOS di cosa?


avete selezionato 100 numeri da una base, se la base è numerata da 1 a .... X in ordine. allora forse *2 di questi 100 numeri saranno X.

La funzione matad. rnd(2000) genera un numero casuale da 1 a 2000. Abbiamo preso 100 valori i=0...100 e calcolato tutto con loro. Naturalmente, il risultato non sarà esatto, perché questa statistica è un intervallo di confidenza - si può anche calcolare e a seconda della precisione si vuole determinare la giusta dimensione del campione