Agli specialisti della teoria della probabilità. Ho un portafoglio di 10 azioni. Qual è la probabilità che 2 delle mie 10 aziende falliscano l'anno prossimo? - pagina 5

 
Nikolai Semko:

Non forte su R.

Spiega i seguenti punti:

k<- 0:n è un vettore di quantili. Puoi dare una decifrazione di questo concetto?

il secondo valore è il numero di aziende fallite (dovrebbe essere 50), allora perché si aggiunge il vettore k a 50?

Il terzo valore è il numero di aziende non fallite (dovrebbe essere 4950). Avete il 4950-n+k?

Il quarto valore è il numero di azioni = 10. Tutto sembra essere a posto qui.

R online

k è un vettore di valori possibili per il numero di fallimenti nel secondo anno: 0, 1, ... , 9, 10.

n-k è un vettore di 10, 9, ..., 1, 0 (caratteristica R)

Numero totale di palline 5010 = 5000 + 10

il numero totale di fallimenti non è 50, ma 50+k, non 4950-n+k (qui k non è più un vettore, ma un numero sconosciuto da 0 a 10)

Si suppone che nel secondo anno ci siano 5000 imprese, di cui 50 falliranno. Questo non è corretto. Tutto quello che sappiamo è che abbiamo la stessa probabilità di fallimento dell'anno scorso - ci possono essere 49 o 52 fallimenti su 5000 (la probabilità che ci siano esattamente 50 su 5000 per due anni di seguito è molto piccola).

compile R online
  • rextester.com
compile R online
 
Aleksey Nikolayev:

R online

k è un vettore di valori possibili per il numero di fallimenti nel secondo anno: 0, 1, ... , 9, 10.

n-k è un vettore di 10, 9, ..., 1, 0 (caratteristica R)

Numero totale di palline 5010 = 5000 + 10

il numero totale di fallimenti non è 50, ma 50+k, non 4950-n+k (qui k non è più un vettore, ma un numero sconosciuto da 0 a 10)

Si suppone che nel secondo anno ci siano 5000 imprese, di cui 50 falliranno. Questo non è corretto. Tutto quello che sappiamo è che abbiamo la stessa probabilità di fallimento dell'anno scorso - ci possono essere 49 o 52 fallimenti su 5000 (la probabilità che due anni di fila siano esattamente 50 su 5000 è molto piccola).

Ancora una volta, lo ripeto. Le condizioni del problema sono tutt'altro che pratiche. Non è necessario aggiungere termini al problema man mano che si procede. Anch'io ho avuto la prima idea di fare all'autore dell'argomento un sacco di domande di punta, ma ho capito che non c'è bisogno di complicare le cose. La domanda è abbastanza specifica, anche se lontana dalla pratica.

Grazie per il link. Ho capito R. È molto più semplice. I risultati sono gli stessi del mio:

p0 <- dhyper(0,50, 4950,10)
p1 <- dhyper(1,50, 4950,10)
p2 <- dhyper(2,50, 4950,10)
p0; p1; p2

Il risultato:

p0 = 0.9042998
p1 = 0.09150979
p2 = 0.004082944

I miei calcoli di cui sopra:

P1 = (50!*4950!*10!*4990!)/(49!*9!*4941!*5000!) = (50*4950*4949*4948*4947*4946*4945*4944*4943*4942*10)/(5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) = 0.09150979127569519373319974384113

La probabilità di fallimento è esattamente 2 su 10 aziende:

P2 = (50!*4950!*10!*4990!)/(2*48!*8!*4942!*5000!) = (49*50*4950*4949*4948*4947*4946*4945*4944*4943*9*10)/(2*5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) =0.00408294394502039462124049848583

HZ ha notato subito che hai qualcosa di sbagliato, perché in questo caso la probabilità non può essere uguale a 1, deve essere inferiore a 1.

E la modellazione di questa situazione ha confermato quei numeri.

#define  total 10000000
void OnStart() {
   int sum[total];
   MathSrand(GetTickCount());
   for (int j=0; j<total; j++) {
      sum[j]=0;
      int b[10];
      for (int i=0; i<10; i++) {
         int r=35000;
         while (r>=30000) r=rand();
         b[i]=r%5000;
         if (b[i]<50) sum[j]++;
      }
      ArraySort(b);
      for (int i=0; i<9; i++) if (b[i]==b[i+1]) {
            j--;
            break;
         }
   }
   int s0=0,s1=0,s2=0;
   for (int j=0; j<total; j++) {
      if (sum[j]==0) s0++;
      if (sum[j]==1) s1++;
      if (sum[j]==2) s2++;
   }
   Print("Вероятность без банкротства - "+string(double(s0)/total)+"; Вероятность 1 банкротства - "+string(double(s1)/total)+";  Вероятность 2 банкротств -   "+string(double(s2)/total));
}
2020.01.06 10:52:56.474 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043109; Вероятность 1 банкротства - 0.0914961;  Вероятность 2 банкротств -   0.0040885
2020.01.06 10:53:10.916 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042554; Вероятность 1 банкротства - 0.0915793;  Вероятность 2 банкротств -   0.0040546
2020.01.06 10:53:16.937 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043432; Вероятность 1 банкротства - 0.0914806;  Вероятность 2 банкротств -   0.0040718
2020.01.06 10:53:22.539 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042999; Вероятность 1 банкротства - 0.0915289;  Вероятность 2 банкротств -   0.0040653

 
Aleksey Nikolayev:

Questo è precisamente il caso in cui si può approfittare della vicinanza della distribuzione iper-hiometrica alla distribuzione binomiale. L'imprecisione risultante è molto più piccola dell'imprecisione associata all'approssimazione del modello (ineguaglianza delle probabilità di fallimento delle diverse imprese, dipendenza tra i fallimenti, ecc.)

Una distribuzione binomiale richiede che le probabilità siano indipendenti. In questo caso, la probabilità è dipendente.

 
Nikolai Semko:

Una distribuzione binomiale richiede che le probabilità siano indipendenti. In questo caso, la probabilità è dipendente.

Non esiste una cosa come la "probabilità indipendente" in un teorico, ci sono eventi indipendenti.

Il modello che hai usato non si adatta (o meglio, si adatta solo approssimativamente). Se non lo capite, è un problema vostro.
 
Aleksey Nikolayev:

Non esiste una cosa come la "probabilità indipendente" in un teorico, ci sono eventi indipendenti.

Sono d'accordo. Suona meglio così.
Sì, sono debole nella terminologia. E ho una conoscenza amatoriale della Teoria della Probabilità, per essere onesti.

 
Nikolai Semko:

Sono d'accordo. Suona meglio così.
Sì, sono debole nella terminologia. E in generale ho una conoscenza amatoriale della Teoria della Probabilità, per essere onesti.

Non parliamo del "tuo" dilettantismo, perché sono stanco di cospargere la "nostra" testa di cenere

e che conoscenza cosmica ha Alexey in quasi tutto... Non mi resta che alzare le mani per lo stupore.

 
Maxim Dmitrievsky:

Non parliamo del "tuo" dilettantismo, perché sono stanco di cospargere la "nostra" testa di cenere

e che conoscenza cosmica ha Alexey in quasi tutto... Non mi resta che alzare le mani per lo stupore...

:)
Sì, no, sono serio. Più una cosa intuitiva e in movimento.

 
Maxim Dmitrievsky:

Non parliamo dei "vostri" dilettanti, perché sono stanco di cospargere di cenere la "nostra" testa

e che conoscenza cosmica ha Alexey in quasi tutto... Posso solo chiedermi con le mani alzate in segno di meraviglia.

Come disse Matroskin in un caso simile: "Posso anche ricamare... E su una macchina da scrivere...") )

 
Nikolai Semko:

:)
Sì, no, sono serio. Sono più un tipo intuitivo e al volo.

Il MIT ha un buon corso per teorici su youtube.

 
igrok333:
L'anno scorso 50 aziende su 5.000 sono fallite nel mercato statunitense. Quindi la probabilità che un'azienda fallisca è di 1/100.

Ho un portafoglio di 10 azioni.

Qual è la probabilità che 1 delle mie 10 aziende fallisca in un anno? È facile da calcolare.
La probabilità che un'azienda fallisca è di 1/100. E prendiamo 10 aziende, quindi aumentiamo le probabilità che l'evento si verifichi di un fattore 10.
Così otteniamo la probabilità: 1/100 * 10 = 1/10.

Qual è la probabilità che 2 delle mie 10 aziende falliscano in un anno? Come si calcola questo?

era solo una citazione completa dell'argomento. Si sottolinea ciò che è una condizione e si nota ciò che è pertinente all'area tematica

Dove vedi le probabilità condizionali qui? Non ce ne sono. Ci sono statistiche dell'anno scorso.

non c'è nemmeno un numero totale di aziende al momento dell'investimento, è sconosciuto e comunque poco importante.

PS/ non mi sorprende nemmeno che i trattori solchino l'oceano e i GA battano a caso :-)