Aux spécialistes de la théorie des probabilités. J'ai un portefeuille de 10 actions. Quelle est la probabilité que 2 de mes 10 entreprises fassent faillite l'année prochaine ? - page 5

 
Nikolai Semko:

Pas fort sur R.

Expliquez les points suivants :

k<- 0:n est un vecteur de quantiles. Pouvez-vous donner un décryptage de ce concept ?

la deuxième valeur est le nombre d'entreprises en faillite (elle devrait être de 50), alors pourquoi ajoutez-vous le vecteur k à 50 ?

La troisième valeur est le nombre d'entreprises non en faillite (devrait être 4950). Avez-vous le 4950-n+k ?

La quatrième valeur est le nombre d'actions = 10. Tout semble aller bien ici.

R en ligne

k est un vecteur de valeurs possibles pour le nombre de faillites au cours de la deuxième année : 0, 1, ... , 9, 10.

n-k est un vecteur de 10, 9, ..., 1, 0 (caractéristique R)

Nombre total de boules 5010 = 5000 + 10

le nombre total de faillites n'est pas 50, mais 50+k, et non 4950-n+k (ici k n'est plus un vecteur, mais un nombre inconnu de 0 à 10)

Vous supposez qu'au cours de la deuxième année, nous avons 5000 entreprises, dont 50 feront également faillite. Ce n'est pas correct. Tout ce que nous savons, c'est que nous avons la même probabilité de faillite que l'année dernière - il pourrait bien y avoir 49 ou 52 faillites sur 5000 (la probabilité qu'il y en ait exactement 50 sur 5000 deux années de suite est très faible).

compile R online
  • rextester.com
compile R online
 
Aleksey Nikolayev:

R en ligne

k est un vecteur de valeurs possibles pour le nombre de faillites au cours de la deuxième année : 0, 1, .... , 9, 10.

n-k est un vecteur de 10, 9, ..., 1, 0 (caractéristique R)

Nombre total de boules 5010 = 5000 + 10

le nombre total de faillites n'est pas 50, mais 50+k, et non 4950-n+k (ici k n'est plus un vecteur, mais un nombre inconnu de 0 à 10)

Vous supposez qu'au cours de la deuxième année, nous avons 5000 entreprises, dont 50 feront également faillite. Ce n'est pas correct. Tout ce que nous savons, c'est que nous avons la même probabilité de faillite que l'année dernière - il peut y avoir 49 ou 52 faillites pour 5000 (la probabilité que deux années consécutives soient exactement 50 pour 5000 est très faible).

Encore une fois, je répète. Les conditions du problème sont loin d'être pratiques. Vous n'avez pas besoin d'ajouter des termes au problème au fur et à mesure. Moi aussi, j'ai eu la première idée de poser à l'auteur du sujet un tas de questions suggestives, mais je me suis rendu compte qu'il n'est pas nécessaire de compliquer les choses. La question est assez précise, mais loin d'être pratique.

Merci pour le lien. J'ai compris R. C'est beaucoup plus simple. Les résultats sont les mêmes que les miens :

p0 <- dhyper(0,50, 4950,10)
p1 <- dhyper(1,50, 4950,10)
p2 <- dhyper(2,50, 4950,10)
p0; p1; p2

Le résultat :

p0 = 0.9042998
p1 = 0.09150979
p2 = 0.004082944

Mes calculs ci-dessus :

P1 = (50!*4950!*10!*4990 !)/(49!*9!*4941!*5000 !) = (50*4950*4949*4948*4947*4946*4945*4944*4943*4942*10)/(5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) = 0.09150979127569519373319974384113

La probabilité de faillite est d'exactement 2 entreprises sur 10 :

P2 = (50!*4950!*10!*4990 !)/(2*48!*8!*4942!*5000 !) = (49*50*4950*4949*4948*4947*4946*4945*4944*4943*9*10)/(2*5000*4999*4998*4997*4996*4995*4994*4993*4992*4991) =0.00408294394502039462124049848583

HZ a immédiatement remarqué que vous avez quelque chose de faux, car dans ce cas la probabilité ne peut pas être égale à 1, elle doit être inférieure à 1.

Et la modélisation de cette situation a confirmé ces chiffres.

#define  total 10000000
void OnStart() {
   int sum[total];
   MathSrand(GetTickCount());
   for (int j=0; j<total; j++) {
      sum[j]=0;
      int b[10];
      for (int i=0; i<10; i++) {
         int r=35000;
         while (r>=30000) r=rand();
         b[i]=r%5000;
         if (b[i]<50) sum[j]++;
      }
      ArraySort(b);
      for (int i=0; i<9; i++) if (b[i]==b[i+1]) {
            j--;
            break;
         }
   }
   int s0=0,s1=0,s2=0;
   for (int j=0; j<total; j++) {
      if (sum[j]==0) s0++;
      if (sum[j]==1) s1++;
      if (sum[j]==2) s2++;
   }
   Print("Вероятность без банкротства - "+string(double(s0)/total)+"; Вероятность 1 банкротства - "+string(double(s1)/total)+";  Вероятность 2 банкротств -   "+string(double(s2)/total));
}
2020.01.06 10:52:56.474 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043109; Вероятность 1 банкротства - 0.0914961;  Вероятность 2 банкротств -   0.0040885
2020.01.06 10:53:10.916 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042554; Вероятность 1 банкротства - 0.0915793;  Вероятность 2 банкротств -   0.0040546
2020.01.06 10:53:16.937 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9043432; Вероятность 1 банкротства - 0.0914806;  Вероятность 2 банкротств -   0.0040718
2020.01.06 10:53:22.539 TestDouble (.BrentCrud,H1)      Вероятность без банкротства - 0.9042999; Вероятность 1 банкротства - 0.0915289;  Вероятность 2 банкротств -   0.0040653

 
Aleksey Nikolayev:

C'est précisément le cas où l'on peut tirer parti de la proximité de la distribution hyper-hiométrique avec la distribution binomiale. L'imprécision qui en résulte est beaucoup plus faible que l'imprécision associée à l'approximation du modèle (inégalité des probabilités de faillite des différentes entreprises, dépendance entre les faillites, etc.)

Une distribution binomiale exige que les probabilités soient indépendantes. Dans ce cas, la probabilité est dépendante.

 
Nikolai Semko:

Une distribution binomiale exige que les probabilités soient indépendantes. Dans ce cas, la probabilité est dépendante.

Pour un théoricien, la "probabilité indépendante" n'existe pas, il y a des événements indépendants.

Le modèle que vous avez utilisé ne correspond pas (ou plutôt, ne correspond qu'approximativement). Si vous ne le comprenez pas, c'est votre problème.
 
Aleksey Nikolayev:

Il n'y a pas de "probabilité indépendante" chez un théoricien, il y a des événements indépendants.

Je suis d'accord. C'est mieux comme ça.
Oui, je suis faible en terminologie. Et je n'ai qu'une connaissance amateur de la théorie des probabilités, pour être honnête.

 
Nikolai Semko:

Je suis d'accord. C'est mieux comme ça.
Oui, je suis faible en terminologie. Et en général, j'ai une connaissance amateur de la théorie des probabilités, pour être honnête.

Ne parlons pas de "votre" amateurisme, car je suis fatigué de saupoudrer "notre" tête de cendres.

et quel savoir cosmique Alexey a dans presque tout... Je n'ai qu'à lever les mains en signe d'étonnement.

 
Maxim Dmitrievsky:

Ne parlons pas de "votre" amateurisme, car je suis fatigué de saupoudrer "notre" tête de cendres.

et quel savoir cosmique Alexey a dans presque tout... Je n'ai qu'à lever les mains en signe d'étonnement...

:)
Oui, non, je suis sérieux. C'est plus un genre de chose intuitive et sur le pouce.

 
Maxim Dmitrievsky:

Ne parlons pas de "vos" amateurs, parce que je suis fatigué de saupoudrer "notre" tête de cendres.

et quel savoir cosmique Alexey a dans presque tout... Je ne peux que m'interroger, les mains levées en signe d'émerveillement.

Comme l'a dit Matroskin dans un cas similaire : "Je peux aussi broder... Et sur une machine à écrire...") )

 
Nikolai Semko:

:)
Oui, non, je suis sérieux. Je suis plutôt du genre intuitif et spontané.

Le MIT a un bon cours de théoricien sur youtube.

 
igrok333:
L'année dernière, 50 entreprises sur 5 000 ont fait faillite sur le marché américain. La probabilité qu'une entreprise fasse faillite est donc de 1/100.

J'ai un portefeuille de 10 actions.

Quelle est la probabilité qu'une de mes 10 entreprises fasse faillite en un an ? C'est facile à calculer.
La probabilité qu'une entreprise fasse faillite est de 1/100. Et nous prenons 10 entreprises, donc nous augmentons les chances que l'événement se produise par un facteur 10.
On obtient donc la probabilité : 1/100 * 10 = 1/10.

Quelle est la probabilité que 2 de mes 10 entreprises fassent faillite en un an ? Comment le calculer ?

c'était juste une citation complète du sujet. Il est souligné ce qui est une condition et noté ce qui est pertinent pour le domaine d'activité.

Où vois-tu des probabilités conditionnelles ici ? Il n'y en a pas. Il y a des statistiques de l'année dernière.

il n'y a même pas un nombre total d'entreprises au moment de l'investissement, c'est inconnu et d'ailleurs sans importance.

PS/ même pas surpris que les tracteurs labourent l'océan et que les AG battent le hasard :-)