Teorema de Bernoulli, Moab-Laplace; critério Kolmogorov; esquema de Bernoulli; fórmula Bayes; desigualdades Chebyshev; lei de distribuição Poisson; teoremas Fisher, Pearson, Student, Smirnov etc., modelos, linguagem simples, sem fórmulas. - página 6

 
sergeyas:

Vamos ouvir primeiro a apresentação de Alexei, já que ele foi o primeiro a fazê-lo.

Yusuf e todos os outros, por favor, não tomem isso como uma diminuição de seus conhecimentos sobre o assunto.

Em vez de consistência, você começa a empilhar em terminologia adicional e a se antecipar.



É uma doença dos comerciantes. Com medo de não poder apertar o botão. Eu mesmo sou assim.
 

O conceito de uma distribuição normal do Capítulo 9 do Bollinger em Bandas de Bollinger

 
 

Este fio promete ser um bom reservatório de conhecimento.

Há muito tempo atrás, decidi fazer a distribuição normal na prática, para a qual realizei uma experiência numérica. Eu fiz 500 séries cumulativas de 10.000 testes independentes. Obtemos 500 gráficos sem conexão aleatória. Tomamos para eles o mesmo ponto de referência e vemos como eles irão divergir com o tempo, ou para ser mais exato, com o aumento do número de testes. Assim, sua divergência obedecerá à lei de distribuição normal e, no conjunto, formará um sino da distribuição normal:

O que é interessante é que a divergência média será igual à raiz quadrada do número de provas. Assim, após 1.000 tentativas, temos o direito de esperar que, em média, qualquer uma das séries esteja a 32 pontos de sua posição original zero, enquanto que após 10.000 tentativas, estará a apenas 100 pontos de distância. Você pode ver isso pela forma do sino. No início, ela diverge o suficiente para os lados, e então a "velocidade" da divergência começa a diminuir.

Um fato interessante é que a soma de todas as 500 séries, não importa quantas provas haja nelas, será aproximadamente zero. Isto está perfeitamente ilustrado na figura: 50% da série estavam acima de zero após 10.000 tentativas, enquanto 50% estavam acima de zero. Assim, o estado médio ou a expectativa matemática de todos os sistemas tenderá para zero.

Portanto, tenho uma pergunta para os conhecedores: como calcular o desvio da expectativa matemática real em relação ao MO teórico, zero? Afinal, é claro, não há nada a esperar que a soma de todos os testes seja claramente igual a 0. Pode ser igual a +3 ou -20 ou mais ou menos. E uma segunda sub-question: este valor de erro cairá a zero com o aumento das tentativas, ou "congelará" em um nível proporcional à raiz quadrada do número de tentativas?

 
C-4:

como calcular o desvio da expectativa matemática real em relação ao MO teórico, zero? Afinal, é claro, não há nada a esperar que a soma de todos os testes seja claramente 0. Pode ser +3 ou -20 ou mais ou menos. E uma segunda sub-question: este valor de erro cairá a zero com o aumento das tentativas, ou "congelará" em um nível proporcional à raiz quadrada do número de tentativas?


sb é a soma de variáveis aleatórias independentes. Que os incrementos sejam normalmente distribuídos com mo=0, sko=X. Então a soma dos incrementos de N é também NR com mo=0, sko=SQRT(N)*X, que é o que você tem na figura (N há 10000).

Se tomarmos a soma de M tais sbs independentes, ela também será normalmente distribuída com mo=0, sko=SQRT(M*N)*X

Assim, quando o número de tentativas aumenta, a soma não congela ou tende a zero, mas aumenta em proporção à raiz do número de tentativas. Mas a média aritmética (também dividida pelo número de tentativas), convergirá para zero quando o número de tentativas aumentar devido ao teorema de Bernoulli já considerado

 
O que são "rabos" na distribuição? Eles são aberrantes e claramente desproporcionados em relação à distribuição geral?
 

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

OK, deixe-me tentar resolver o problema: 10 séries acumulativas de 10.000 testes cada uma são dadas. O resultado final da série é o seguinte:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Total
40

A soma dos irmãos independentes M é de +40. Substituir o resultado na fórmula: SQRT(40*10.000) * 100 = 63.245. Algo inadequado acontece. Eu devo ter entendido mal o que significa "soma de M".

Ou significa que todos os experimentos devem ser alinhados um a um e analisar o desvio do resultado final do M.O.?

 
C-4: Há muito tempo, decidi obter uma distribuição normal na prática, para a qual realizei uma experiência numérica. Eu fiz 500 séries cumulativas de 10.000 testes independentes. Obtemos 500 gráficos aleatórios não relacionados. Tomamos para eles o mesmo ponto de referência e vemos como eles irão divergir com o tempo, ou para ser mais exato, com o aumento do número de testes. Assim, sua divergência obedecerá à lei normal de distribuição e, no conjunto, formará um sino da distribuição normal:

Não é uma boa idéia para ilustrar uma distribuição normal. Não tenho certeza de que parar o processo em, digamos, 10.000 dará exatamente uma distribuição normal na seção transversal. Além disso, esta distribuição tem parâmetros que estão em constante mudança.

Se eu estiver errado - me dê um link onde se afirma que a distribuição da "seção transversal" (ou seja, divergências em relação a zero) é pelo menos assimptóticamente normal.

SProgrammer: Entender isto é a chave para entender 90% no teorema.

Sem fórmulas, você não terá uma sensação no fígado. Você mesmo sabe disso. Mas você não pode usar fórmulas aqui.

yosuf: Isto mostra que as soluções das equações de equilíbrio material e as leis do teorímetro coincidem e são mutuamente complementares na interpretação dos resultados da análise dos fenômenos.

Você não ouviu dizer que a função gama é encontrada em todos os tipos de campos da ciência e da engenharia?

Não vejo nada de sobrenatural em sua aparência ao resolver as difuras. E você só trouxe à tona a distribuição gama porque viu como esta função é chamada no Excel. Bem, que conexão em suas difras com um terver, Yusuf?!

SProgrammer diz corretamente que há muito poucas distribuições realmente usadas no terver/matstat - embora você possa compô-las o quanto quiser. Portanto, para você também, se você ainda está tão encantado (18), recomendo que tente pensar em Erlang e de onde você tirou isso. Tente apenas colocar suas reflexões não de forma tão incisiva como a citada acima, mas de uma forma mais completa.

Procurei Feller, vol. 2. Há algo sobre distribuição gama, mas tem fórmulas horríveis e apenas algumas palavras sobre Erlang. Portanto, não aqui.

Mas há algo interessante sobre a distribuição exponencial (Feller, vol. 2, p. 69):


Isto é particularmente interessante porque a distribuição dos retornos de preços é bem aproximada pela distribuição Laplace.
 
C-4:

OK, deixe-me tentar resolver o problema: 10 séries acumulativas de 10.000 testes cada uma são dadas. O resultado final da série é o seguinte:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Total
40

A soma dos irmãos independentes M é de +40. Substituir o resultado na fórmula: SQRT(40*10.000) * 100 = 63.245. Um resultado um pouco inadequado se revela. Eu devo ter entendido mal o que significa "soma de M".

Ou significa que todos os experimentos devem ser alinhados em uma cadeia um a um e analisar o desvio do resultado final do M.O.?


Basiléia, vamos começar pelo início. Você já modelou uma caminhada aleatória como uma soma cumulativa de incrementos do tipo moeda? Dois resultados +1 e -1 com probabilidades iguais 0,5/0,5. Esta variável aleatória em si não é normalmente distribuída - é uma distribuição discreta com 2 valores. Seus MO=0 e RMS=SQRT(0,5*0,5)=0,5

Então, já consideramos a caminhada aleatória como uma soma desses incrementos. Suponha que tomemos 10000 incrementos como você faz. O que será igual a isso? Obviamente, é uma variável aleatória (a segunda). Se os incrementos forem independentes, esta distribuição convergirá para o normal com um número crescente de testes com MO=0, RMS=SQRT(10000)*0,5=50. A partir disto e da regra 3x sigma, por exemplo, pode-se deduzir que mais de 99% das realizações desta SV cairão no intervalo -150...+150. Isto é, fora deste intervalo menos de 10000*0,01=100 realizações CB.

Então você já considera a soma desses CBs. Você tem na coluna a soma de 10 realizações deste CB. Será nova (já terceira) SA, que também é distribuída normalmente com MO=0, RMS=50*SQRT(10) =158. O que você tem no total +40 é apenas uma realização deste terceiro SV. Mas isso varia bastante. Novamente, 99% dos dados estarão na faixa -474...+474

 
As baleias teóricas esqueceram minha pequena pergunta(