Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 72

 
Mathemat:

Exatamente, isso é exatamente o que está certo. A ACF é inútil.

A informação mútua, entretanto, deve ser, pois não há cheiro de zero mesmo a uma distância de centenas de barras.



por favor, envie-me seus resultados - como você calculou, que dados você utilizou, etc.
 
Avals:

Preciso que você me envie os resultados - como você os calculou, que dados você utilizou, etc.

Eu não contei os take-aways. Eu tenho outras coisas - estatísticas. O critério qui-quadrado da relação entre as séries de dados. Publicá-lo-ei mais tarde. Terei que esclarecê-lo para deixá-lo claro.

Na verdade, isto está muito próximo do que o homônimo faz. Até mesmo as fórmulas são muito parecidas lá.

 
alexeymosc:

O máximo pode ser de 2,098 bits. Esta é a informação média desta série de dados em particular. Se, por exemplo, uma barra na defasagem 1 determinar completamente uma barra zero, então suas informações mútuas se tornarão 2,098 bits.

Que tipo de número é esse? É uma medida de informação ) Você precisa ler artigos sobre a TI. Em resumo, os bits refletem uma medida da aleatoriedade dos valores da fonte de dados usando a fórmula de informação própria de um determinado valor

I(X) = - log(P(x))*P(x).

Outro exemplo. Atiramos uma moeda ao ar, contamos as informações mútuas entre dois eventos consecutivos. Por fórmulas que traduzi em meu artigo, obtemos que a informação mútua I(X;Y) = 0. E se um rolo de rabos indica precisamente um rolo de rabos (ou cabeças) subsequente, então I(X;Y) seria 1 - esta é a informação média da fonte de dados "moeda justa".

Alexey! eu também utilizo informações mútuas para selecionar entradas significativas para uma rede neural. Normalmente recebo modelos com previsibilidade de 52 - 54%. Parece-me que serão obtidos resultados que valem a pena quando a informação mútua for > 0,1 bit. Para a volatilidade, é possível encontrar insumos tão significativos.

 
VNG: Quem se mete nos cinco que não conheço. No entanto, posso ver que ele encontrou um resultado muito interessante durante a pesquisa e não o viu.

Percebo que meus cargos neste tópico estão à beira de serem sujos, quase fora do tópico.

Sobre os cinco, hrenfx.

Os postos estão bem, bastante sobre o assunto. Também apenas sobre a aplicabilidade da TI ao assunto, aqui alguns têm dúvidas.

- Que há qualquer invariância quando a escala muda, desculpe, eu não entendo. Entendo invariância como a presença de um fator de escala (no caso geral pode ser qualquer número ou função), quando multiplicado pelo qual obtemos um novo padrão de uma escala diferente. Ou seja, a transformação afim, que é a manifestação da estrutura em um fluxo caótico de dados. O problema então se resume a encontrar tal coeficiente. Quando um padrão é encontrado, ele é simplesmente multiplicado por este coeficiente. E tal transformação funciona tanto "para cima" quanto "para baixo". E isso é tudo.

Ok, que assim seja. Eu estava falando demais sobre fractalidade. Ela está lá, mas não é perfeita. Mais precisamente, a invariância fractal não é perfeita.

- se você investigar a relação entre as duas quantidades.

- por que isto é assim, o que causa esta declaração

Que afirmação - Não entendo.

- Por que dois, e não três a cinco trinta

- Quais são os dois valores?

Aqui é mais claro.

1. Dois porque pegamos uma fonte condicional e um receptor condicional e tentamos descobrir se existe alguma dependência entre eles.

Nós inventamos um alfabeto (eu divido a distribuição dos retornos em quantis, é mais conveniente para mim; o homônimo o faz um pouco diferente, mas não afeta muito o resultado), aplicamos a TI. Há algumas dúvidas sobre o canal de comunicação. Talvez o tempo seja o canal de comunicação.

Se fixarmos a diferença entre as barras (os números são calculados em MT4) igual a, digamos, 238, então a fonte é a série

retorno(Bars-1), retorno(Bars-2), ... retorno(238 ) (cerca de 80 000 valores a 12 anos de relógio)

O receptor é uma série de

retorno(Bars-1 - 238), retorno(Bars-2 - 238), ... retorno(0).

Em resumo, apenas uma série de retornos e o mesmo, deslocado em relação a si mesmo por 238.

Você pode calcular a ACF. Será quase certamente igual a zero ou diferente dele de forma estatisticamente insignificante. Bem sim, não há relações lineares significativas entre estas séries, todas triviais, sem peixes.

Mas nós, Alemães, não contamos ACFs, contamos dependências não lineares - quaisquer dependências. É para isso que serve a distribuição conjunta dessas duas quantidades. Nós o temos. (A propósito, também é necessário para o cálculo da ACF, que é algo que as pessoas geralmente ignoram).

O homônimo imediatamente tomou o touro pelos chifres e contou as informações mútuas dessas duas séries.

Avaliei o teste de qui-quadrado da relação entre as duas variáveis aleatórias.

Os resultados são muito semelhantes.

- A distribuição conjunta das duas quantidades representa uma superfície. O quê, estamos nos mudando para outra rayelnost?

Já estamos lá há algum tempo, só que nem todos se dão conta disso.

Até agora, tudo não passa de um projeto de vara de pesca, não é um peixe de todo.

 
IgorM:

A única maneira de verificar a eficiência do mercado é verificá-lo você mesmo ou então ele permanecerá no plano de "acredite ou não". Não posso dizê-lo melhor do que já o fiz:

Espero estar errado, mas suas "manchas mágicas" estão mais na minha cabeça, o TS por canais é muito semelhante ao TS por intuição, aqui está uma previsão não cumprida

Eu "torço" os níveis com construções diferentes, eu os vejo trabalhando 50/50 no TS proposto com resultados muito semelhantes, suspeito que mesmo que eu leve uma década de movimento de preços, eles irão coincidir na história ou no futuro próximo


Igor, eu não tenho a tendência de idealizar ninguém ou nada. Mas eu já disse

- Estes não são TSs, são modelos de movimentos de mercado. Você mesmo tem que construir um TS baseado neles.

- O autor SEMPRE tem sido contra as previsões. A essência de seu trabalho é expressa em uma frase - saltar, ir para a anterior, avançar - ir para a seguinte.

- Até onde posso ver, não é uma previsão, mas um possível alvo, no qual eu pessoalmente não me concentrei.

- Você está procurando por falhas sem tentar chegar ao fundo do que está sendo proposto. Compreendo seu ceticismo, mas você começou com o pé errado. Tente entrar primeiro nas regras e na essência das construções. Para facilitar, o canal de Vadim é a mesma vela, mas sem relação com a TF.

O TAdv postula o desenvolvimento do movimento de acordo com seis pontos de controle. O canal são os pontos 1 e 2 no Tadv. Swing é pontos 1,2,3 por Tadv. Note que nem Jan, que é um dos autores de TAdv, nem Vadim, o autor de V-Canais e de V-Swings, provam e convencem ninguém de nada, aparecem aqui apenas em casos estritamente definidos e não pedem nada a ninguém, não anunciam nada. Eles não desrespeitam e não se comportam corretamente. Não é um indicador de convicção e força interior? Eles simplesmente ajudam de forma altruísta e compartilham seus desenvolvimentos. TAdv foi apresentado há mais de 10 anos, VKanals e Vsvings, tenho medo de mentir, algo como 7, já foram testados pelo tempo e têm muitos seguidores. A única maneira de testar a eficácia é mergulhar nela você mesmo e testá-la para ver se funciona. Ou então, permanecerá no plano de "acredite ou não".

Boa sorte.

 
VNG: Igor, eu não tenho a tendência de idealizar ninguém ou nada. Mas eu já disse
hmm, a experiência foi um sucesso, meu posto esteve no fio da meada por cerca de 5 minutos, mas até consegui um engate, e não os regulares locais
 
renegate:

Alexey! eu também utilizo informações mútuas para selecionar entradas significativas para uma rede neural. Normalmente recebo modelos com previsibilidade de retorno de 52 - 54%. Parece-me que bons resultados são obtidos quando a informação mútua é > 0,1 bit. Para a volatilidade, é possível encontrar insumos tão significativos.

É bom ver que alguém que também aprendeu a aplicar a TI ao problema de selecionar variáveis significativas entra.

Somente seu conselho é um pouco incompleto ou algo assim. O fato simples é que a média das informações de uma fonte de dados pode ser diferente. O limiar de informações mútuas significativas também dependerá disso. Qual é o seu fluxo médio de informações H(X)?

 
Mathemat:

Em um cinco - hrenfx.

Os postos estão bem, bem a postos. Além da aplicabilidade da TI ao assunto, alguns têm dúvidas aqui.

Muito bem, que assim seja, com a fractalidade exagerei. Existe, mas não é o ideal. Mais precisamente, a invariância fractal não é o ideal.

Que afirmação - Não entendo.

Aqui é mais claro.

1. Dois porque pegamos uma fonte condicional e um receptor condicional e tentamos descobrir se existe alguma dependência entre eles.

Nós inventamos um alfabeto (eu divido a distribuição dos retornos em quantis, é mais conveniente para mim; meu homônimo o faz um pouco diferente, mas não afeta muito o resultado), aplicamos a TI. Há algumas dúvidas sobre o canal de comunicação. Talvez o tempo seja o canal de comunicação.

Se fixarmos a diferença entre as barras (os números são calculados em MT4) para ser, digamos, 238, - então a fonte é a série

retorno(Bars-1), retorno(Bars-2), ... retorno(238 ) (cerca de 80 000 valores em 12 anos)

O receptor é uma série

retorno(Bars-1 - 238), retorno(Bars-2 - 238), ... retorno(0).

Em resumo, apenas uma série de retornos e o mesmo, deslocado em relação a si mesmo por 238.

É possível calcular a ACF. Será quase certamente igual a zero ou diferente dele de forma estatisticamente insignificante. Bem sim, não há relações lineares significativas entre estas séries, todas triviais, sem peixes.

Mas nós, Alemães, não contamos ACFs, contamos dependências não lineares - quaisquer dependências. É para isso que serve a distribuição conjunta dessas duas quantidades. Nós o temos. (A propósito, também é necessário para o cálculo da ACF, só que nem todos o entendem!)

Tezka imediatamente pegou o touro pelos cornos e calcula as informações mútuas dessas duas séries.

Avaliei um teste de qui-quadrado da relação entre duas variáveis aleatórias.

Os resultados são muito semelhantes.

Sim, estamos lá há muito tempo, só que nem todos o entendem.

Tudo isso e até agora só existe uma vara de tração, não é um peixe de todo.


Obrigado Alexey, agora está tudo em ordem.

No contexto deste problema, as características do canal de comunicação são absolutamente irrelevantes, elas serão contabilizadas automaticamente através da entropia da informação.

 
IgorM:
Hmmm, a experiência foi um sucesso, meu posto esteve no fio por cerca de 5 minutos, mas foi até bloqueado, e não por regulares locais

Qual foi a experiência?
 
Mathemat:


Mas nós, Alexei, não estamos contando com ACFs, mas dependências não lineares - quaisquer dependências. É para isso que serve a distribuição conjunta das duas quantidades. Nós o temos. (A propósito, ela também é necessária para o cálculo da ACF.

Bem dito! Nós, Alexei, somos a favor da ineficiência do mercado. E já temos resultados práticos mostrando isso, mas não visíveis através do prisma da abordagem estatística-econométrica clássica.