Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 30

 
faa1947:

análise de resíduos para autocorrelação e tipo de função de densidade de probabilidade. Também, é claro, R^2. Estas são, em princípio, técnicas comuns de previsão de séries temporais.

Isto é apenas um começo, e no sentido de ser geralmente aceito, não é completo. Completo é mostrado aqui, embora este seja apenas um exemplo de uso. Três grupos de análises: coeficientes, resíduos e estabilidade. Se você puder conciliar as contradições, poderá obter uma estimativa, que é sempre um erro de previsão, pois o alvo é a previsão e tudo mais são os resultados intermediários.

Sim, acho que nunca fiz um estudo acadêmico FULL. Geralmente há uma falta de tempo e esforço no trabalho, então eu vou pelo caminho mais curto: construir vários (2 ou mais) modelos preditivos e fazer uma análise dos resíduos, depois escolher um modelo baseado em uma avaliação equilibrada da precisão e qualidade das séries de resíduos. Concordo que, com o tempo, pode-se mergulhar profundamente nas estimativas de confiabilidade dos preditores.

A propósito, um teste bom e relativamente de baixo custo de precisão e estabilidade do preditor é a validação cruzada, onde os períodos de treinamento e validação são escolhidos muitas vezes para que eventualmente toda a série original seja dividida em pequenos segmentos e cada segmento seja incluído na amostra de validação.

 
alexeymosc:

Sim, acho que nunca fiz um estudo acadêmico FULL. Normalmente há uma escassez de tempo e esforço em meu trabalho, por isso tomo um caminho mais curto: construo vários (2 ou mais) modelos preditivos e faço análise de resíduos, depois escolho um modelo baseado em uma estimativa equilibrada da precisão e qualidade das séries de resíduos. Concordo que, com o tempo, pode-se mergulhar profundamente nas estimativas de confiabilidade dos preditores.

A propósito, um teste bom e relativamente de baixo custo para a precisão e estabilidade do preditor é a validação cruzada, onde os períodos de treinamento e validação são escolhidos muitas vezes, de modo que eventualmente toda a série original é dividida em pequenos segmentos e cada segmento é incluído na amostra de validação.

Por muito tempo, tenho dado os seguintes conselhos, que são difíceis de obter a partir de minha própria experiência. Há cerca de trinta anos, e especialmente hoje em dia, a maneira mais produtiva de dominar uma área temática é pegar um pacote pronto, focado nessa área temática. Eu mencionei EViews, mas não é o único pacote. É só que este pacote é usado no ensino em nossas universidades. Ao utilizar o pacote, você ganhará:

Um grande número de programas funcionais e validados por milhões de usuários especializados

esquema de análise

exaustividade da análise

referências a partir das quais os algoritmos utilizados foram tomados.

Tendo adquirido experiência e uma perspectiva, você pode então passar a alguns aprimoramentos. Mas estas melhorias serão baseadas no conhecimento sistemático da área temática e não ocorrerá a você trazer Peters ou alguém como Ptolomeu, como alguns acima.

 
faa1947:

Por muito tempo, tenho dado os seguintes conselhos, duramente conquistados a partir de minha própria experiência. Há cerca de trinta anos, e especialmente hoje em dia, a maneira mais produtiva de aprender uma área temática é pegar um pacote pronto, focado nessa área temática. Eu mencionei EViews, mas não é o único pacote. É só que este pacote é usado no ensino em nossas universidades. Usando o pacote que você recebe:

um grande número de programas especializados funcionais e testados para milhões de usuários

Uma estrutura de análise

Completude da análise

Listas de referências das quais foram extraídos os algoritmos utilizados.

Uma vez que você tenha adquirido experiência e uma boa perspectiva, você poderá então passar a qualquer melhoria. Mas estas melhorias serão baseadas em um conhecimento sistemático do assunto e não ocorrerá a você trazer Peters ou alguém como Ptolomeu, como algumas pessoas acima.


Desculpe, mas o principal é a declaração correta do problema e as conclusões. Por exemplo, o que está escrito no artigo relativo ao "Diagnóstico de indicadores" e conclusões com base em resíduos de que o indicador é útil ou não, etc. - não é correto (imha). Assim como não é verdade que o indicador tem que prever ou ser útil em toda a série. Você não precisa prever preços o tempo todo para obter lucro, apenas em momentos relativamente raros. Previsão em um certo sentido porque não se trata de uma única mudança de preço, mas da robustez do sistema e da repetição de estatísticas passadas. E não são os indicadores que fazem previsões, mas apenas o sistema como um todo.

P.S. O artigo ainda é útil, obrigado :)

 
Avals:


Por exemplo, o que você escreveu no artigo em relação ao "Diagnóstico do indicador" e conclusões baseadas em resíduos que o indicador é útil ou não, etc. - não é correto (imha). Também não é verdade que o indicador deva prever ou ser útil em toda a faixa.

Concordo, o artigo foi escrito com alguma hesitação, porque seu objetivo era demonstrar a abordagem em geral, a metodologia em sua totalidade, por assim dizer.

Você não precisa fazer previsões de preços o tempo todo para ter lucro, apenas em momentos relativamente raros

Não concordo de forma alguma. Qualquer TS sempre prevê, quer admita ou não. Com periodicidade é feita uma análise para tomar decisões para o futuro: tomar uma posição, sair, ficar fora do mercado ou permanecer no mercado. Essas decisões são baseadas em previsões do comportamento futuro do mercado.

Não é uma única mudança de preço que se prevê, mas a robustez do sistema.

A robustez não é prevista, ela é construída, enquanto o resultado da construção é avaliado pelo erro de previsão - se a variação do erro for próxima a uma constante, o sistema será estável.

E não são os indicadores que predizem, mas apenas o sistema como um todo.

Naturalmente. O artigo assume que o sistema consiste em um único indicador. Mesmo com esta simplificação, o artigo se tornou muito complicado.

Se você quiser discutir o artigo em detalhes, sugiro passar para o tópico apropriado, talvez outros se juntem a ele. Afinal de contas, este tópico tem um tema diferente.

 
faa1947:

Não há necessidade de prever constantemente preços para obter lucros, apenas em ocasiões relativamente raras

Discordo completamente. Qualquer TS sempre prevê se ele o admite ou não. Com a periodicidade do TS é feita uma análise para tomar decisões para o futuro: tomar uma posição, sair, ficar fora do mercado ou no mercado. Essas decisões são baseadas em previsões de comportamento futuro do mercado.


não há necessidade de prever, mas não há necessidade de prever continuamente :) Somente em momentos discretos, e a verificação dos resíduos do indicador em toda a série realmente testa sua capacidade de prever a série continuamente
faa1947:

Não é uma única mudança de preço que se prevê, mas a robustez do sistema

A robustez não é prevista, mas construída, e o resultado da construção é avaliado pelo erro de previsão - se a variação do erro for próxima a uma constante, então o sistema será estável.

Os resultados de um comércio individual não são importantes, as estatísticas sobre muitos ofícios são importantes. Deve corresponder, pelo menos parcialmente, a estatísticas favoráveis de testes retrospectivos. Portanto, quando você dá dinheiro para a administração do sistema, a aposta é exatamente nisso - que nossas estatísticas favoráveis permanecerão (com uma abordagem sistemática). E isso é robustez
 
alexeymosc:

É possível que assim seja. Mas quando construímos uma série de retornos da seguinte forma: X[t]-X[t-1], ela quase não o mostra. Eu uso as palavras retornos, incrementos, retornos, todos eles são uma série de preços diferenciados.

Isto é facilmente verificável, não há necessidade de argumentos filológicos :). A propósito, você pode tentar descobrir sobre isso neste fórum.

A inclinação da probabilidade na direção da mudança de sinal é mínima e insignificante. Mas se você calcular a entropia condicional entre a variável dependente e retornos superiores a dois ou mais desfasamentos, então toda a irregularidade é contabilizada no número resultante de modo que a entropia seja reduzida.

Mais uma vez: a força do efeito depende da TF, mas será que o H1 gerado em carrapatos aleatórios será semelhante ao H1 gerado em carrapatos com retorno real?

Tentei treinar NS sobre dados horários e tomei apenas os desfasamentos mais informativos (42 variáveis, sobre desfasamentos 1, 2, 23, 23, 25,... 479, 480, 481). Infelizmente, o resultado não funcionou muito bem. Precisão da previsão do número de quantil - na região de 30-40%. Embora as irregularidades que a rede neural foi capaz de traduzir para a saída, mas as dependências não são suficientes para a previsão. O problema é que as variáveis independentes são mutuamente informativas na defasagem 1, 2, 24.... e a quantidade total de informações sobre a barra zero é realmente pequena. Devemos pensar como uma opção para tomar prazos diários e mais antigos.


Presumi desde o início que a técnica sente todas as dependências, tanto úteis como inúteis para a previsão. Com relação à volatilidade, há aqui provas definitivas que sustentam tal suposição. Ou seja, aqueles seus "informativos" podem simplesmente ser entupidos com este tipo de informação inútil para predição.

Acho que meu tempo nesta linha ou acabou ou ainda não chegou :). É provavelmente a hora de descansar a fonte :).

 
Candid:


Presumi desde o início que a metodologia pressente quaisquer dependências, tanto as adequadas à previsão como as inúteis. Com relação à volatilidade, há algumas evidências que sustentam essa suposição aqui. Ou seja, aqueles seus "informativos" podem simplesmente ser entupidos com este tipo de informação inútil para predição.

Eu também percebi isso muito bem. O problema se tornou mais complicado ao nível de encontrar sinais informativos de um sinal de mudança de preço. E se se verificar que nos prazos intradiários os atrasos informativos necessários são cíclicos (suspeito que sejam), então sua informação total sobre a direção do movimento de preços na barra zero será muito pequena...

Isto vou verificar. A seguir haverá: tente investigar as barras diárias e provavelmente as semanas ainda poderão ser estatisticamente confiáveis. Mas se os desfasamentos informativos também são cíclicos lá, infelizmente, acho que a idéia de usar apenas desfasamentos não vai funcionar. Então você pode tentar indicadores.

Eu havia planejado isso desde o início, a propósito. Mas até que eu a teste, a fonte não vai embora.

"Portanto, esses seus "informativos" podem ser simplesmente entupidos com esse tipo de informação inútil para predição".

E o que você quer dizer com "informações inúteis"? OK, bem, a volatilidade não é nossa amiga. Há também componentes de ruído. Acho que você decidiu, desde o início, abandonar o método. É preciso saber usar qualquer ferramenta, eu ainda estou aprendendo, por isso aqui há mais água do que calorias.

Eu já o sugeri: poste qualquer indicador e o alvo que ele indica. Uma condição é que ela esteja de acordo com as fórmulas do Echel e que haja a possibilidade de jogar com seus parâmetros. A meta também deve ser específica, por exemplo, o preço descerá no máximo 6 barras, ou o preço excederá o preço atual em 10 pontos. Executarei os dados e lhe darei um conjunto de parâmetros indicadores ideais em termos de entropia de informação.

 
Avals:
Na realidade, ela deve, pelo menos parcialmente, corresponder às estatísticas de testes anteriores que nos são favoráveis.
Esperança de "favorável" ou ter uma expressão numérica para este "favorável". Acima citei um dos valores estimados - a variação da variância do erro de previsão não deve exceder 5%. Mas este não é o único requisito para um sistema robusto. E o teste posterior só dá esperança de que não vai mudar.
 
faa1947:
Esperar por "favorável" ou ter uma expressão numérica para este "favorável". Acima citei um dos valores calculados - a variação da variância do erro de previsão não deve exceder 5%. Mas este não é o único requisito para um sistema robusto. E o teste posterior só dá esperança de que não vai mudar.


Sim, existem métodos para avaliar a robustez.

Aplicado ao tema e ao seu artigo: a maneira de trazer toda a série de preços para uma forma estacionária com MO positivo é criar um sistema de reversão rentável e robusto que está sempre no mercado. Isto também se aplica à maneira de distinguir uma série real de uma viagem ao acaso. Isto é, de fato, o indicador que passará em seus testes e o critério que distinguirá a série real da SB é o algoritmo deste sistema. Portanto, é ingênuo acreditar que um indicador tomado ao acaso ou o método de informação mútua é um algoritmo para cotações de mercado. Isso só pode acontecer por acaso.

 
faa1947:

A teoria do mercado eficiente não é considerada na econometria. Todas as suas suposições se baseiam no fato de que o mercado não é eficiente. A Econometria não inclui Markowitz e seus apologistas e seus eficientes portfólios. A Econometria existe há mais de 100 anos e nunca foi desmentida por Peters, Mandelbrot e outros, pois originalmente se baseia no pressuposto de que o mercado é não-estacionário.

É a econometria que justifica uma previsão um passo à frente e mostra as razões para a deterioração fatal da previsão vários passos à frente.


o problema é que os macro indicadores podem alterar periodicamente sua ponderação etc...+ o curto período de tempo disponível para uma análise completa...

Concordo, é claro - a fase deve estar presente na análise...