Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 3

 
alexeymosc:

Tentei buscar correlações nas citações de um instrumento financeiro usando métodos estatísticos. Para começar, tomei o índice Dow Jones Industrial, dados diários, e transformei a série em uma série de incrementos percentuais.

Os incrementos são heterocedóticos. Se você quiser prever a direção do movimento de preços - você deve levá-la em conta.

Para prever a volatilidade, é melhor usar modelos mais específicos em vez de NS.

 

Resposta faa1947:

"Sobre "linearidade" e "não-linearidade" eu também seria cauteloso, pois esta questão pode e deve ser colocada dentro da estrutura do modelo com o qual você se aproxima da série cronológica. Analisando os coeficientes deste modelo, pode-se concluir que estes coeficientes são: constantes (ou quase constantes), funções determinísticas ou funções estocásticas. Este é um processo perfeitamente concreto e construtivo de análise do tipo de dependências. E o que é construtivo para descobrir essa dependência de informações? E mais uma vez, como você vê isso na série cronológica original"?


Eu poderia fazer uma ligação com o componente econômico também, mas desculpe, basta ler as respostas ao meu primeiro post no tópico, é quase isso: a volatilidade intradiária é cíclica. E as informações mútuas demonstraram isso. Para prazos diários e superiores, a situação é totalmente diferente, não há ciclos óbvios.

Como vê-lo na série inicial? Nada mais fácil, veja o histórico por pelo menos meio ano nas barras de hora e observe se há diferenças na volatilidade (no tamanho das velas) por tempo. E quando se trata dos bares diários, eu pessoalmente não encontrei nenhum ciclo natural ou qualquer outra lógica cotidiana ou econômica. É apenas uma estrutura de dependência interna nos preços.

E ainda não estou aproximando as séries cronológicas, estou extraindo dados de preços que me permitem olhar para preços familiares de um ângulo um pouco diferente. Aqui você vê a falta de dependências nos incrementos, e eu vejo que você está usando a autocorrelação. Isso me diz muito. Não há dependência linear lá e nunca houve, e não há necessidade de mostrar constantemente autocorrelogramas, eu mesmo já tinha o suficiente deles há muito tempo, e eles eram os mesmos que os seus. )

 
anonymous:

Os incrementos são heterocedóticos. Se você quiser prever a direção do movimento de preços - você tem que levar isto em consideração.

Para prever a volatilidade, é melhor usar modelos mais específicos em vez de NS.


E que modelos são mais específicos ao forex em oposição a, digamos, NS? Só estou interessado na sua opinião. Há muitos modelos no mundo.
 
alexeymosc:

E que modelos são mais específicos ao forex em oposição a, digamos, NS? Estou apenas interessado na sua opinião. Há muitos modelos no mundo.

Não estava falando de modelos específicos para forex (há muitos deles, especialmente para derivativos: https://en.wikipedia.org/wiki/Vanna_Volga), mas de modelos específicos para volatilidade (há muitos deles, além de ARCH).

NS não é uma abordagem específica de Forex, porque é usada em todos os lugares (ou até mesmo vice-versa - onde é preguiçosa demais para construir modelos normais e tem muitos recursos computacionais, é usada lá).

As abordagens para prever a volatilidade e a direção dos preços devem ser diferentes. Para a primeira não deve ser usado NS (complicação não razoável), para a segunda você pode tentar.

 

faa1947, por favor, tenha mais cuidado com a disposição de seus postos. Às vezes não é possível separar imediatamente o que você está citando de sua resposta.

Agora vamos ao que interessa:

faa1947: Как мне кажется, увеличение объема выборки представляет интерес только в рамках предельной теоремы о сходимости по вероятности к нормальному закону. Хочу Вас разочаровать, что если мы не ставим перед собой такой задачи, то простое увеличение выборки ничего не дает. Ниже привожу увеличение выборки в 10 раз.

Dedo no céu, desculpe. De que normalidade no limite você está falando? Normalidade de quê? A distribuição dos retornos? Nesta fase, esta hipótese não é nem quente nem fria para mim. Não preciso de nenhuma hipótese sobre a distribuição dos retornos e qual a lei que eles tendem a adotar.

Pessoalmente, tenho o seguinte requisito em meu relógio: como eu pretendia usar o critério do qui-quadrado de independência de variáveis aleatórias (eu queria), o tamanho da amostra tinha que ser tal que qualquer freqüência de um evento conjunto fosse garantida como sendo pelo menos 5. Esta restrição também deve ser conhecida por você. É por isso que uma amostra tão fraca nos relógios saiu.

Mas esse sou eu. Não sei por que alexeymosc usou sua amostra exatamente do tamanho que era, não sei. Mas eu posso adivinhar: provavelmente ele queria estabelecer um padrão para toda a série e não uma parte dela.

faa1947: Prefiro ficar atento à "linearidade" e à "não linearidade", porque esta questão pode e deve ser colocada no âmbito de um modelo, pelo qual você aproxima as séries cronológicas. Analisando os coeficientes deste modelo, pode-se concluir que estes coeficientes são: constantes (ou quase constantes), funções determinísticas ou funções estocásticas. Este é um processo perfeitamente concreto e construtivo de análise do tipo de dependências.

Ainda não há modelos. Somente Data Mining com métodos estatísticos não paramétricos.

Estou confiante de que é precisamente uma relação não linear: não há nenhuma relação linear significativa detectável pela correlação de Pearson com desfasamentos superiores a 10. Você mesmo sabe disso. Mas as relações também são encontradas em desfasamentos muitomaiores. Então eles são não lineares!

faa1947: E o que é construtivo para detectar esta dependência de informação? E novamente, como você vê isso na série cronológica original?

Não é fácil ver, aqui estou de acordo com você. Só conhecemos a quantidade média de informação transmitida à barra zero de uma história bastante distante - e o mecanismo deste "ataque de informação do passado" não é conhecido para nós. Ainda temos que conseguir converter esses pedaços nus em uma ferramenta de previsão. Quem disse que seria fácil?

Os incrementos são heterocedóticos. Se você quiser prever a direção do movimento de preços, você deve necessariamente levá-la em conta.

Sou extremamente ignorante sobre os modelos econométricos modernos, incluindo ARCH e a família relacionada. Você pode explicar com seus dedos por que isso tem que ser levado em conta em uma fase em que nenhum modelo de comportamento incremental é construído? Não há modelos, apenas uma aplicação grosseira da teoria da informação. Obrigado.

 
anonymous:

Não estava falando de modelos específicos para forex (há muitos deles, especialmente para derivativos: https://en.wikipedia.org/wiki/Vanna_Volga), mas de modelos específicos para volatilidade (há muitos deles, além de ARCH).

NS não é uma abordagem específica de Forex, porque é usada em todos os lugares (ou até mesmo vice-versa - onde é preguiçosa demais para construir modelos normais e tem muitos recursos computacionais, é usada lá).

As abordagens para prever a volatilidade e a direção dos preços devem ser diferentes. Para a primeira não há necessidade de usar NS (complicação não razoável), para a segunda você pode tentar.


Concordo em princípio com a NS, embora o método em si não seja tão simples assim. Há também muitas convenções, que são desejáveis e às vezes obrigatórias (desde o pré-processamento de dados e seleção de variáveis relevantes, até a construção de redes). E em geral, há pessoas que gostam de aplicar os conhecimentos que conhecem aos fenômenos estudados, e há aqueles que começam a estudar a partir do zero, e estes últimos provavelmente prefeririam NS. IMHO.

Mas eu não vou prever a volatilidade, estou sempre tentando prever a direção do movimento dos preços. Neste problema eu uso NS.

 
alexeymosc:

Resposta faa1947:


...a volatilidade intradiária é cíclica. E as informações mútuas demonstraram isso.

Suas informações mútuas não me mostraram nada. Você deve certificar-se de que não há constituintes deterministas na BP antes de fazer o processamento de estatutos. Se eles estiverem presentes na BP, eles "pontuarão" as estatísticas e todas as pesquisas não podem ser confiáveis. Devo decepcioná-lo que a definição de volatilidade pela BP inicial é falha. Eu consigo construir modelos com os seguintes parâmetros: 44 pips de volatilidade e sua flutuação mais menos dois pips, ou seja, posso considerá-la constante. A volatilidade que permanece para análise depende fortemente do modelo aplicado.

E ainda não aproximo as séries cronológicas, extraio dados de preços que me permitem olhar para os preços usuais de um ângulo ligeiramente diferente. Aqui você vê a falta de dependências nos incrementos

Fumaça à frente da locomotiva. Na verdade, em nível de livro didático, a ordem da análise BP é definida: estacionário/não estacionário - para não estacionário, a escolha do método de transformação é estacionário. Certamente, este primeiro passo envolverá a remoção da tendência. A seguir, vamos ver.

 

Eu não entendo o que você está fazendo aqui. Decidi atualizar minha compreensão da Teoria da Informação (TI) e pesquisei-a no glossário de termos:

A TI considera a noção de "informação" apenas do lado quantitativo, sem referência a seu valor ou mesmo significado. Com tal abordagem, uma página de texto datilografado no máximo sempre contém aproximadamente a mesma quantidade de informações, determinada apenas pelo número de caracteres e espaços (ou seja, caracteres) na página e não dependendo do que está impresso nela, incluindo o caso de um conjunto de caracteres sem sentido e caótico. Para modelagem de sistemas de comunicação, esta abordagem é válida, pois eles são projetados para transmitir informações representadas por qualquer conjunto de caracteres sem erros sobre o canal de comunicação. Nos casos em que é essencial considerar o valor e o significado das informações, a abordagem quantitativa não é aplicável. Esta circunstância impõe restrições essenciais nos campos de possíveis aplicações do TC. Não levá-la em conta levou, nos estágios iniciais de desenvolvimento, a uma superestimação do significado aplicado.

Neste contexto, tenho três respostas possíveis:

1. Você tem certeza de que o dicionário está mentindo e não é realmente esse o caso.

2. Você está nos "estágios iniciais de desenvolvimento" e ainda não fez uma avaliação da "relevância aplicada".

3. Você é algo mais.

 
Mathemat:

Sou extremamente ignorante dos modelos econométricos modernos...

Isso esclarece muita coisa. Na verdade, a econometria é uma ciência (sublinho ciência) que vem estudando séries cronológicas econômicas há pelo menos 100 anos. A Sociedade de Econometristas nos EUA foi formada na década de 30. A julgar por seus cargos, esta é uma ciência em que você é bom. Você não está sozinho neste fórum e como nota lateral: há um erro gramatical na palavra "econométrico" e seus derivados, de acordo com os desenvolvedores deste site.

 
faa1947: Suas informações mútuas não me mostraram nada. Você deve certificar-se de que não há componentes determinísticos antes de fazer o processamento estatístico da BP.

Mais uma vez, 25, um polegar no céu. O estudo não foi feito em relação a uma série de preços, mas seus retornos. Isto é o primeiro.

Em segundo lugar, o pré-processamento de dados como o que você mencionou é determinado principalmente pelos objetivos da análise, não por exigências dogmáticas impostas ao estudo sem levar em conta os objetivos.

Fumaça à frente da locomotiva. Na verdade, no nível do livro didático, a ordem da análise BP é definida: estacionário/não estacionário - para não estacionário, a escolha do método de transformação é estacionário. Certamente, este primeiro passo envolverá a remoção da tendência. A seguir veremos.

Veja minha objeção acima. Faça corresponder os métodos de pesquisa a seus objetivos! E, finalmente, pare de murmurar seus feitiços sobre a estacionariedade, a dissuasão e outras coisas que são irrelevantes para o tema do estudo.

2 HideYourRichess: Estou tendo um pouco de férias hoje, então estou temporariamente livre para dizer o que eu achar :) Estamos tendo um showdown religioso sobre o que é informação?

2 faa1947:

Na verdade, a econometria é uma ciência (sublinho ciência) que vem estudando séries cronológicas econômicas há pelo menos 100 anos.

OK, que seja uma ciência. Se bem me lembro, a econometria gosta muito de impor seus modelos aos dados financeiros. Eu não os imponho. Então eu não estou fazendo econometria. Alguma outra pergunta?