Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2526

 
Aleksey Nikolayev #:

Por exemplo, se 1<=t1<=t2<n, então ACF(t1,t2)=sqrt(t1/t2).

Eu tenho outra pergunta. Aqui consideramos o ACF de valores adjacentes em uma amostra de tamanho infinito. Por exemplo, t1=1, t2=2. Obtemos ACF =sqrt(0,5) ~ 0,707. Agora tomamos outros valores vizinhos, por exemplo,t1=10000, t2=10001. Obtemos ACF = 1 (quase). Acontece que os valores vizinhos estão correlacionados entre si de forma diferente. É normal?

 
LenaTrap #:

Para ser honesto, não consigo entender nada.

p.s talvez algum matemático super inteligente tenha pena de mim e me explique o que se passa aqui?

você não precisa de um "matemático super inteligente" no ofício .....

DL tem 3 camadas - interno (oculto) lida t momento respectivamente externo t-1 e t+1... - portanto, a autocorrelação é possível... imho... Eu vejo as coisas desta maneira.

embora me pareça, por alguma razão, que se não tomarmos a mudança delta de uma característica no tempo, mas algum índice - então, talvez, o efeito da autocorrelação desses valores de intersecção no espaço temporal possa ser de alguma forma nivelado... é discutível... porque close(t)/close(t-1) também têm intersecção e portanto autocorrelação... embora na TF>15min a autocorrelação pareça desaparecer (não observada) - eu próprio não a verifiquei pessoalmente... e este ainda não é o índice que eu preciso...

É inútil rezar por autocorrelação na modelagem de movimentos de preços com TF's adequados... E não faz sentido usar um modelo depois de cada tick (como na derivação de regularidades, além das de longo prazo)... imho (mas mais probabilisticamente justo)...

MAS As redes neurais recorrentes só passam a informação para a frente (com o advento das máquinas Boltzmann começaram a ser utilizadas na aprendizagem probabilística de várias camadas)... embora já tenha soado

As redes recorrentes e os métodos Bayesianos, por si só, não demonstraram nem a capacidade de tirar "memória" das séries temporais financeiras nem de tirar conclusões sobre o modelo mais robusto em novos dados.

é por isso que as redes recursivas com propagação de erros e sua minimização de dy/dx são utilizadas em problemas reais (pois permitem realizar a integração apenas por essa razão de suas capacidades de minimização de dy/dx)

p.s.

em geral, quanto a mim - é o mesmo método de Monte Carlo - apenas por máquina... Ainda não vejo nada de novo em encontrar a frente usando a retropropagação... puramente terminológica...

p.p.s

exceto que com Theano você pode tentar algo sem muito uso dos recursos do PC (embora TensorFlow tenha sido tocado)...

e o que Y e o que X está ao critério do desenvolvedor (seja a priori ou como resultado de uma análise estatutária)... Se você é bom com python -- no sklearn, mesmo as características 2 em 1 já estão implementadas em alguns métodos? exemplos! -- e a importância da característica faz-se a si mesma e o ML faz a si mesmo -- algumas linhas também (como você encontrou corrcoef em algumas linhas)

 
LenaTrap #:

No mercado real? Pessoalmente, tenho algum tipo de filosofia como esta:

*mas não quero discutir isso, porque sem provas é inútil discutir suposições

! no comércio real - não distorça o significado...

Sim, a filosofia é de facto diferente para todos... o propósito da estatística é explicar a variância

e formalizar as dependências de testes independentes

 
Doutor #:

Eu tenho outra pergunta. Considere o ACF dos valores vizinhos em uma amostra de tamanho infinito. Por exemplo, t1=1, t2=2. Nós recebemos ACF =sqrt(0.5) ~ 0.707. Agora tomamos outros valores vizinhos, por exemplo,t1=10000, t2=10001. Obtemos ACF = 1 (quase). Acontece que os valores vizinhos estão correlacionados entre si de forma diferente. É normal?

É verdade, é mesmo. Esta é a segunda razão para falar sobre a não-estacionariedade da SB (a primeira é o crescimento da variância com o tempo). É apenas em processos estacionários (pela sua própria definição) que a ACF depende apenas da diferença temporal ACF(t1,t2)=ACF(t1-t2). É por isso que para séries estacionárias o ACF é normalmente escrito em função de um argumento t1-t2.

 
Doc #:

A questão deve, claro, ser dirigida a Alexei. Mas eu responderia "tanto faz". A questão, presumo, é que a SB percorre um caminho proporcional ao sqrt(t).

O que se pretendia era o famoso problema da "ruína do jogador". Poderia ser usado, por exemplo, para testar a significância estatística do efeito dos preços "aspirando" a alguns níveis.

 
Aleksey Nikolayev #:

O famoso problema da "quebra do jogador" estava destinado. Poderia ser usado, por exemplo, para testar a significância estatística do efeito dos preços "aspirando" a certos níveis.

Isso é muito mais interessante.

Talvez devêssemos abandonar o ponto de vista de que o mercado é uma série temporal, e finalmente fazer um avanço na análise do mercado.

 
Aleksey Nikolayev #:

É verdade, é mesmo. Este é o segundo motivo para falar da não-estacionariedade da SB (o primeiro é o crescimento da dispersão com o tempo). É apenas para processos estacionários (pela sua própria definição) que a ACF depende apenas da diferença temporal ACF(t1,t2)=ACF(t1-t2). É por isso que para séries estacionárias ACF é geralmente escrito em função de um argumento t1-t2.

ESTÁ BEM. Deixe-me colocar a questão de outra forma. As duas situações descritas abaixo são diferentes uma da outra?

1) Nós temos uma amostra de tamanho infinito. Considere dois momentos de tempo n e (n-t). Considere que 1 <= (n-t) <= n. CalcularACF((n-t),n)=sqrt((n-t)/n).

2) Temos uma amostra de comprimento n. Calcular a ACF da amostra com lag t:ACF(t) =sqrt((n-t)/n).

 
JeeyCi #:

embora me pareça, por alguma razão, que se você não tomar a mudança delta no recurso ao longo do tempo, mas contrair algum índice - então talvez o efeito da autocorrelação desses valores sobrepostos no espaço de tempo possa, de alguma forma, ser nivelado... é discutível... porque close(t)/close(t-1) também têm intersecção e portanto autocorrelação... embora na TF>15min a autocorrelação pareça desaparecer (não observada) - eu próprio não a verifiquei pessoalmente... e ainda não é o índice que eu preciso...


Você provavelmente não precisa disso, mas com qualquer tendência os dados das séries cronológicas começam a mostrar autocorrelação, às vezes muito alta, o que teoricamente deveria interferir com muitos modelos de análise/rede neural.

Este efeito é realmente difícil de usar para prognóstico, porque nada nunca dura, a tendência muda com a classificação, caos com a ordem, séries temporais vagando aleatoriamente de repente pode não vagar nada, e vice-versa, e por tal estimativa você não pode entender a estrutura do processo, é muito simples, seria como negociar acima de 200SMA.

Mas talvez ainda valha a pena verificar como sua rede neural reage às autocorrelações, e tentar removê-las se elas existirem e interferirem. Os elementos vizinhos não devem ter nenhuma sobreposição (se é isso que eu penso?), se você está usando dados assim, seria um grande milagre se o modelo funcionasse.

 
LenaTrap #:

Você provavelmente não precisa, mas com qualquer tendência, os dados da série cronológica

não distorça: tentando discutir comigo, você ainda está falando sobre o seu... ...mais ou menos na série cronológica... (e ninguém cancelou os métodos de amostragem)...

O preço a longo prazo não é uma função do tempo, já fiz o meu argumento mais de uma vez (e não vou duplicá-lo)... Eu mostrei onde se pode obter autocorrelação em DL... e o que usar para X e Y e para modelar que dependências - também o escrevi pela 10ª vez - fica ao critério do desenvolvedor...

Não sou o criador do seu modelo - não preciso de provar o comportamento do preço ao longo do tempo... (talvez eu não devesse ter rabiscado no DL - todos aqui estão pensando em algo e refutando ou provando algo para alguém - tirando uma palavra de cada disciplina)... engenheiros que fazem MO (que não estão aqui) ainda vão entender a estreiteza do debate da auto-correlação (para o bem da conversa nerd) seja em tendência ou em tick, se o modelo é construído num aspecto muito mais amplo e num horizonte mais amplo do conjunto de aprendizagem do que o horizonte onde as suas pulgas (auto-correlação) podem sair... é para isso que serve o Deep Learning (para dar conta de tudo)

... para mim a questão da negociação não é um problema:

Aleksey Nikolayev #:

O famoso problema da "ruína do jogador".

... ... é por isso que tenho evitado este disparate durante muito tempo ... foi revelado que ninguém aqui tem uma pista sobre modelagem, e aqueles que têm, não perdem o seu tempo com este fio ... Ok, há muito mais coisas úteis de DL na rede do que toda a gíria descarada que você cuspiu aqui sem uma boa razão ...

Para estatísticas, é melhor falar com matemáticos académicos, não sou eu que deveria responder... - Não estou interessado na sua crença de que a autocorrelação governa o DL... - pela 5ª vez escrevi "é um mau modelo" (não quero escrever a 10ª)... deixe os seus académicos responderem-lhe (se a minha resposta o fez querer provar alguma coisa)

 
Doutor #:

Bem, tudo bem. Deixe-me colocar a questão de outra forma. As duas situações descritas abaixo são diferentes uma da outra?

1) Nós temos uma amostra de tamanho infinito. Considere dois momentos de tempo n e (n-t). Considere que 1 <= (n-t) <= n. CalcularACF((n-t),n)=sqrt((n-t)/n).

2) Temos uma amostra de comprimento n. Calculamos a ACF da amostra com desfasamento t:ACF(t) =sqrt((n-t)/n).

A diferença é que no primeiro caso ACF é considerado para todos os pares de momentos possíveis, enquanto no segundo caso, um dos momentos é fixo t2=n e muitos pares de momentos( por exemplo, o par t1=1, t2=2) são desconsiderados. Em geral, o ACF é uma função de dois argumentos. Apenas para processos estacionários ACF pode ser considerado como uma função de um argumento t=t1-t2 (lag).

A ACF da amostra é sempre calculada a partir de uma amostra numérica específica (realização) de um processo e acaba sempre por ser uma função de um argumento (valor de atraso). Esta é a principal razão pela qual a amostra ACF de uma implementação SB não é uma estimativa para o seu ACF)