Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1383

 
elibrarius:

Eu não aplico divisão (P[i] / P[0]), mas subtração (P[i] - P[0]), ou seja, não variação de preço relativo, mas absoluto. Eu preliminarmente removo outliers (1% em quantidade dos maiores e menores valores).

A divisão dá alguma vantagem? Atualmente estou usando uma floresta que não requer normalização e escalada.

Você faz as mudanças mas não as escalas.
 
Yuriy Asaulenko:
Você está a fazer o turno, mas não a escalada.
Sim. As árvores/floresta também não precisam de ser escaladas.


Ou seja, não há muita vantagem em dividir sobre subtrair. Exceto no caso do logaritmo, que tornará os dados mais parecidos com uma distribuição normal, como disse Alexey Nikolaev. Ou seja, a densidade entre pontos mudará, mas não a ordem. Mas mesmo neste caso não vejo nenhuma vantagem - a árvore não será dividida por um nível, mas por outro - ou seja, ela se ajustará para qualquer distribuição. Como a árvore é essencialmente uma simples memorização.

 
Pegue o preço como uma porcentagem dos últimos 100 preços. errado ?
 
Evgeniy Chumakov:
Pegue o preço como uma porcentagem dos últimos 100 preços. errado ?
Isto é semelhante à divisão
 

O gráfico deve ser dividido em níveis, idênticos ou não em pedaços idênticos verticalmente, e cada pedaço deve ser nomrrmado em um intervalo.

O gráfico deve ser dividido em níveis, iguais ou talvez não iguais em pedaços na vertical, e cada pedaço deve ser normalizado para um intervalo, ou seja, análogo aos níveis de preços normais. Se não normalizarmos a série inteira ou na janela deslizante, perderemos novamente algumas informações muito importantes.

Mas ao dividirmos em níveis enfrentamos outro problema - quando o preço está nas condições limite ou se tomarmos muitos dos preços mais recentes para treinamento, alguns deles estão em um "nível", os outros estão em outro. Ainda não descobri como o fazer.

Posso precisar de espelhar os níveis um em relação ao outro para que as transições entre eles sejam indolores.

é natural que o gráfico não convertido ainda seja o mais informativo. Portanto, você deve ter muito cuidado com quaisquer conversões - a qualidade do modelo se degradará na proporção da sua ignorância. Daí que todos os contos sobre 50% de erro sejam normais e outros disparates, o modelo simplesmente não aprende nada com tais "características".

 

É algo complicado, não sei porquê e não sei mesmo como o fazer.

Yuri também está indo bem com incrementos simples.

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

isto não faz sentido - cada cadeia quente subsequente contém metade da informação útil da anterior, ou seja, eles, 1: correlacionam fortemente, 2: a cadeia quente com o maior atraso contém toda a variação da cadeia quente anterior, ou seja, eles não dão nenhum incremento de informação

o resultado será o seguinte: a importância do retorno com maior atraso será a maior (mais variância, mais ganho de informação), e este retorno contém todas as variâncias de outras características

 
elibrarius:

Yuri está indo bem com incrementos simples também.

não pode ser porque nunca pode ser

 
elibrarius:

Algo que você inventou é complicado, não está claro o porquê e não é realmente claro como fazer isso.

imagina a situação.

O preço no mercado reflete principalmente o equilíbrio entre a oferta e a demanda, em diferentes momentos históricos

Você está mantendo uma seção limitada da história normalizada como uma característica, refletindo apenas a situação atual.

o seu modelo funde diferentes momentos históricos num fluxo normalizado sem rosto (todas as situações de mercado são equiparadas umas às outras), que já não contém quaisquer sequências históricas ou um preço justo

Você fica com uma pilha de padrões normalizados idênticos, que se sobrepõem ao aumentar a profundidade da história, levando a um erro 50/50. Você não ensina nada ao modelo e você joga fora as informações mais importantes já durante o pré-processamento, porque você faz tudo incorretamente, ou seja, seguindo livros, projetados para tarefas absolutamente diferentes e descrevendo processos completamente diferentes.

Uma citação não é um sinal, é um processo completamente diferente e não deve ser tratada dessa forma. Yuri é radiofísico, por exemplo, e por isso não tem mais nada para fazer.

Neste tipo de treinamento, você considera o tempo, mas não considera o preço. O nível de preços (acima/abaixo) no mercado é ainda mais importante que o tempo porque reflete o equilíbrio entre oferta e demanda, que reflete toda a informação básica do mercado.
 
Maxim Dmitrievsky:

imagina a situação.

O preço no mercado reflecte o equilíbrio entre a oferta e a procura, na sua maioria em diferentes momentos históricos

Você mantém uma seção limitada da história normalizada como uma característica, refletindo apenas a situação atual.

o seu modelo funde diferentes momentos históricos num fluxo impessoal normalizado (todas as situações de mercado são equiparadas umas às outras), que já não contém quaisquer sequências históricas ou um preço justo

Você fica com uma pilha de padrões normalizados idênticos, que se sobrepõem ao aumentar a profundidade da história, levando a um erro 50/50. Você não ensina nada ao modelo e você joga fora as informações mais importantes já durante o pré-processamento, porque você faz tudo incorretamente, ou seja, seguindo livros, projetados para tarefas absolutamente diferentes e descrevendo processos completamente diferentes.

Uma citação não é um sinal, é um processo completamente diferente e não deve ser tratada dessa forma. Yuri é radiofísico, por exemplo, e por isso não tem mais nada para fazer.

Neste tipo de treinamento, você considera o tempo, mas não considera o preço. O nível de preços (acima/abaixo) no mercado é ainda mais importante que o tempo porque reflete o equilíbrio entre oferta e demanda, que reflete toda a informação básica do mercado.

É uma pena que não possas dar um "Like".