Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2699

 
O tempo cíclico (número de horas etc.) é fácil de usar, por exemplo, no KNN, se a métrica for escrita corretamente. Ou em alguns desenvolvimentos desse método, como a regressão local.
 
Aleksey Nikolayev #:
O tempo cíclico (número de horas etc.) é fácil de usar, por exemplo, no KNN, se a métrica for escrita corretamente. Ou em algum desenvolvimento desse método, como a regressão local.
Eles escrevem essas coisas nos livros didáticos, mas, na verdade, o tempo cíclico já está incorporado nos incrementos, e há mais informações úteis neles. Eles são necessários por causa do tempo e, para os níveis de preços, precisamos acrescentar algo mais.
 
elibrarius #:
Vejo uma familiaridade, já a vi de 3 a 4 vezes em suas postagens.
2 vezes 0,5 por turno.)))))))

2 vezes, é assim:

2 vezes 0,5 está no centro :-) Uma média de dois, que de repente descreve bem os tiques

 
É isso? A discussão sobre a pesquisa automática de recursos terminou?
Ou esse era o objetivo?
 
Ahahahaha, vocês estavam sob muita pressão, mas quando começamos a trabalhar, ficamos desanimados.
O mais importante é trincar, trincar, e então você verá seus netos crescerem...
 
mytarmailS #:
0) sim, estou...)

1) Ainda não implementei tudo,
1. há problemas com a maldição da dimensionalidade e a explosão combinatória, mas isso é solucionável em teoria, em favor da precisão....
2. Há um problema com o fato de que o algoritmo de pesquisa é lento, muitas coisas precisam ser escritas em C ou C++, e eu não sei como fazer isso.
3. Mesmo um algoritmo otimizado não será capaz de pesquisar padrões em uma data grande, precisamos pesquisar padrões localmente.....
Mas, em geral, se não funcionar, nada funciona...

2) Sim.


A propósito, você pode substituir a palavra "evento" pela palavra "regra".


Meu método fixa o número de espaços nos quais a regularidade é pesquisada e limita a etapa de coordenadas nesses espaços, portanto, não deve haver explosões. Além disso, há ideias de como reduzir imediatamente o número de combinações a serem pesquisadas, analisando os espaços com antecedência.

Farei a pesquisa em MQL5 por meio do modo "mathematical computation". A vantagem aqui é o sistema depurado de suporte a agentes, que permitirá gerenciar tarefas de computação paralelas. Tenho muitos núcleos fracos em meus servidores, portanto, isso é importante para mim.

Uma regra é um análogo de uma folha de árvore, se me lembro bem de sua pesquisa. A folha contém as condições que descrevem o padrão, e o evento é a fonte para encontrar o padrão.

O evento talvez seja o tronco da árvore, que será construído pela interação com outros preditores.

A construção, mesmo que seja possível dizer o crescimento, se usar a representação de uma árvore, é o segundo estágio, para perceber o que é possível por meio do algoritmo (enquanto esboça em um papel) ou no R por meio de árvores genéticas (é simplesmente uma metodologia já elaborada, para a qual você jogou o script), ou como você faz - mas já trabalhando com uma pequena tabela geral - buscando regularidades relativas, e é possível pensar em outra coisa. E, nesse estágio, o CatBoost já pode digerir os dados com alegria, como uma solução intermediária. É possível extrair folhas e regras desses dados, mas elas geralmente são fracas.

 
Maxim Kuznetsov #:

A probabilidade de ultrapassar qualquer linha pelo preço (e acionar os sinais do indicador) depende da hora do dia e do dia da semana.

É necessário adicionar tempo cíclico a NN e DL. A maneira mais simples é uma onda senoidal. As dependências não são lineares, portanto, ela é simplesmente elevada ao quadrado, levando em conta o sinal. Há duas entradas adicionais que são responsáveis pelas referências de tempo. A meia-noite/meio-dia é diferente em todos os lugares, portanto, é melhor calcular e fornecer a fase com antecedência. Essa é a conexão do modelo com o mundo real e seu horário

Se eles não forem fornecidos explicitamente, na minha opinião, você receberá uma abóbora ou a coisa toda tentará obtê-los e emiti-los por si só.

Sim, o tempo é uma das escalas mais importantes, e é claro que eu a utilizo.

Como é resolvida a questão da transição para o horário de verão/inverno? Você acha que é necessária alguma correção?

Digamos que negociemos euro/rublo - no histórico, temos diferentes momentos de transição para o horário de inverno/verão e, depois, a ausência de transição para o rublo, mas a presença do euro, digamos que as notícias planejadas sejam importantes, mas, com a mudança de horário, elas estarão no gráfico em momentos diferentes. Talvez faça sentido usar as escalas de tempo de duas moedas ao mesmo tempo, e talvez mais?

 
Aleksey Vyazmikin #:

Sim, o tempo é uma das escalas mais importantes, e é claro que eu a utilizo.

Como a questão da transição para o horário de verão/inverno é resolvida, você acha que é necessária alguma correção?

Digamos que negociemos euro/rublo - no histórico, temos diferentes momentos de transição para o horário de inverno/verão e, em seguida, a ausência de transição para o rublo, mas a presença do euro, digamos que as notícias planejadas sejam importantes, mas com a mudança de horário, elas aparecerão no gráfico em momentos diferentes. Talvez faça sentido usar as escalas de tempo de duas moedas ao mesmo tempo, e talvez mais?

Esse é um problema bem conhecido... e confunde tudo constantemente, não importa o que negociamos:-) em dois grandes centros - EUA e Inglaterra, os ponteiros do relógio são movidos em dias diferentes. Com até mais de uma semana de diferença. Os intervalos entre os eventos mais importantes mudam e duas ou três semanas em seis meses podem ser descartadas da análise. E nosso pessoal está fazendo uma bagunça, "nós mudamos os relógios, nós não mudamos os relógios".

Não conheço uma solução universal, nem mesmo mais ou menos bem-sucedida, para esse problema. Ou simplesmente ignorar esses "dias críticos" ou ensinar o horário de inverno/verão separadamente. A última opção parece mais razoável, mas já estamos com uma falta crítica de dados

 
Aleksey Vyazmikin #:

Meu método fixa o número de espaços em que um padrão é pesquisado e limita a etapa de coordenadas nesses espaços, portanto, não deve haver explosões. Além disso, há ideias de como reduzir imediatamente o número de combinações a serem exploradas, analisando os espaços com antecedência.

Farei a pesquisa em MQL5 por meio do modo "mathematical computation". A vantagem aqui é o sistema depurado de suporte a agentes, que permitirá gerenciar tarefas de computação paralelas. Tenho muitos núcleos fracos em meus servidores, portanto, isso é importante para mim.

Uma regra é um análogo de uma folha de árvore, se me lembro bem de sua pesquisa. A folha contém condições que descrevem o padrão, e o evento é a fonte para encontrar o padrão.

O evento talvez seja o tronco da árvore, que crescerá ao interagir com outros preditores.

Construir, mesmo que seja possível dizer crescimento, se usar a representação de uma árvore, é o segundo estágio, para perceber o que é possível por meio do algoritmo (enquanto esboça em um papel) ou no R por meio de árvores genéticas (é simplesmente uma metodologia já elaborada, para você jogar o script), ou como você faz - mas já trabalhando com uma pequena tabela geral - buscando regularidades relativas, e é possível pensar em outra coisa. E, nesse estágio, o CatBoost já pode digerir os dados com alegria, como uma solução intermediária. É possível extrair folhas e regras dos dados, mas elas geralmente são fracas.

Há alguma ferramenta em sua abordagem para levar em conta a invariância dos dados?

https://en.wikipedia.org/wiki/Affine_transformation
 
mytarmailS #:

Há alguma ferramenta em sua abordagem para levar em conta a invariância dos dados?

https:// en.wikipedia.org/wiki/Affine_transformation

Talvez isso seja relevante para vários pontos, por exemplo, para encontrar padrões semelhantes, mas no meu caso há essencialmente um ponto no primeiro estágio. O ponto é convertido/normalizado em diferentes sistemas de medição relativos - escala de tempo e preço, além de um terceiro espaço - qualquer preditor discreto que descreva continuamente o mercado. Você obtém três dimensões na representação inicial. Cada uma tem sua própria tabela quântica.