Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1539

 
Igor Makanu:

Os arquivos de voz e música são comprimidos usando dtw, que por sua vez também são VR

;)

Igor Makanu:

Eu estudei este tópico, nas minhas próprias palavras, é assim:

)) o que diabos é compressão? o que você estudou lá não é claro, mas definitivamente não que

Maxim Dmitrievsky:

porque é que precisa de comprimir rublos de barbatana :)

Porquê mesmo? :))

 
elibrarius:

Você pode simplesmente discretizar os dados de entrada, por exemplo, converter 5 dígitos para 4 dígitos. E os dados já estarão em grupos de 10.
Ou como eu já sugeri antes, você pode construir em floresta de algibeira para parar de ramificar quando a profundidade desejada ou o número de exemplos em uma folha é atingido.

A amostragem funciona melhor do que as fics+vanhot, não se registaram melhorias significativas

 
mytarmailS:

e realmente, porquê? :))

você pode comprimir citações em arquivos zip, olhar para o seu tamanho e será uma nova ficção

 
mytarmailS:

)) Que diabos é compressão? Não sei o que você tem estudado, mas definitivamente não é a mesma coisa.

Considere-se educado, pelo menos leia o Wiki antes de postar

o algoritmo dtw analisa o componente de tempo do sinal e ajusta-o a um valor constante. Conhecendo este valor, você pode simplesmente remover pausas entre a parte de informação do sinal - como resultado, você terá pacotes de dados sem componente de tempo + algoritmo de transformação de eixo temporal constante


Maxim Dmitrievsky:

você pode comprimir citações em arquivos zip, olhar para o seu tamanho e eles serão novos recursos

De jeito nenhum, o algoritmo zip é um algoritmo de transformação rigoroso, e você não pode identificar dados que diferem por 1 byte como os mesmos dados,

você não precisa de um algoritmo rígido de tratamento de dados, todos eles têm perdas nos dados originais. Se você não inventar, é jpg - ele comprime com perdas e os dados fechados no conteúdo serão restaurados quase idênticos no final, mas visualmente! - os checksums serão diferentes, os próprios bytes terão valores diferentes....

mas como exemplo de treinamento para os NS, talvez seja isso que você precise, ou seja, um jpg para dados arbitrários (não fotos)

 
Igor Makanu:

Não vai funcionar, o algoritmo zip é um algoritmo de conversão rigoroso, e você não pode identificar dados que diferem por 1 byte como os mesmos dados,

você não precisa de um algoritmo rigoroso para trabalhar com os dados, todos eles têm uma perda dos dados originais, se você não inventá-los - é jpg - ele comprime com uma perda e os dados que estão próximos no conteúdo serão restaurados aproximadamente o mesmo no final, mas visualmente! - os checksums serão diferentes, os próprios bytes terão valores diferentes....

mas como exemplo de treinamento para os NS, é provavelmente o que precisamos, ou seja, um arquivo jpg para dados arbitrários (não fotos)

Estava a brincar )) Bem, um autocodificador ou uma convolução faz bem o trabalho. Os artigos de Vladimir sobre codificadores têm codificadores, a convolução não.

Seq2seq é também essencialmente um descodificador-encodificador. Por exemplo, na tradução automática existem diferentes números de letras entre as palavras em russo e em inglês. Lá tudo é comprimido, analisado e depois descomprimido.

_COPY11@gautam.karmakar/summary-seq2seq-model-using-convolutional-neural-network-b1eb100fb4c4
Seq2Seq model using Convolutional Neural Network
Seq2Seq model using Convolutional Neural Network
  • Gautam Karmakar
  • medium.com
Seq2seq model maps variable input sequence to variable length output sequence using encoder -decoder that is typically implemented as RNN/LSTM model. But this paper https://arxiv.org/pdf/1705.03122.pdf shows application of convolutional neural network for seq2seq learning which is state of the art for computer vision using deep learning. There...
 
Maxim Dmitrievsky:

Comecei a ler algo sobre o dtw, mas não percebi como aplicá-lo em séries financeiras e porque preciso dele ) mas é um tópico interessante, acho eu.

Havia um conceito onde DTW era uma extensão do processo de encontrar semblante para um enredo, mas no final provavelmente é mais fácil (ou talvez não) usar wavelets.

 
Maxim Dmitrievsky:

Isso foi uma piada )) Bem, um codificador automático ou uma convolução faz bem o trabalho. Os artigos de Vladimir têm codificadores, não convolução.

Seq2seq é também essencialmente um descodificador-encodificador. Por exemplo, na tradução automática existem diferentes números de letras entre as palavras em russo e em inglês. Tudo isto é comprimido, analisado e depois descomprimido.

_COPY11@gautam.karmakar/summary-seq2seq-model-using-convolutional-neural-network-b1eb100fb4c4

Eu li sobre codificadores no ano passado, eu acho, que tudo, como sempre, depende de grandes tachas em um gráfico de preços - eles quebram qualquer transformação, se não houvesse tachas, então os MAs funcionariam, o filtro Kalman funcionaria e tudo funcionaria bem ))))

Por exemplo, se eu tiver uma amostra plana em primeiro lugar, vou tentar descomprimi-la e os espigões serão menores.


PS: sim, havia uma DTW no fórum, até pesquisarhttps://www.mql5.com/ru/code/10755

Eu costumava rodá-lo, mas... tudo deve ser tratado com um arquivo antes de ser usado ))))

 
transcendreamer:

Havia um conceito em que DTW era uma extensão do processo de busca de semblantes gráficos, mas no final provavelmente wavelets são mais fáceis (ou talvez não)

Igor Makanu:

PS: sim, havia uma DTW no fórum, até pesquiseihttps://www.mql5.com/ru/code/10755

Eu costumava rodá-lo, mas... tudo deve ser arquivado antes do uso ))))

Oh não, que se lixe, vou continuar a torcer as redes neurais. Eu não acredito em tal coisa.

 
Maxim Dmitrievsky:

Oh não, que se lixe, vou voltar para as redes neurais. Eu não acredito em tal coisa.

Eu também não quero rodar NS, estou ocupado com o MT5 testador e seu GA, GA funciona muito bem, você pode rapidamente (4,5 x 10^142 variantes testadas!!! - cerca de 2-3 horas) construir TS automático, e depois testá-lo em frente, os resultados são bastante aceitáveis, imho

HH: mas GA também precisa de um arquivo para finalizar, é difícil de pegar os parâmetros de entrada - dar muito será um teste de 5 anos, você começa a cortar como dados de entrada não corretos - aqui como sorte ou apenas encontrou onde parar e se não vai encontrar

 
Igor Makanu:

Eu também não quero fazer NS, eu levei o MT5 tester e seu GA, GA funciona de forma bastante adequada, você pode rapidamente (4,5 x 10^142 variantes testadas!!! - cerca de 2-3 horas) construir TS automático, e depois testá-lo em um avançado, os resultados são bastante aceitáveis, imho

Ou faço o monitoramento em breve, ou escrevo um artigo... Sou preguiçoso demais para me preocupar com o artigo, é muita digitação.

agora está tudo em Pitão. Poupa muito tempo.

A falha da GA é que não generaliza