Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2029

 
elibrarius:
Quais são os dados?

Cada minuto de compra é aberto com SLs e TPs de 100 a 2500 em incrementos de 100 em uma base de 5 dígitos. Ou seja, a cada minuto 625 compras são abertas. Tudo ao preço do minuto de abertura.

Depois de descodificar, devia ter ficado assim:

Não, preço de entrada (*10^5), hora unix, ano, mês, dia, minuto, segundo, dia da semana, dia do ano, ... ...tudo o mesmo para a saída, ... , SL em pp, SL em preços, TP em PP, TP em preços, resultado comercial.

As florestas devem dar um passo em frente. É interessante dividi-lo em grupos, também.

 
Rorschach:

Cada minuto de compra é aberto com um SL e TP de 100 a 2500 em incrementos de 100 em uma base de 5 dígitos. Ou seja, a cada minuto 625 compras são abertas. Tudo ao preço do minuto de abertura.

Depois de descodificar, devia ter ficado assim:

Não, preço de entrada (*10^5), hora unix, ano, mês, dia, minuto, segundo, dia da semana, dia do ano, ... ...tudo o mesmo para a saída, ... , SL em pp, SL em preços, TP em PP, TP em preços, resultado comercial.

As florestas devem dar um passo em frente. Em aglomerados também é interessante decompor-se.

Eu tenho feito a mesma coisa com o TP\CL.
Não fiz um passo de 10 pt no meu, fiz 100,200,300,500,700,700,1000,2000 - se você aplicar isso, você recebe 49 combinações diferentes por minuto, o que é quase 13 vezes menos dados.
Eu não acho que um bom lançamento é necessário em TP/SCL alto, 2400 e 2500 será ligeiramente diferente, e a economia de recursos é 13 vezes.
Eu também fiz passes separados para cada combinação de CPOLs, em vez de todos de uma só vez em um arquivo.
Por TP/SL igual, você pode avaliar imediatamente a rentabilidade do sistema. Por exemplo, em TP = 50. Eu obtenho 53-55% dos negócios bem sucedidos. No testador.

Desde março, quando a volatilidade aumentou, é impossível usar TP=SL=50, enquanto que era uma combinação válida por muitos anos. Antes de Março 50 pts podiam ganhar 10-20 min, enquanto em Março demorou 1-2-5 min.
Agora só quero pesquisar pontos de entrada e estimar resultados na mosca com o meu testador. Acho que será mais universal para qualquer volatilidade.

Tente pegar uma combinação de TP=SL=100 por exemplo e treinar o modelo. Acho que devias ter poder suficiente para isso. Se for superior a 55% no OOS, então seus dados são melhores que os meus) E é ainda melhor verificar não no OOS (pois pode ser apenas sorte), mas por validação cruzada - é mais confiável.
 
elibrarius:
Eu fiz a mesma coisa com o TP/SCL.
Eu não fiz um passo de 10 pt no meu, mas numa grelha de 100,200,300,500,700,700,1000,2000 - se aplicarmos isso, obtemos 49 combinações diferentes por minuto, o que é quase 13 vezes menos dados.
Eu não acho que um bom lançamento é necessário em TP/SCL alto, 2400 e 2500 será ligeiramente diferente, e a economia de recursos é 13 vezes.
Eu também fiz passes separados para cada combinação de CPOLs, em vez de todos de uma só vez em um arquivo.
Por TP/SL igual, você pode avaliar imediatamente a rentabilidade do sistema. Por exemplo, em TP = 50. Eu obtenho 53-55% dos negócios bem sucedidos. No testador.

Desde março, quando a volatilidade aumentou, é impossível usar TP=SL=50, enquanto que era uma combinação válida por muitos anos. Antes de Março 50 pts podiam ganhar 10-20 min, enquanto em Março demorou 1-2-5 min.
Agora só quero pesquisar pontos de entrada e estimar resultados na mosca com o meu testador. Acho que será mais universal para qualquer volatilidade.

Tente pegar uma combinação de TP=SL=100 por exemplo e treinar o modelo. Acho que devias ter poder suficiente para isso. Se for superior a 55% no OOS, então os seus dados são melhores que os meus) E é ainda melhor verificar não no OOS (já que pode ser apenas sorte), mas por validação cruzada - é mais confiável.

O mais provável é que você tenha de desbastar os seus dados.

 
Rorschach:

Você provavelmente terá que afinar os seus dados

Se você fizer um treinamento com TP/CL=50 ou 100 escreva o resultado na validação cruzada, eu me pergunto se você receberá mais de 55%
 
elibrarius:
Se você faz treinamento com SP/SL=50 ou 100 escreva o resultado na validação cruzada, eu me pergunto se você recebe mais de 55%.

Durante 10 anos, eu geri um sistema no testador que abriu uma compra uma vez por dia com diferentes rácios SL/TP. Dos que sobreviveram, não havia sistemas com o mesmo SL e TP, a maioria com TP<SL. Podes geri-lo tu mesmo.

Eu também fiz uma emulação, que mostrou que um sistema com SL<SL é mais rápido para entrar no preto.

 
mytarmailS:

Meteste-te outra vez com a rede?)

Finalmente encontrei o insecto no testador. Agora está tudo a encaixar.

O mais provável é que tenha cometido o mesmo erro no seu testador.

fechou o tema ) com pressa, Lamba é adiado

 
Rorschach:

Tenho as datas, agora não sei como processá-las, não tenho assim tanto poder((((

Neste momento é um csv com uma coluna de índices, pesa um trabalho. Depois de "descodificar" o binário vai pesar 17 vezes mais.

Quem precisa disso?

CatBoost vai engolir estes dados - funciona bem com os grandes arquivos. Eu só não entendi, que alvo...

Se você preparar os dados em formato csv com o alvo, eu posso executá-los em minha casa.

 
Rorschach:

Durante 10 anos, eu geri um sistema no testador que abriu uma compra uma vez por dia com diferentes rácios SL/TP. Dos sistemas que sobreviveram, não houve sistemas com o mesmo SL e TP, a maioria com TP<SL. Podes geri-lo tu mesmo.

Eu também fiz uma emulação, que mostrou que um sistema com TP<SL era mais rápido de sair pelo lado positivo.

Eu consegui fazer um sistema com TP excedendo SL por 2-3 vezes, mas há outro problema - 20%-25% das negociações lucrativas, e eu não posso treinar adequadamente o modelo para filtrar as entradas perdidas.

 
Maxim Dmitrievsky:

Verifiquei, funciona melhor no testador. Eu vou investigar novamente )

acabei de entrar em recidivas... muito fixe de aprender.

Z.U. fez tudo certo - muito tristemente aprendível.

amor pensado, mas não - experimentar novamente))

Porque é que é tão triste? Maxim, não tem links para a documentação sobre os recursores? Estou interessado em como exatamente os pesos são atualizados durante o treinamento.
 
Alexander Alekseyevich:
Porque é que é triste??? Maxim, você não tem links para a documentação sobre recorrência? Estou interessado em como exatamente os pesos são atualizados durante o treinamento.

eles são requalificados da mesma forma que os outros

Há muita informação no google

aqui está um bom

https://towardsdatascience.com/gate-recurrent-units-explained-using-matrices-part-1-3c781469fc18

Gated Recurrent Units explained using Matrices: Part 1
Gated Recurrent Units explained using Matrices: Part 1
  • Sparkle Russell-Puleri
  • towardsdatascience.com
In the first step a dictionary of all of the unique characters is created to map each letter to a unique integer: Character dictionary : {‘h’: 0, ‘a’: 1, ‘t’: 2, ‘M’: 3} Our encoded input now becomes: MathMath = [3, 1, 2, 0, 3, 1, 2, 0] Step 1: Create batches of data This step is achieved by the user specifying how many batches (B), or sequence...