Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2031

 
mytarmailS:

podemos tentar expressar o alvo de uma forma mais complexa sob a forma de 4 parâmetros ao mesmo tempo


digamos que decidimos comprar...

e a rede não nos diz apenas para comprar ou vender.

ele nos diz

a que preço comprar, a que preço fechar, após quanto tempo comprar e após quanto tempo fechar

você também pode adicionar um stop loss

Previsões tão precisas e distantes parecem-me pesadas para aprender...

Para descolagens, penso que devemos fazer uma classificação com diferentes variantes de tomada de lucros e o modelo deve escolher a mais rentável. É semelhante à ZZ, mas o modelo deve funcionar em cada barra a partir de um determinado ponto, mas este ponto não aparecerá em cada movimento de preços a partir da posição aberta.

Um bom lugar para entrar é onde a perda mínima pode ser obtida, ou seja, é importante saber imediatamente o ponto de saída adequado para definir o SL, se o SL estiver ligado a algum indicador de nível, então os pontos de entrada são bastante fáceis de encontrar e peneirar para fora, eles são semelhantes, e, portanto, o treinamento deve ser melhor.

Então a questão é como encontrar tais pontos...

 
Aleksey Vyazmikin:

Um desejo de sucesso está aí :)

Precisas de uma regressão, então? Eu não tenho muita experiência em tais modelos.

Estou familiarizado com este conceito - há pessoas que o fazem - a questão é como criar estratégias - no próprio motor...

Então, para classificação, o alvo faz? Vou deixar a primeira parte da tabela, que é sobre a entrada, SL, TP e a última coluna +-1 como resultado da troca. Por exemplo, se eu tiver uma saída, a última coluna deve ser +-1.

De que motor estamos a falar? Em força bruta caseira ou genética, para começar.

 
Rorschach:

Então, para classificar o alvo, fazer? Vou deixar a primeira parte da tabela, que é sobre a entrada, SL, TP e a última coluna +-1 como resultado da troca. Acho que não devo dar informações sobre a saída, porque é possível espiá-la.

De que motor estamos a falar? Em força bruta caseira ou genética, para começar.

Você pode fazer regressão, um modelo pode ser feito, desde que seja apenas pesquisa, como eu o entendo. Mas para avaliar a qualidade lá é mais complicado - precisará avaliar o desvio do plano, eu não sei se você pode avaliar imediatamente o vetor de desvio ou lá modulo - não engajado.

Sobre um motor que, sabiamente, tomará os dados certos, para não gerar obviamente condições comerciais sem sentido - o próprio processo de geração da estratégia, e depois disso podemos pensar na genética ou em alguma outra forma de melhorar o modelo.

 
Aleksey Vyazmikin:

A regressão também pode ser feita, um modelo pode ser feito, desde que seja apenas pesquisa, como eu o entendo. Mas é mais complicado com a estimativa da qualidade - vamos precisar estimar o desvio do plano, não sei se é possível estimar o vetor de desvio ou modulo - eu não fiz isso.

Sobre o motor que sabiamente levará os dados necessários, de modo a não gerar condições comerciais sem sentido - o processo de geração da própria estratégia, e depois disso podemos pensar em genética ou outra coisa para treinar o modelo.

Na verdade, é interessante ver o agrupamento, como ele será agrupado, haverá alguma lógica.

Podemos começar com martin, anti-martin e virar. E depois ifelse: se o comércio fechar em menos, o próximo abre com lote duplo ou apenas em sentido contrário ou ambos. É difícil pensar em algo mais complicado a partir do zero.

 
Rorschach:

É realmente interessante ver o agrupamento, como ele será agrupado, se haverá alguma lógica lá.

Podíamos começar com um martin, um anti-martin e uma inversão. E depois ifelse: se um negócio fecha com prejuízo, então o próximo abre com lote duplo ou apenas na direção oposta ou ambos. É difícil pensar em algo mais complicado a partir do zero.

Eu posso fornecer recursos, não posso fazer mais no momento.

 
Aleksey Vyazmikin:

Eu posso fornecer recursos, não posso fazer mais no momento.

A Catbust tem características_importâncias, a capacidade de olhar para clusters, como nas florestas?

A sua máquina vai digerir a mesa 14 por 180.000.000?

 
Rorschach:

Será que o catbust tem características_importâncias, a capacidade de olhar para os aglomerados, como nos andaimes?

A sua máquina vai digerir a mesa 14 por 180.000.000?

"Feature_importances" é a importância das características, o que tem a ver com os clusters? Ou estou a perder alguma coisa. Existe tal recurso, mas eu não o uso muito, porque essa importância é essencialmente contada por copas de árvores, o que não se encaixa no meu conceito.

Eu treinei modelos em mesas de 6 gigabytes. E não consumiu mais de 2x gigabytes de memória, como eu me lembro agora.

 
Aleksey Vyazmikin:

"feature_importances" é a importância das características, o que tem a ver com os clusters? Ou está-me a escapar alguma coisa? Existe tal recurso, mas eu não o uso muito, porque essa importância é essencialmente contada por copas de árvores, o que não se encaixa no meu conceito.

Eu treinei modelos em mesas de 6 gigabytes. E não consumiu mais do que 2 gigabytes de memória, como eu me lembro agora.

Para a floresta é possível ver a importância e os aglomerados. Em catbust é provavelmente plot_tree.

Os dados serão preparados e serão postados.

Fez uma versão de teste para 6 colunas, demorou 11GB. O bloco de notas++ não conseguiu abri-lo, diz que o arquivo é muito grande. O BD Browser para SQLite está pendurado há cerca de 20 minutos.
 
Rorschach:

Para uma floresta, há uma opção de olhar para a importância e os aglomerados. Em catbust é provavelmente plot_tree.

Eu prepararei os dados e os afixarei.

Fez uma versão de teste para 6 colunas, demorou 11GB. O bloco de notas++ não o conseguiu abrir, diz que o ficheiro é demasiado grande. O BD Browser para SQLite está pendurado há cerca de 20 minutos.
O visualizador de comandos total leva arquivos grandes, o que faz com que o Notepad++ desligue
 
Aleksey Vyazmikin:

"feature_importances" é a importância das características, o que tem a ver com os clusters? Ou está-me a escapar alguma coisa? Existe tal recurso, mas eu não o uso muito, porque essa importância é essencialmente contada por copas de árvores, o que não se encaixa no meu conceito.

Eu treinei modelos em mesas de 6 gigabytes. E não consumiu mais do que 2 gigabytes de memória, como eu me lembro agora.

Como será que eles treinam árvores sem levar todos os dados para a memória? Se tivéssemos uma mesa de 6 gigabytes, também teríamos que usar cerca de 6 gigabytes de memória. Uma árvore tem de ordenar cada coluna como um todo. Se não colocarmos tudo na memória, mas lermos os dados do disco todas as vezes, será muito lento.
A única variante é manter os dados na memória em tipo flutuante em vez do dobro, mas isso reduzirá a precisão. Para nós com 5 dígitos de precisão, pode não ser muito ruim, mas o catbust é um software universal, acho que os problemas físicos e matemáticos devem ser resolvidos com dupla precisão.