Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2805

 
https://habr.com/ru/post/695276/ pode ser útil/interessante para algumas pessoas
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

Às vezes, é útil sobrepor o gráfico de saldo (azul) ao gráfico de preços (laranja)

Nesse caso, é claramente visível, por exemplo, que o modelo vem ganhando apenas em um mercado em queda há 10 anos

Da mesma forma, o modelo mais refinado aprende a ganhar principalmente em quedas, mas ganha menos em subidas e consolidações. Como o mercado esteve em queda durante todos os 10 anos, a amostra de treinamento é tendenciosa


 
elibrarius #:

Tem certeza de que ele está selecionando aleatoriamente os priors? Eu não estava fazendo catbusting, estava olhando o código de exemplos básicos de bousting. Todos os preditores são usados lá. Ou seja, o melhor é escolhido. O correlacionado será o próximo a ele, mas um pouco pior. Mas em alguns outros níveis de divisão ou em árvores de correção, outro dos preditores correlacionados pode ser melhor.

Há um parâmetro separado que permite usar apenas parte dos preditores para estimativa - ele é usado aleatoriamente -, o que aumenta o número de árvores de modelo, mas, em teoria, acelera o treinamento.

Eu teria certeza se tivesse analisado o código deles, portanto, estou falando apenas do que eles declararam - há uma pequena chance de eu ter entendido mal os desenvolvedores.

Então, o que eles estão falando é sobre adicionar aleatoriedade à avaliação dividida, fazendo isso eles melhoraram o aprendizado.

O fato de haver pré-processamento para eliminar preditores correlacionados - não ouvi falar sobre isso.

Concordo que outro preditor pode ser melhor ou mais útil, mas meu objetivo é treinar o maior número possível de modelos diferentes. Quero que eles aprendam alguma coisa.

 
Maxim Dmitrievsky #:
Portanto, forneça algumas fórmulas informativas para que eu possa testá-las.

Não estou entendendo, devo jogar isso para você ou para o conjunto de dados? Se for no conjunto de dados, qual é a relação com agrupamento semelhante ou correlação, já que o alvo não está envolvido nesse processo?

 
Aleksey Vyazmikin #:

Não entendo, devo jogá-lo para você ou para o conjunto de dados? Se for no conjunto de dados, como isso tem algo a ver com agrupamento de similaridade ou correlação, porque o alvo não está envolvido nesse processo?

Fórmulas para calcular boas fichas para reproduzir em python e mql. Eu mesmo pegarei as etiquetas.

só para dar uma olhada, pois só uso incrementos.

Posso carregar bots para eles após o treinamento.
 
Maxim Dmitrievsky #:

Às vezes, é útil sobrepor um gráfico de equilíbrio (azul) a um gráfico de preços (laranja)

Nesse caso, é claramente visível, por exemplo, que o modelo está ganhando apenas em um mercado em queda há 10 anos

Da mesma forma, o modelo mais refinado aprende a ganhar principalmente em quedas, mas ganha menos em subidas e consolidações. Como o mercado esteve em queda durante todos os 10 anos, a amostra de treinamento é tendenciosa


O preço é construído com base no princípio dos deltas entre o fechamento e a abertura das negociações ou é algum tipo de racionamento de tempo?

 
Aleksey Vyazmikin #:

O preço é construído com base no princípio dos deltas entre o fechamento e a abertura de uma negociação ou é algum tipo de racionamento de tempo?

sim, no momento das negociações ele é fixo

 
Maxim Dmitrievsky #:

fórmulas para calcular bons chips para reproduzir em python e mql. Eu mesmo pegarei os rótulos.

só para dar uma olhada, pois só uso incrementos.

Posso carregar bots neles após o treinamento.

Você sabe que a "qualidade" de um recurso é determinada por seu alvo.

Eu descrevi o princípio da criação anteriormente. O código em MQL5 está todo em MQL5, e não há dúvida de qualquer conversão através de uma função - não é possível dar uma fórmula.

Por exemplo, a hora de início do segmento atual ZZ(48) é frequentemente selecionada.

 
Aleksey Vyazmikin #:

Você sabe que a "qualidade" de um recurso é determinada pelo alvo.

Eu descrevi o princípio da criação anteriormente. O código em MQL5 está todo em MQL5, e não há dúvida de qualquer conversão através de uma função - é impossível dar uma fórmula.

Por exemplo, a hora de início do segmento atual ZZ(48) é frequentemente selecionada.

ah, bem, principalmente em indicadores padrão e seus derivados?

 
Maxim Dmitrievsky #:

Sim, o momento das transações é fixo

Tente criar uma marcação para compra e venda, selecionando um modelo mais equilibrado pelo número de entradas e, em seguida, divida a amostra em duas e crie dois modelos separados.