Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2586

 
mytarmailS #:

))))

Eu estou fora)

Dou-lhe uma dica: em termos de generalização, nada muda.
 
Maxim Dmitrievsky #:
Logloss mostra a quantidade de informação mútua entre os traços e o alvo, tanto quanto eu entendo. Este é o f-i mais objetivo, sem descrever a forma de dependência. O modelo é treinado para minimizar a perda de tais informações, especialmente o impulso funciona dessa forma. O que você adiciona em cima de um personalizado vai parar no treinamento.

Parece que a logloss é derivada com base no princípio da máxima probabilidade para uma distribuição binomial. No Matstat, o princípio da máxima probabilidade é estendido e generalizado como M-estima, o que pode ser alguma justificação teórica para experiências (mas não uma garantia do seu sucesso, é claro).

 
Aleksey Nikolayev #:

Tal como a logloss é derivada do princípio da máxima probabilidade para uma distribuição binomial. No matstat o princípio da máxima verosimilhança é estendido e generalizado como M-estima, o que pode ser alguma justificação teórica para experiências (mas não uma garantia do seu sucesso, é claro).

Confundido com a centralidade cruzada, provavelmente, mas é mais frequentemente usado para multiclasse. Em qualquer caso, não vejo um problema para fazer uma estimativa adicional através de qualquer f-f-função, mas puramente do gráfico de balanço
 
Maxim Dmitrievsky #:
Confundido com cross-entropy provavelmente, mas é mais frequentemente usado para multiclasse.

Parece haver aí algo que o valor teórico da perda mínima de logloss coincide com a entropia.

Maxim Dmitrievsky #:
De qualquer forma, não vejo um problema para fazer uma estimativa adicional através de qualquer f-função, mas puramente do gráfico de balanço

Acho que sim. Apenas confuso pela falta de um grande número de artigos sobre o assunto) Provavelmente com medo de revelar locais de pesca)

 
Aleksey Nikolayev #:

Parece haver algo ali que o valor teórico do mínimo de loglosses coincide com a entropia.

Acho que sim. Só falta um grande número de artigos sobre o assunto perturba) Provavelmente, eles têm medo de revelar lugares suspeitos)

Prado tem muitos artigos interessantes sobre o assunto. Coloque-o numa gaveta comprida, mas terá todo o gosto em lê-lo mais tarde. Um dos autores mais sensatos )
 
Maxim Dmitrievsky #:
Prado tem um monte de coisas interessantes sobre este assunto, seus artigos estão no site. Ponha-o numa gaveta comprida, mas eu gostaria de o ler mais tarde. Um dos autores mais sensatos).

Sim, eu devia dar uma vista de olhos aos artigos dele. Ele tem alguns deles, no entanto)

Quanto à sua ideia de combinar métricas padrão e personalizadas lembrei-me de uma ideia com uma árvore, onde é construída por cruzamento de centros e podada por frequência de erros. Acho que podias tentar usar a tua própria métrica em vez da frequência.

 
Renat Fatkhullin #:
Você pode compartilhar a informação?
1) Você usa a biblioteca de pitões MT5?
2) Você o usa fora ou dentro do MT5?
3) Quais as características que faltam na biblioteca? Acesso a indicadores?

Estamos preparando uma atualização da MQL5, adicionando operações de matriz rápida. Isto permitirá realizar cálculos massivos.

Além disso, vamos desenvolver conectores para pacotes analíticos e implementar a integração padrão WinML.

1. Às vezes.

2. Por dentro, por fora.

3.

3.1 Assinaturas de eventos. Os mesmos eventos que na MQL5 desencadeados por certos métodos de manuseamento.

A possibilidade de escrever estratégias em Python (como um tipo de aplicação) que podem ser testadas no backtester.

Algum mecanismo de interação MQL5-Python pronto para uso. Python pode interagir com o mt5 em ambas as direções, MQL5 pode interagir com ele em ambas as direções, MQL5 é uma unidade com o terminal e é muito bom em

com funções comerciais e similares, mas não sabe como trabalhar confortavelmente com as melhores soluções de dados da indústria. Python é o padrão da indústria em sentido de dados - pandas, numpy, TensorFlow, Keras, PyTorch etc, mas muito menos a integração "trader" na plataforma. Seria legal ter meios padrão de integração desses dois poderes - algo como pendurar um script Python no mt5, e o script tem um modelo esperando, sob vapor, ou um pool de modelos, funções lidando com dados de pré-processamento, etc. O script tem aplicação e estratégia MQL5, que faz o seu trabalho, e chama a funcionalidade ML deste script quando necessário - rapidamente e sem muletas.

 

Alguém usa o pacote P para a estratégia Quantstrat?

Como é em termos de velocidade?

 
Aleksey Nikolayev #:

Honestamente, não entendo muito. A questão é: a probabilidade muda com o tempo? Para estudar isto, pode-se simplesmente construir uma regressão logística no tempo (e verificar o significado da diferença entre o coeficiente e zero).

Se outros fatores que afetam a probabilidade estão sendo estudados além do tempo, então estes também podem ser tentados para adicionar à regressão logística.

elibrarius #:

Ou talvez seja mais fácil fazer outro preditor - a distância da linha de dados em relação à linha atual. A própria floresta pode calcular que os dados com mais de 8 meses são ruins para a previsão atual. E haveria uma divisão simples: antes de 8 meses (com folhas melhores) e depois de 8 meses com folhas piores.
Bem numa bandeja, todos eles aprendem bem, claro. No teste/crossvalidação devemos verificar. Mas como? Não está claro. Não é sequer o significado do preditor, mas o significado da divisão.

Hoje acrescentei um tal preditor de distância da barra actual. Pode ser um número ou apenas um tempo. Demorei o tempo necessário.

Experimentalmente escolhido que a duração da história para o conjunto de dados do treinamento de 1 mês, dá o melhor avanço.

A suposição de que a adição de um preditor de distância a partir da primeira linha de dados irá ajudar estava errada. Na prática, o avanço só piorou com 1 mês de dados, e com 2, e com 10.

Suponha que você tem 2 meses de dados, a árvore encontrou a divisão de 1 mês e um de seus ramos treinou com os mesmos dados que a duração escolhida experimentalmente de 1 mês. O outro mês também treinou sobre os seus próprios dados. E aprendeu bem, nada mal (como eu sugeri no início). Vai ser mau para o avançado, e só vai aprender na bandeja. Como resultado, o modelo calcula a média dos resultados para ambos os meses e o forward é pior do que se tivesse sido treinado apenas por 1 mês.

Conclusão: Você não pode aplicar tempo global ou número de linha. Variantes do tempo cíclico: dia da semana, hora, minuto são úteis, mas devemos verificá-las.
Para cada meta (e/ou conjunto de preditores) a duração do histórico de treinamento terá que ser ajustada/optimizada.

 

Marcado "Opções de tempo cíclico: dia da semana, hora, número de minutos pode ser útil - é preciso verificar".

Os minutos quase não têm efeito, alterações de não mais de 0,5%
As horas e os dias da semana têm efeito. Mudanças de cerca de 3-5%.

Eu construo 2 modelos ao mesmo tempo: 1 para comprar, 2 para vender.
Comprar modelos funciona melhor sem tempo por 4-5% e vender modelos funciona melhor com o tempo pelos mesmos 4-5%. Como 5% vender a tempo e comprar de acordo com outros princípios.