Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2586
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
))))
Eu estou fora)
Logloss mostra a quantidade de informação mútua entre os traços e o alvo, tanto quanto eu entendo. Este é o f-i mais objetivo, sem descrever a forma de dependência. O modelo é treinado para minimizar a perda de tais informações, especialmente o impulso funciona dessa forma. O que você adiciona em cima de um personalizado vai parar no treinamento.
Parece que a logloss é derivada com base no princípio da máxima probabilidade para uma distribuição binomial. No Matstat, o princípio da máxima probabilidade é estendido e generalizado como M-estima, o que pode ser alguma justificação teórica para experiências (mas não uma garantia do seu sucesso, é claro).
Tal como a logloss é derivada do princípio da máxima probabilidade para uma distribuição binomial. No matstat o princípio da máxima verosimilhança é estendido e generalizado como M-estima, o que pode ser alguma justificação teórica para experiências (mas não uma garantia do seu sucesso, é claro).
Confundido com cross-entropy provavelmente, mas é mais frequentemente usado para multiclasse.
Parece haver aí algo que o valor teórico da perda mínima de logloss coincide com a entropia.
De qualquer forma, não vejo um problema para fazer uma estimativa adicional através de qualquer f-função, mas puramente do gráfico de balanço
Acho que sim. Apenas confuso pela falta de um grande número de artigos sobre o assunto) Provavelmente com medo de revelar locais de pesca)
Parece haver algo ali que o valor teórico do mínimo de loglosses coincide com a entropia.
Acho que sim. Só falta um grande número de artigos sobre o assunto perturba) Provavelmente, eles têm medo de revelar lugares suspeitos)
Prado tem um monte de coisas interessantes sobre este assunto, seus artigos estão no site. Ponha-o numa gaveta comprida, mas eu gostaria de o ler mais tarde. Um dos autores mais sensatos).
Sim, eu devia dar uma vista de olhos aos artigos dele. Ele tem alguns deles, no entanto)
Quanto à sua ideia de combinar métricas padrão e personalizadas lembrei-me de uma ideia com uma árvore, onde é construída por cruzamento de centros e podada por frequência de erros. Acho que podias tentar usar a tua própria métrica em vez da frequência.
Você pode compartilhar a informação?
1. Às vezes.
2. Por dentro, por fora.
3.
3.1 Assinaturas de eventos. Os mesmos eventos que na MQL5 desencadeados por certos métodos de manuseamento.
A possibilidade de escrever estratégias em Python (como um tipo de aplicação) que podem ser testadas no backtester.
Algum mecanismo de interação MQL5-Python pronto para uso. Python pode interagir com o mt5 em ambas as direções, MQL5 pode interagir com ele em ambas as direções, MQL5 é uma unidade com o terminal e é muito bom em
com funções comerciais e similares, mas não sabe como trabalhar confortavelmente com as melhores soluções de dados da indústria. Python é o padrão da indústria em sentido de dados - pandas, numpy, TensorFlow, Keras, PyTorch etc, mas muito menos a integração "trader" na plataforma. Seria legal ter meios padrão de integração desses dois poderes - algo como pendurar um script Python no mt5, e o script tem um modelo esperando, sob vapor, ou um pool de modelos, funções lidando com dados de pré-processamento, etc. O script tem aplicação e estratégia MQL5, que faz o seu trabalho, e chama a funcionalidade ML deste script quando necessário - rapidamente e sem muletas.
Alguém usa o pacote P para a estratégia Quantstrat?
Como é em termos de velocidade?
Honestamente, não entendo muito. A questão é: a probabilidade muda com o tempo? Para estudar isto, pode-se simplesmente construir uma regressão logística no tempo (e verificar o significado da diferença entre o coeficiente e zero).
Se outros fatores que afetam a probabilidade estão sendo estudados além do tempo, então estes também podem ser tentados para adicionar à regressão logística.
Ou talvez seja mais fácil fazer outro preditor - a distância da linha de dados em relação à linha atual. A própria floresta pode calcular que os dados com mais de 8 meses são ruins para a previsão atual. E haveria uma divisão simples: antes de 8 meses (com folhas melhores) e depois de 8 meses com folhas piores.
Bem numa bandeja, todos eles aprendem bem, claro. No teste/crossvalidação devemos verificar. Mas como? Não está claro. Não é sequer o significado do preditor, mas o significado da divisão.
Hoje acrescentei um tal preditor de distância da barra actual. Pode ser um número ou apenas um tempo. Demorei o tempo necessário.
Experimentalmente escolhido que a duração da história para o conjunto de dados do treinamento de 1 mês, dá o melhor avanço.
A suposição de que a adição de um preditor de distância a partir da primeira linha de dados irá ajudar estava errada. Na prática, o avanço só piorou com 1 mês de dados, e com 2, e com 10.
Suponha que você tem 2 meses de dados, a árvore encontrou a divisão de 1 mês e um de seus ramos treinou com os mesmos dados que a duração escolhida experimentalmente de 1 mês. O outro mês também treinou sobre os seus próprios dados. E aprendeu bem, nada mal (como eu sugeri no início). Vai ser mau para o avançado, e só vai aprender na bandeja. Como resultado, o modelo calcula a média dos resultados para ambos os meses e o forward é pior do que se tivesse sido treinado apenas por 1 mês.
Conclusão: Você não pode aplicar tempo global ou número de linha. Variantes do tempo cíclico: dia da semana, hora, minuto são úteis, mas devemos verificá-las.
Para cada meta (e/ou conjunto de preditores) a duração do histórico de treinamento terá que ser ajustada/optimizada.
Marcado "Opções de tempo cíclico: dia da semana, hora, número de minutos pode ser útil - é preciso verificar".
Os minutos quase não têm efeito, alterações de não mais de 0,5%
As horas e os dias da semana têm efeito. Mudanças de cerca de 3-5%.
Eu construo 2 modelos ao mesmo tempo: 1 para comprar, 2 para vender.
Comprar modelos funciona melhor sem tempo por 4-5% e vender modelos funciona melhor com o tempo pelos mesmos 4-5%. Como 5% vender a tempo e comprar de acordo com outros princípios.