Existe um padrão para o caos? Vamos tentar encontrá-lo! Aprendizado de máquina com o exemplo de uma amostra específica. - página 3

 
Aleksey Vyazmikin #:

Você pode verificar o modelo exatamente no arquivo exam.csv?

Você tentou fazer alguma manipulação com a amostragem?

Aqui está o equilíbrio na amostra do exame após a eliminação de alguns dos preditores.

Obviamente, os gráficos da distribuição de respostas do modelo mostram que foi feito apenas um pouco de treinamento - o Recall é muito baixo, mas já é algum resultado.

train.csv


exame.csv

Há 9046 linhas no exame. Eu tenho 9000. Não haverá quase nenhuma diferença.

Sua curva é muito melhor. Vou tentar fazer mais alguns ajustes nos parâmetros.
 
elibrarius #:

Qual é o melhor equilíbrio que você tem?

Agora que pesquisei em diferentes variantes, parece que esse resultado - também há na rodada da comissão 3 pontos que são considerados na ideia.


 
elibrarius #:
Há 9.046 linhas. Eu tenho 9000. Isso não fará muita diferença.

Você tem uma curva muito melhor. Vou tentar mexer um pouco mais nos parâmetros.

Bem, se forem dados do arquivo de exame, então sim - não há muita diferença, apenas pensei que talvez fosse o arquivo de trem. Você mesclou os três arquivos originalmente?

Tente fazer isso.

 
Aleksey Vyazmikin #:

Bem, se forem os dados do arquivo de exame, então sim - não faz muita diferença, apenas pensei que poderia ser o arquivo de trem. Você mesclou os três arquivos originalmente?

Tente fazer isso.

Sim, mesclei todos os três e depois especifiquei apenas os comprimentos das seções.
 
elibrarius #:
Sim, eu combino todos os três e, em seguida, insiro apenas os comprimentos das seções.

Entendo, então está tudo bem.

Acho que há uma possibilidade de melhorar o treinamento reduzindo a amostra, digamos, para treinar em 1/10 - isso permitirá treinar uma fase/estrutura do mercado - ainda não precisei fazer isso.

 

Somente com a alteração da taxa de aprendizado foi possível obter dois modelos entre 100 que atendiam ao critério.

Um.

O segundo.

Acontece que sim, o CatBoost é capaz de fazer muito, mas é necessário ajustar as configurações de forma mais agressiva.

 
Aleksey Vyazmikin #:

Certo, bem, então tudo bem.

Acho que existe a possibilidade de melhorar o treinamento reduzindo a amostra, digamos, para treinar 1/10 - isso permitirá treinar uma fase/estrutura do mercado - ainda não é necessário.

Tentei treinar com o valking forward a 1000 e a 20000 - tudo falhou.
 
Ou dar uma aula de comércio/não comércio?
Ou comprar e vender separadamente?
 
elibrarius #:
Ou ensinar uma classe a negociar/não negociar?
Ou separar compra e venda?

Os resultados são mostrados a partir de amostras sem transformação de alvo, ou seja, sim - negociar e não negociar.

Mas, na verdade, seria mais fácil treinar amostras separadas de compra e venda.

elibrarius #:
tentou aprender valendo para a frente a 1000 e a 20000 - todos os drenos.

Hmm, estranho. Que método você usa para treinamento - floresta aleatória?

 
Aleksey Vyazmikin #:

Hmm, estranho. Que método você usa para treinamento - floresta aleatória?

Redesenhado a partir do Alglibow.
Estou executando mais árvores agora. Pela manhã, acho que ele calculará uma nova versão.

Ou talvez eu tenha feito algo errado, se o resultado for muito pior que o seu.