Existe um padrão para o caos? Vamos tentar encontrá-lo! Aprendizado de máquina com o exemplo de uma amostra específica. - página 22

 
Aleksey Vyazmikin #:
Mas consegui esse modelo

.

Não há necessidade de esperar que o melhor modelo do exame seja lucrativo no futuro. A média ou a maioria deve ser lucrativa.

É exatamente como no otimizador de testadores - os melhores modelos serão os melhores no futuro em 99% das vezes.

 
elibrarius #:

As divisões são feitas somente até o quantum. Tudo dentro do quantum é considerado como o mesmo valor e não é dividido posteriormente.

Você não entendeu - o ponto é que cada divisão reduz a amostra para a próxima divisão, que ocorre de acordo com a tabela quântica, mas a métrica mudará a cada vez.

Bem, há algoritmos que criam uma nova tabela quântica após cada divisão ao treinar o modelo.

elibrarius #:

Não entendo por que você está procurando algo no quantum, seu objetivo principal é acelerar os cálculos (o objetivo secundário é carregar/generalizar o modelo para que não haja mais divisão, mas você também pode limitar a profundidade dos dados de flutuação). Fiz a quantificação em 65.000 partes - o resultado é absolutamente o mesmo que o modelo sem quantificação.

Aparentemente, estou vendo a eficiência, por isso a utilizo. 65.000 partes é muito, vejo que o objetivo da quantificação é generalizar os dados para criar um recurso categórico, portanto, é desejável que 2% a 5% de toda a amostra seja quantificada. É possível que isso não seja verdade para todos os preditores - os experimentos ainda não foram concluídos.

elibrarius #:

Haverá 1 divisão que divide os dados em 2 setores - um tem todos os 0s, o outro tem todos os 1s. Não sei o que é chamado de quanta, mas acho que quanta é o número de setores obtidos após a quantificação. Talvez seja o número de divisões, como você quis dizer.

Sim, está claro, você está certo sobre a divisão, eu sorri um pouco. Em geral, há um conceito de tabela quântica no CatBoost, há exatamente divisões, e eu mesmo uso segmentos - duas coordenadas, e talvez eles possam ser chamados de quanta ou segmentos quânticos. Não conheço a terminologia real, mas eu mesmo os chamo assim.

 
elibrarius #:

Não há necessidade de esperar que o melhor modelo no exame seja lucrativo no futuro. A média ou a maioria deve ser lucrativa.

É exatamente como no otimizador de testadores - os melhores modelos serão os melhores no futuro 99% das vezes.

O objetivo agora é entender o potencial ao qual podemos aspirar. Não negociarei com esses modelos.

E espero que o número de modelos selecionados aumente devido à redução da variabilidade na seleção dividida - veremos mais tarde hoje.

 
Aleksey Vyazmikin #:

E espero que o número de modelos que foram selecionados aumente devido à redução da variabilidade na seleção dividida - veremos mais tarde.

Acontece que eu estava errado - o número de modelos é de apenas 79, lucro médio no exame -1379

 
elibrarius #:

Não há necessidade de esperar que o melhor modelo no exame seja lucrativo no futuro. A média ou a maioria deve ser lucrativa.

É exatamente como no otimizador de testadores - os melhores modelos serão os melhores no futuro 99% das vezes.

A propósito, decidi dar uma olhada na amostra de outro modelo, que também não estava em treinamento - aquele que foi cortado anteriormente.

E aqui está a aparência do mesmo modelo nesses dados (2014-2018).

Equilíbrio

Acho que não é ruim, pelo menos não é uma ameixa de 45 graus. Ou seja, ainda podemos esperar que um bom modelo continue a ser bom?

 
Aleksey Vyazmikin #:

A propósito, decidi dar uma olhada em uma amostra do outro que também não estava em treinamento - aquele que foi cortado anteriormente.

E o mesmo modelo tem a seguinte aparência nesses dados (2014-2018).

Acho que não é ruim, pelo menos não é uma ameixa de 45 graus. Ou seja, ainda podemos esperar que um bom modelo continue a ser bom?

talvez)

 
elibrarius #:

talvez)

Infelizmente, verifiquei todos os modelos - aqueles que ganharam mais de 3.000 na amostra do trem e do exame - 39 peças foram, na amostra nova-antiga apenas 18 (46%) apresentaram resultado lucrativo. Isso é certamente mais do que 1/3, mas ainda não é suficiente.

Essa é a diferença nos saldos dos modelos selecionados entre a amostra de exame regular e a descartada (2014-2018).

 
Aleksey Vyazmikin #:

Infelizmente, verifiquei todos os modelos - aqueles que ganharam mais de 3.000 na amostra do trem e do exame - 39 peças foram, na nova amostra antiga apenas 18 (46%) mostraram resultados lucrativos. Isso é certamente mais do que 1/3, mas ainda não é suficiente.

Essa é a diferença nos saldos dos modelos selecionados entre a amostra de exame regular e a descartada (2014-2018).

Em geral, ainda não é nem mesmo 50/50 (em termos de lucro). Se já é difícil criar novos recursos relacionados à meta, talvez a meta deva ser alterada?
 
elibrarius #:
Em geral, mesmo 50/50 ainda não dá certo (em termos de lucro). Se for difícil criar novos recursos relacionados à meta, talvez a meta deva ser alterada?

Novos preditores podem ser inventados, ainda há ideias, mas não tenho certeza de que o treinamento se baseará neles, levando em conta o princípio da ganância.... Talvez precisemos mudar a abordagem do treinamento de modelos, para fazer nossas próprias transformações de algoritmos conhecidos.

O alvo pode ser alterado, mas para quê? Alguma ideia?

 

Peguei a amostra da sexta etapa que descrevi aqui e troquei o exame e o teste.

De fato, o treinamento foi realizado de acordo com as mesmas regras, com as mesmas sementes, mas outra amostra - mais tarde na cronologia - foi responsável por interromper a criação de novas árvores.

Como resultado, o valor médio do lucro na amostra de teste (antigo exame) é de -730,5 - lembre-se de que, durante o treinamento cronológico na amostra de teste, o valor médio foi de 982,5 e, na amostra de exame (antigo teste ), o valor médio do saldo foi de 922,49 pontos, enquanto na variante inicial foi de -1114,27 pontos.

Figura 1 Histograma da distribuição do saldo da amostra de teste original quando usada como amostra de exame.

Figura 2 Histograma da distribuição do saldo da amostra de teste quando usada como amostra de exame.

Quando as amostras foram organizadas cronologicamente, o valor médio das árvores no modelo foi de 11,47; quando a sequência de duas amostras foi alterada, o valor médio das árvores no modelo foi de 9,11, ou seja, pode-se dizer que os padrões se tornaram menos aparentes depois que as amostras foram trocadas, portanto, menos árvores foram necessárias para descrevê-los.

Ao mesmo tempo, devido ao controle da parada por meio da amostragem real, os padrões se tornaram mais qualitativos e, como indiquei acima, em média se tornaram mais lucrativos.

Por um lado, o experimento confirma que as amostras contêm padrões semelhantes que duram anos, mas, ao mesmo tempo, alguns deles se tornam menos pronunciados ou até mesmo mudam sua probabilidade para a zona negativa do resultado do evento. Foi revelado anteriormente que não apenas os próprios preditores, mas também seu uso no modelo influenciam o resultado do treinamento.

Como resultado, temos o seguinte:

1. Uma amostra não representativa.

2. Padrões aleatórios que podem "ofuscar" os estáveis ao criar o modelo, ou o próprio método de criação do modelo não é suficientemente confiável.

3. Dependência do resultado do modelo na área de amostragem (o trem de amostragem anterior apresentou bons resultados na função de exame).