Aprendizado de máquina no trading: teoria, prática, negociação e não só

Maxim Dmitrievsky 2020.11.13 15:27 #21131

Aleksey Vyazmikin:

Maxim, como é que se monta esta coisa?

O que é id_tl ?

Não sei, preciso de uma ligação.

talvez a id_tl dos exemplos transformados simplesmente

Maxim Dmitrievsky 2020.11.13 15:27 #21132

Aleksey Vyazmikin:

Obrigado! Tudo se resolveu.

Acho que está certo - só treino converter, porque no teste só vai o controle - então eu fiz, mas o resultado é muito estranho - logloss de erro excede 1 na amostra de teste e cresce - como isso pode ser de todo - estou chocado.

você pode tentar coisas diferentes, só para ver

aqui está um bom caderno de notas https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

você pode copiar e testar

Resampling strategies for imbalanced datasets

www.kaggle.com

Explore and run machine learning code with Kaggle Notebooks | Using data from Porto Seguro’s Safe Driver Prediction

Aleksey Vyazmikin 2020.11.13 15:39 #21133

Maxim Dmitrievsky:

Não sei, preciso de uma ligação.

Provavelmente as idiossincrasias dos exemplos transformados apenas

É o mesmo artigo - nada está claro lá.

Maxim Dmitrievsky 2020.11.13 15:40 #21134

Aleksey Vyazmikin:

Continua a ser o mesmo artigo - nada está claro lá.

é copiado, eu dei-te um link para o original.

Aleksey Vyazmikin 2020.11.13 15:41 #21135

Maxim Dmitrievsky:

você pode tentar coisas diferentes, só para ver

aqui está um bom caderno de notas https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

você pode copiar e verificar.

Então este é o original do artigo que eu estava a ver em russo.

Aleksey Vyazmikin 2020.11.13 15:42 #21136

Maxim Dmitrievsky:

é copyedit, eu dei-te um link para o original.

Mas qual é a utilidade - não há informação de qualquer maneira - o código foi arrancado.

Maxim Dmitrievsky 2020.11.13 15:47 #21137

Aleksey Vyazmikin:

Qual é a utilidade - ainda não há informação - o código é arrancado.

Está tudo perfeitamente escrito aí. Eu não tenho aulas de desequilíbrio, mas estava a fazê-las artificialmente, só para olhar para

Aleksey Vyazmikin 2020.11.13 16:04 #21138

Maxim Dmitrievsky:

está tudo perfeitamente escrito aí. Eu não tenho classes desequilibradas, mas eu as fiz artificialmente, só para olhar para

Descobri que o método "Tomek links" simplesmente não iguala a amostra - reduziu o número de linhas nulas de 4005 para 3402, então eu pensei que não funcionava.

Maxim Dmitrievsky 2020.11.13 16:31 #21139

Aleksey Vyazmikin:

Descobri que o método "Tomek links" simplesmente não iguala a amostra - reduziu o número de linhas nulas de 4005 para 3402, por isso pensei que não funcionava.

Uh-huh. Você tem que fazer a sobreamostragem primeiro, depois o tomo

Aleksey Vyazmikin 2020.11.13 18:29 #21140

Maxim Dmitrievsky:
Uh-huh. Primeiro, você deve fazer uma amostragem a mais, depois o volume.

Até agora a amostragem excessiva não dá nada, mas "tomar" tem melhorado um pouco os resultados - significa que há algo nos dados, o principal é cavar corretamente.

Histograma de modelos com diferentes configurações de quantização sobre a amostra.

Comprar a plataforma MetaTrader ECN e provedores de Assistente MQL5, desenvolvimento de

Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2114