Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1304

 
Maxim Dmitrievsky:

10% de erro por teste e traço para ~10k exemplos, aumenta suavemente com o aumento

Neste erro, os modelos começaram a trabalhar em novos dados

na validação de forma diferente, é necessário executar através das variantes.

Algoritmos não são mais revelados, apenas comunicando

Algo suspeitosamente pequeno. Em seus artigos, mesmo em ziguezagues, Perervenko não alcançou tais resultados.

E também é suspeito que o teste e o estagiário tenham 10% cada um, mas a validação é "diferente". Ou seja, mais ou quê? O pior deve ser o teste, não a validação.

 
elibrarius:

Há algo suspeitosamente pequeno. Pererwenko não conseguiu isso nem mesmo em ziguezagues em seus artigos.

E também é suspeito que 10% cada um em teste e treinamento, e a validação é "diferente". Ou seja, é mais do que isso? O pior deve ser o teste, não a validação.

"Mesmo em ziguezague")))

o pior deve ser apenas uma validação que não tenha estado envolvida de forma alguma, mesmo indirectamente, no processo de aprendizagem
 
Maxim Dmitrievsky:

"Mesmo em ziguezague" ))))

o pior só pode ser a validação que não esteve envolvida na aprendizagem de forma alguma, mesmo indirectamente
E porque não a secção de testes? Porque "não participou de forma alguma no treinamento, mesmo indiretamente"?
 
elibrarius:
Porque não o local do teste? Afinal, ele também "não está envolvido na aprendizagem de forma alguma, nem mesmo indiretamente".

o teste está sempre indiretamente envolvido na aprendizagem, pegue o mesmo catbust... vamos lá

 

А... ou chamamos as parcelas de forma diferente.

eu chamo

1 seção do trem
2 válido - isto é o que é usado em muitos pacotes para controle no processo de aprendizagem e para parar cedo. E chama-se Válido.
3 teste - para avaliar o sistema com novos dados

Você pode ter chamado a 2ª seção de uma seção de teste.

 
Maxim Dmitrievsky:

o teste está sempre indiretamente envolvido na aprendizagem, pegar catbust... vamos lá

Catbust, não sei. Aqui está uma citação da XGBoost

early_stopping_rounds
Se NULL, a função de paragem antecipada não é activada. Se definido para um número inteiro k, o treino
com um conjunto de validação irá parar se o desempenho não melhorar para k
rodadas.

 
elibrarius:

А... ou chamamos as parcelas de forma diferente.

eu chamo

1 conjunto de dados de formação
2 válido - isto é o que muitos pacotes usam para monitorar durante o treinamento e para parar cedo. Chama-se Válido.
3 teste - para avaliar o sistema com novos dados

Vejo que chama à 2ª parte uma parte de teste.

Acho que é ao contrário, a validação é a nova

Sim, bem, já percebeste a ideia.

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

-conjunto de testes

Uma lista separada por vírgulas dos ficheiros de entrada que contêm a descrição do conjunto de dados de validação (o formato deve ser o mesmo que o utilizado no conjunto de dados de formação).

Omitido. Se este parâmetro for omitido, o conjunto de dados de validação não é utilizado.


)))) você pode escrevê-lo como quiser, é chamado

 
Maxim Dmitrievsky:

Acho que é ao contrário, a validação é a nova, onde está escrito

Sim, bem, já percebeste a ideia.

Eu não entendi no início.
Pois nós usamos termos diferentes.

Devemos cingir-nos a uma terminologia.

 
elibrarius:

No início não percebi.
Pois nós usamos termos diferentes.

Devíamos manter a mesma terminologia.

Mostre-me a documentação de qualquer pacote, onde a segunda seção (que é usada para controle de aprendizagem e/ou parada antecipada) é chamada teste, não validação.

Eu mostrei-te acima, aqui está mais

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
serra)
Em geral, confusão sobre a terminologia