Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1305

 

Alteração no desempenho em função da mudança do limiar de "probabilidade" para a classificação 0/1 de 0,45 para 0,65

Essencialmente preciso

Os histogramas mostram que o aumento da precisão da classificação ocorre de forma bastante suave com uma mudança no limiar de probabilidade de classificação, o que não pode ser dito em relação aos lucros.

Acontece que não devemos apenas considerar a eficiência de classificação, mas também estimar como o lucro é distribuído entre as regras (folhas) e qual é o seu limiar de sensibilidade. Em outras palavras, não importa como você olha para isso, você tem que puxar regras individuais e dar-lhes uma estimativa.

 
elibrarius:
serra)
Há uma confusão geral sobre a terminologia.

E a validação cruzada? todos os sabbets estão envolvidos, por isso a validação é melhor do que um teste.

Seja como for, sim, tanto faz. O meu teste é a 2ª parte da subamostra, mas vou chamar-lhe validação então

 
Aleksey Vyazmikin:

Alteração no desempenho em função da mudança do limiar de "probabilidade" para a classificação 0/1 de 0,45 para 0,65

Essencialmente preciso

Os histogramas mostram que o aumento da precisão da classificação ocorre de forma bastante suave com uma mudança no limiar de probabilidade de classificação, o que não pode ser dito em relação aos lucros.

Acontece que não devemos apenas considerar a eficiência de classificação, mas também estimar como o lucro é distribuído entre as regras (folhas) e qual é o seu limiar de sensibilidade. Não importa como você o corta, você tem que puxar regras individuais e estimá-las.

Os lucros são menores a 0,65 porque há menos negócios. Por exemplo, em vez de 100, haverá 10 negociações. Você pode aumentar o lote

 
Aleksey Vyazmikin:

Alteração no desempenho em função da mudança do limiar de "probabilidade" para a classificação 0/1 de 0,45 para 0,65

Essencialmente preciso

Os histogramas mostram que o aumento da precisão da classificação ocorre de forma bastante suave com uma mudança no limiar de probabilidade de classificação, o que não pode ser dito em relação aos lucros.

Acontece que não devemos apenas considerar a eficiência da classificação, mas também estimar como os lucros são distribuídos entre as regras (folhas) e qual é o seu limiar de sensibilidade. Portanto, não importa como você gira, você tem que puxar regras individuais e dar-lhes uma estimativa.

Aumentar o limiar, quando o modelo se deteriora, haverá cada vez menos negócios sobre os novos dados, as probabilidades irão rolar em torno de zero, é um bom momento para a reconversão

para aumentar os limiares, o erro deve ser baixo, caso contrário não haverá nenhum sinal
 
elibrarius:

Os lucros são menores a 0,65 porque também há menos negócios. Por exemplo, em vez de 100, teremos 10 negócios. podemos aumentar o tamanho do lote.

O número de negociações, e as negociações lucrativas apenas variam suavemente (uma negociação é uma negociação/2 pela lógica MT)

A perda não é estável por comércio, porque o stop loss não é fixo.

 
elibrarius:
serra)
De uma forma geral, a terminologia é confusa

Proponho a minha terminologia (por enquanto, vou mantê-la):

1. Amostra de formação - aquela em que se realiza a criação do modelo

2. amostra de teste - utilizada para controlar a qualidade do treinamento do modelo, incluindo a interrupção do treinamento

3. amostra de exame - utilizada para estimativa da qualidade do modelo, independente da formação

 
Maxim Dmitrievsky:

Aumentar o limiar, quando o modelo se deteriora haverá cada vez menos operações sobre os novos dados, as probabilidades circularão em torno de zero, este é um bom momento para a requalificação

Você precisa de um erro baixo para aumentar os limites, caso contrário não haverá nenhum sinal

Sim, isso é compreensível. São apenas sinais que desaparecem por falta de ligações de repetição nas folhas, especialmente se a sua grande parte de activação total se movia perto de 0.5 e parece 0.1+0.05+0.08+0.25+0.03 - uma das somas desistiu e é isso, não acontece activação.

 
Aleksey Vyazmikin:

Sim, é compreensível. Apenas os sinais desaparecem devido à falta de ligações de reprodução nas folhas, especialmente se a sua grande parte de activação total rodasse em torno de 0,5, e parecesse a soma de 0,1+0,05+0,08+0,25+0,03 - caiu de uma das somas e, no total, não ocorre activação.

Significa que o algoritmo não se generaliza adequadamente a novos dados, é necessário torcê-lo mais, mais ou menos - re-treinados.

 
Maxim Dmitrievsky:

10% de erro por teste e traço para ~10k exemplos, aumenta suavemente com o aumento

Neste erro, os modelos começaram a trabalhar em novos dados

na validação de forma diferente, é uma questão de passar pelas opções

Eu não revelo mais algoritmos, eu apenas comunico

О! Esse é o acordo! Quase como o meu! Eu disse-lhe que não precisava de ouvir todo o tipo de cervejas e feiticeiros :)

 
Maxim Dmitrievsky:

Isso significa que o algoritmo não se generaliza bem aos novos dados, você precisa torcê-lo - distorcê-lo ainda mais ), mais ou menos - re-treinados

Por isso estou a torcer e a virar, não me quero enganar :)

Vou adicionar agora uma nova dose de preditores...