Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 81

 
mytarmailS:
há um ser :)

)))

Por acaso negoceia no wealthlab?

 
Alexey Burnakov:

)))

Você negocia no wealthlab?

Não, foi o tslab, eu alimento os dados do R e simulo a negociação pelo R-sinal para o tslab. É mais rápido, mais conveniente e visual do que simular negociações no R-ka, e eu preciso parar de perder, ter lucro, comissões... então é uma verdadeira dor de cabeça escrever tudo isso
 
Dr. Trader:

4) se fizer a validação cruzada em treinamento, repita várias vezes nos mesmos dados, veja quanta variação há nos resultados, escolha modelos e preditores com pequena variação

Isto é o que me vem à mente agora, mas não é o limite dos possíveis problemas.

Você ficará surpreso e definitivamente discordará de mim :) ), mas não acredito que a validação cruzada seja eficaz no mercado, pelo menos em seu uso clássico

 
mytarmailS:

Você ficará surpreso e definitivamente discordará de mim (e não só de você :) ) mas não acredito que a validação cruzada seja eficaz quando aplicada ao mercado, pelo menos na sua aplicação clássica

Porquê tão poucas árvores?
 
mytarmailS:

Você ficará surpreso e definitivamente discordará de mim (e não só de você :) ) mas não acredito que a validação cruzada seja eficaz quando aplicada ao mercado, pelo menos na sua aplicação clássica

Vamos começar com como você entende o significado da avaliação cruzada. Dá para perceber?
 
SanSanych Fomenko:
Porquê tão poucas árvores?

Eu tenho que quanto mais árvores, menos negócios o sistema faz e sua qualidade não aumenta em nada.

por exemplo, se o meu modelo faz 500 negócios com o parâmetro 10/5 então com o parâmetro 5/200 (5 splits, 200 árvores) ele faz um negócio ou nenhum negócio, então a generalização vai para baixo e o modelo está procurando situações muito claras que já aconteceram mas nunca acontecerão no futuro

 
Alexey Burnakov:
Vamos começar com a forma como entende o significado de validação cruzada. Consegue perceber?

Tenho a certeza que é o mesmo que tu.

Dividimos a parcela em 5 partes, treinamos 4 delas, verificamos a 5ª parte e passamos por todas as variantes com segmentos para que a verificação fora da amostra ocorra em todas as 5 partes da amostra e calculamos o erro médio

Isso parece ser se eu não tiver esquecido

 
mytarmailS:

Eu tenho que quanto mais árvores, menos negócios o sistema faz e sua qualidade não aumenta em nada.

por exemplo, se o meu modelo faz 500 negócios com o parâmetro 10/5 então com o parâmetro 5/200 (5 splits, 200 árvores) ele faz um negócio ou nenhum negócio, então a generalização cai e o modelo está procurando por situações muito claras que uma vez aconteceram mas nunca acontecerão no futuro

Pensamento interessante. Acontece que estás a lutar contra o excesso de treino pelo número de árvores?
 
mytarmailS:

Tenho a certeza que é o mesmo que tu.

Dividimos a parcela em 5 partes, treinamos 4 delas, verificamos a 5ª parte e passamos por todas as variantes com parcelas para que a verificação fora da amostra ocorra em todas as 5 partes da amostra e calculamos o erro médio

Parece ser isso se eu não me tiver esquecido.

Sim. Para que precisas dele? Para encontrar parâmetros ideais de aprendizagem.

O que você não gosta nesta abordagem? Como você vai selecionar os parâmetros?

 
SanSanych Fomenko:
Ideia interessante. Então acontece que pelo número de árvores que estás a lutar contra o sobretreinamento?

não realmente...

O que estou a escrever só se aplica à minha abordagem.

Sabes como faço o meu alvo, são os pivots.

tenho três classes de pivô ( 1 , -1 , 0 )

Você também sabe que o enviesamento das classes é enorme, a classe "0" é dezenas de vezes maior que "-1" e "1".

e isto significa que o modelo é melhor treinado na classe "0" porque tem mais observações e enquanto treina o modelo, quanto mais árvores, mais "0" é treinada e à medida que a classe "0" fica melhor e mais forte começa a (absorver - espremer) as classes "1" , "-1 É por isso que quanto mais árvores, menos negócios.