Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1302

 
Maxim Dmitrievsky:

A coisa que mais me agrada é o grande número de "preditores". De onde teria vindo nas citações em primeiro lugar? É 90% de lixo.

Cada um descreve sua ilusão de maneiras diferentes, e a ilusão de quem tem muito dinheiro no momento funciona. É por isso que realmente, pode haver muitos preditores, não vejo nenhuma contradição aqui, é como arbustos compostos de galhos e folhas, mas alguém pode apará-los com diferentes figuras intrincadas que causam diferentes reacções dos contempladores.

 
Aleksey Vyazmikin:

Cada um descreve sua ilusão de maneiras diferentes, e a ilusão de quem tem muito dinheiro no momento funciona. Portanto, realmente, pode haver muitos preditores, não vejo aqui nenhuma contradição, é como arbustos constituídos por ramos e folhas, mas alguém vem à mente para apará-los a diferentes figuras intrincadas, causando uma reação diferente dos contempladores.

Bem, para cada um deles, estou lutando com tanto escrúpulo, de qualquer forma, o ajuste como está, a coisa principal que funcionaria por um tempo.

Acontece que se você encontrar uma combinação ótima de entradas/saídas então 4 preditores são suficientes

em suma, é necessário um compromisso entre eficiência e tempo

 
Maxim Dmitrievsky:

Seja qual for a forma como cavar, encontrará "padrões" ilusórios em todo o lado, que podem ser encontrados em qualquer fenómeno.

O que me deixa mais feliz é o grande número de "palpiteiros". De onde vem nas citações? É 90% de lixo.

Exactamente, é uma porcaria. E cada indicador tomado separadamente dá aproximadamente 50/50, e, além disso, tem uma faixa de operação muito estreita - naqueles lugares onde suas leituras realmente fazem sentido.

Mas, considerados em conjunto... Eles já limitam a área de aplicabilidade de outros indicadores, definindo alguma área do espaço N-dimensional, na qual as suas leituras conjuntas fazem sentido. Acho que se chama uma palavra da moda - sinergia.)

A meu ver, são necessários 7-8 indicadores-previsores para que funcione. O único problema é que eles não devem medir a mesma coisa).

 
Maxim Dmitrievsky:

Bem, depende de cada um, estou preocupado com tal escrupulosidade, em todo o caso, o principal é que funciona durante algum tempo.

acontece que se você encontrar uma combinação ótima de entradas/saídas, mesmo 4 preditores são suficientes

em suma, é necessário um compromisso entre eficiência e consumo de tempo

É essa a questão, o principal é fazer com que funcione...

E no entanto, ao que parece:

1. O modelo grande vai treinar demais por causa do efeito de memória.

2. Quanto melhor a regra (folha/árvore binária) trabalhou na história, menos chances tem na produção

Caso contrário, você obterá um gráfico com alta precisão e alto retorno sobre a história.

e na amostra de exame (disponível no gráfico) apenas para o lucro do ano 1000 (e o levantamento de fundos é aproximadamente o mesmo), e a precisão cai para 58%.

Os testes foram feitos com ativação dividida 1/0 em "probabilidade" 0,6 e com probabilidade 0,5 o lucro está em torno de 5000 no período fora de estudo, mas no período de teste em torno de 57 e o gráfico anda mais, tem menos precisão.

Significa que uma boa leitura extra no período de treinamento é a garantia de reciclagem?

 
Aleksey Vyazmikin:

mas no período de teste na região de 57

Isto significa que uma boa leitura extra sobre o período de treinamento é garantia de sobretreinamento?

A precisão de 57% no teste é muito boa, mesmo muito boa, mas sim, quanto mais diferença entre os resultados no fio e no teste, maior é a probabilidade de sobreajustamento.

 
O Graal:

A precisão de 57% no teste é muito boa, mesmo boa demais, mas sim, quanto mais diferentes forem os resultados no fogo e no teste, maior a probabilidade de se encher demais.

Presumo que o futuro é incerto e ninguém me pode dizer que te vais sair bem numa amostra fora do treino... é por isso que estou à procura de algum tipo de ligação.

E quanto à precisão (não é Precisão, porque não leva em conta as entradas perdidas, aquelas que são classificadas como 0 quando deveriam ter sido 1), não é tão simples assim, porque o lucro não é igual a perda - pode ser maior lucro e pode ser o contrário. Acontece que sim, o modelo parece funcionar, mas não traz lucro.

 
Aleksey Vyazmikin:

É essa a questão, o principal é fazer com que funcione...

E, no entanto, até agora, acontece que:

1. O modelo grande vai treinar demais por causa do efeito de memória.

2. Quanto melhor a regra (folha/árvore binária) trabalhou na história, menos chances tem na produção

Caso contrário, você obterá um gráfico com alta precisão e alto retorno sobre a história.

e na amostra de exame (disponível no gráfico) apenas para o lucro do ano 1000 (e o levantamento de fundos é aproximadamente o mesmo), e a precisão cai para 58%.

Os testes foram feitos com ativação dividida 1/0 em "probabilidade" 0,6, e com probabilidade 0,5 o lucro está em torno de 5000 no período fora do estudo, mas o período de teste está em torno de 57 e o gráfico anda mais, tem menos precisão.

Isso significa que uma leitura super boa sobre o período de treinamento é garantia de supertreinamento?

Como regra, sim.

quanto mais sinais, mais sobretreinamento
 
Graal:

A precisão de 57% no teste é muito boa, mesmo muito boa, e por isso sim, quanto mais a diferença entre os resultados no fogo e no teste, maior a probabilidade de sobreajustamento.

algumas pessoas pensam que o Random também é bom, enlouquece )) Random+7% nerendom é mau, mas é melhor que o Random

não, não é mau, é nojento, não é nada de modelo.

todos aprendem o básico da aprendizagem de máquinas e terver urgentemente

Especialmente se o gro groove gráfico subir a 57%, então você pode imediatamente olhar para ele como sobretreinamento, a priori, e não analisar mais nada
 
Maxim Dmitrievsky:

algumas pessoas pensam que os randoms também são bons, enlouquecem )) randoms+7% nerandom é mau, mas é um pouco melhor que os randoms

não é mau... é nojento, não é um modelo.

todos aprendem o básico da aprendizagem de máquinas e terver urgentemente.

Qual é a precisão dos seus modelos, neste momento, fora do treino? E com que período, como é que isso cai (muda)?

Eu tenho um período fora do treino de 10 meses.

 
Aleksey Vyazmikin:

Qual é a precisão dos seus modelos agora além da aprendizagem? E com que período de tempo, como é que este número cai (muda)?

Eu tenho um período de 10 meses sem treino.

10% de erro por teste e traço para ~10k exemplos, aumenta suavemente com o aumento

Neste erro, os modelos começaram a trabalhar em novos dados

é diferente na validação, eu preciso tentar descobrir as opções

Não revelando mais algoritmos, apenas comunicando