Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 377

 
Vladimir Perervenko:

Após a divisão em trem/teste/válido , misture o trem. Não baralhe o resto dos conjuntos.
Isto é válido para classificação por redes neurais. Além disso, para o treino de redes neurais profundas, misture cada mini-batch antes de o alimentar.

Boa sorte.


posso ter uma referência onde ler sobre mistura? Porque puramente intuitivamente não faz sentido ) assim como os preditores se correlacionam com o alvo (com isto resolvemos, quase nada)
 
Vladimir Perervenko:

Após a divisão em trem/teste/válido , misture o trem. Não baralhe o resto dos conjuntos.
Isto é válido para classificação por redes neurais. Além disso, para o treinamento profundo da rede neural, embaralhe cada minitransporte antes de alimentar a rede neural.

Boa sorte.

Encontrei um exemplo de trem de mistura e válido um com o outro na função de cálculo de conjunto do ALGLIB. Aparentemente, é um dos métodos.

Eu só embaralhei o comboio.

Erro médio no treinamento (80,0%) =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erro médio no gráfico de validação (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erro médio na área de teste (20%)=0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

O erro é o mesmo em todos os segmentos, o mesmo que quando se mistura o trem e é válido. Aparentemente, o efeito é o mesmo.

 
elibrarius:

Encontrei um exemplo de trem de mistura e válido um com o outro na função de computação de conjunto do ALGLIB. Aparentemente, é um dos métodos.

Só o comboio está baralhado.

Erro médio no treinamento (80,0%) gráfico =0,396 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erro médio no gráfico de validação (20,0%) =0,391 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,395 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6
Erro médio na secção de teste (20%) =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

O erro é o mesmo em todos os segmentos, o mesmo que quando se mistura o trem e é válido. Aparentemente, o efeito é o mesmo.


Qual é o erro no ficheiro separado destes?

 
SanSanych Fomenko:


Qual é o erro no ficheiro separado destes?

No teste que queres dizer?

Erro médio na secção de teste (20%) =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Eu ainda não fiz o enredo para o teste2. Eu só vou peneirar através do teste 1. (Talvez no futuro).

 
elibrarius:

No local do teste, queres dizer?

Erro médio na secção de teste (20%) =0,398 nLearns=2 NGrad=1208 NHess=0 NCholesky=0 codResp=6

Eu ainda não criei o enredo do teste2. Eu só vou peneirar através do teste1. (Talvez no futuro).


Fora de todas estas amostras
 
SanSanych Fomenko:

Fora de todas estas amostras
Lá fora, não há, todos os dados foram usados.
 
elibrarius:
Fora da caixa, todos os dados foram utilizados.

É possível dividir o arquivo fonte 80/20? E depois 80% de todos os seus exercícios, e depois 20% sem qualquer mistura.
 
SanSanych Fomenko:

Você pode dividir o arquivo fonte por 80/20? E depois 80% de todos os seus exercícios e depois 20% sem qualquer mistura.

Com a mistura:

Erro médio no treino (51,0%) secção =0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio na validação (13,0%) gráfico =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio na secção de teste (16,0%) =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Sem agitar

Erro médio no treinamento (51,0%) gráfico =0,516 (51,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no gráfico de validação (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,491 (49,1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Apenas 2 ciclos de reciclagem, para velocidade... já na hora de dormir)

 
elibrarius:

Com o baralhamento:

Erro médio no treinamento (51,0%) gráfico =0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio no gráfico de validação (13,0%) =0,685 (68,5%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,683 (68,3%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio na seção de teste (16,0%) =0,661 (66,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste 2 (20,0%) =0,671 (67,1%) nLearns=2 NGrad=725 NHess=0 NCholesky=0 codResp=6

Sem agitar

Erro médio no treinamento (51,0%) gráfico =0,516 (51,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no gráfico de validação (13,0%) =0,376 (37,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Planta completa (treinamento + validação):
Erro de aprendizagem médio=0,491 (49,1%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste (16,0%) =0,344 (34,4%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6
Erro médio no local de teste 2 (20,0%) =0,326 (32,6%) nLearns=2 NGrad=1063 NHess=0 NCholesky=0 codResp=6

Apenas 2 ciclos de reciclagem, para velocidade... já na hora de dormir)


O seu modelo não aprende nada - é tudo do parque de bolas. Em algum lugar ele pega em alguma coisa e depois revela-se irrelevante.

Comece com a datamining. Alvo, depois procurar por preditores relevantes para o alvo, depois determinar a capacidade preditiva dos preditores selecionados para o alvo específico, e só então o modelo


Tudo o resto é um jogo intelectual de números.

 

https://www.youtube.com/channel/UCLk-Oih8VlqF-StidijTUnw

ele tem algo para fazer no fim-de-semana :) ar para nubas

E aqui está um tipo a fazer algumas trocas algorítmicas.


Основы анализа данных
Основы анализа данных
  • www.youtube.com
Канал содержит курсы по анализу данных. Все курсы бесплатны и легки в освоении Прохожу обучение в бесплатной школе Дениса Коновалова http://superpartnerka.bi...