Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 111

 
Mihail Marchukajtes:
E você continua a tentar refrear o mercado de minutos em 5 anos?????? Estas 71 observações, duas semanas de negociação em 5 minutos se algo...... E só compra. Então vá em frente..... Ou você está deflacionado?
De que está ele a falar... Isso é uma loucura.
 
Dr.Trader:

Como eu disse antes, esta métrica é inútil.

Os dados são divididos aleatoriamente em 2 partes aproximadamente iguais, depois o modelo é treinado apenas na primeira parte, e testado em ambas de uma só vez. Uma generalizabilidade de ~75% significa que o modelo no final prevê corretamente 75% de todos os exemplos no arquivo.
Há várias maneiras de o modelo chegar a 75%:
1) O modelo é treinado com 100% de precisão nos dados de treinamento e falha nos novos dados na segunda parte do arquivo, onde recebe 50% (o mesmo que atirar uma moeda ao ar). A média seria exactamente 75%. Este é um desenvolvimento muito ruim e será ruim no comércio.
2) O modelo foi treinado com precisão de 75% nos dados de treinamento e mostrou os mesmos 75% nos dados de teste, que é novamente 75% em média. Nesta situação, este é o melhor cenário, há uma chance de ganhar alguma coisa.
3) Qualquer opção intermédia entre estes dois.

A sua opção está provavelmente mais próxima da primeira. Você precisa ter muita sorte para negociar com tais resultados, eu presumo que você não tenha perdido seu depósito apenas graças ao indicador, que serve como o sinal principal (seqüente, ou o que quer que seja). Eu acho que um Expert Advisor baseado neste indicador dará um resultado tão bom quanto o indicador + jPrediction.

Como você sabe como calcular o poder de generalização? Reshetov sabe disso, acho que o cálculo é baseado apenas em dados de teste, como ele disse antes...... Se as sequências clássicas fossem viáveis, eu não usaria o preditor, mas, infelizmente... é tão drenante como tudo. A adição do classificador, por outro lado, melhora-o bastante. Mais uma vez vou escrever que 71 observações é o trabalho do TS durante uma quinzena em 5 minutos. Este é um intervalo bastante aceitável para este período de tempo. Não estou habituado a fazer isto durante meio ano ou mais. Treinei durante 2 semanas, ganhei um dia e já estava feito, enquanto você ainda está procurando o graal. E sim, eu treino modelos todos os dias. Pela manhã. O bom é que o tempo de optimização é agora MUITO razoável.....
 
mytarmailS:
De que está ele a falar... Isso é um monte de tretas.
Bem, o que é que não entendes15 Ou está para além da sua compreensão????
 
Mihail Marchukajtes:
Bem, o que é que não entendes15 Ou está para além da sua compreensão????

Pergunto-te como medes a capacidade total e falas-me de anos de história e outros disparates...

Eu não posso medir a capacidade geral de uma maneira e você não pode medir de outra, mas você não tem idéia de como medir, tudo que você pode fazer é procurar os números nojPrediction sem a mínima idéia de onde e como eles vêm, então quando eles começam a fazer perguntas específicas você começa a falar bobagens sobre anos de história, etc. Pare com isso... Por favor...

 
mytarmailS:

Pergunto-te como medes a capacidade total e falas-me de anos de história e outros disparates...

Eu não posso medir a capacidade geral de uma maneira e você não pode medir de outra, mas você não tem idéia de como medir, tudo o que você pode fazer é procurar os números nojPrediction sem a mínima idéia de onde e como eles vêm, então quando eles fazem perguntas específicas você começa a falar bobagens sobre anos de história, etc. Pare com isso... por favor...

Talvez eu já tenha explicado que uso o preditor Reshetov, como ele mede a generalidade, estas são perguntas para o Yury. Pergunta-lhe. Embora ele tenha dado as fórmulas e eu me lembre delas em termos gerais, mas não entendo porque me pergunta. Eu sou apenas um utilizador do seu programa e não mais.....
 
Mihail Marchukajtes:
Acho que o cálculo é baseado apenas em dados de teste

Se for esse o caso, fico contente, é muito melhor.

Em qualquer caso, o fronttest mostra resultados muito melhores. Eu dividi o seu arquivo em 2 partes (sem embaralhar, apenas em ordem), a primeira parte tem 50 linhas, a segunda 19. Então o jPrediction não tem acesso a exemplos do segundo arquivo, e serão dados realmente novos para o modelo.

No final do segundo arquivo JPrediction só deu uma resposta em 9 casos. Certo em 5 casos, errado em 4. A precisão é de cerca de 50%, nada de bom neste resultado.

Arquivos anexados:
 
Dr. Trader:

Se for esse o caso, fico contente, é muito melhor.

Em qualquer caso, o fronttest mostra um resultado muito melhor. Divido o seu ficheiro em 2 partes (sem embaralhar, apenas por ordem), a primeira parte tem 50 linhas, a segunda 19. Assim, o jPrediction não tem acesso a exemplos do segundo ficheiro, e serão dados realmente novos para o modelo.

No final do segundo arquivo JPrediction só deu uma resposta em 9 casos. Correcto em 5 casos, errado em 4. A precisão é de cerca de 50%, nada de bom neste resultado.

De acordo. Necessidade de trabalhar com os dados de entrada.....
 
Dr.Trader:

Se for esse o caso, fico contente, é muito melhor.

Em qualquer caso, o fronttest mostra resultados muito melhores. Dividiu seu arquivo em 2 partes (sem embaralhar, apenas em ordem), a primeira parte tem 50 linhas, a segunda 19. Então o jPrediction não tem acesso aos exemplos do segundo arquivo, e serão dados realmente novos para o modelo.

Como resultado, no segundo arquivo JPrediction só deu uma resposta em 9 casos. Correcto em 5 casos, errado em 4. A precisão é de cerca de 50%, não há nada de bom neste resultado.

19, 50, que é mais. Pegue qualquer exemplo de banco de dados com pelo menos centenas de linhas.

Para mim este software não é adequado, quanto mais não seja porque eu próprio preferiria pegar nos parâmetros e decompor os dados. Mas, como nível de entrada, acho que seria interessante.

 

Reshetov!

A minha oferta continua de pé.

 
mytarmailS:

Olá, Yuri!

Há perguntas )) sobre a busca sequencial ...

digamos que temos 10 preditores

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

o grupoverde é o grupo de preditores que mostrou a melhor capacidade de generalização exatamente para este grupo serão adicionados outros preditores N+1

o grupovermelho, é o grupo que é ligeiramente pior que o verde e não participará nos testes, todos os testes já estão focados no grupo verde

Pergunta: e se depois de todas as tentativas com outros preditores N+1, um a um, se verificar que no resultado final o grupo vermelho tem uma maior capacidade de generalização, isto também é bastante realista, ou estou a interpretar mal algo ???? Por favor, esclareça.

Se você quer obter uma resposta inequívoca sem olhar para os dados e algoritmos, é melhor você ir ao SanSanych Fomenko, porque ele com um rosto inteligente irá admoestá-lo com instruções "precisas e valiosas" sobre qualquer assunto, independentemente da sua ambiguidade.

E se você quiser uma resposta mais precisa, então faça um teste A/B, ou seja, em um caso tente prender vermelho com preto a verde, e no outro, apenas preto. Qualquer opção que obtenha a melhor generalização a partir dos resultados da experiência é a mais correcta para a sua tarefa.

A questão é que os resultados da experiência são sempre o critério da verdade.

Por exemplo, hoje eu estava testando a centralização de dados para o jPrediction. Os resultados foram sombrios ou ligeiramente melhores em amostras diferentes. Embora para a grelha de retropropagação, a centralização dá uma melhoria notória. Teve de deixar a normalização linear.

E se eu não fizesse testes A/B, mas em vez de experiência, pegasse "conhecimento pronto" de algum livrinho ou palestra sobre aprendizagem de máquinas, ou perguntasse a algum sabe-tudo, eu teria a resposta de que centrar é supostamente "melhor" do que normalizar linear. Embora a experiência demonstre que isto não é inequivocamente verdade para todos os algoritmos.

Esse é o tipo de tarte.