Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 419

 
Muito bem, vou atirar alguma informação para aqui. O problema é que eu tenho uma idéia de quais dados devem ser usados para prever o mercado, mas infelizmente eu não posso reuni-los na forma completa e correta, se alguém ajudasse na organização da coleção, eu compartilharia seu otimizador, bem, e a estratégia como um todo. Os dados já são suficientemente bons, mas para sermos super, precisamos de acrescentar algo. Quem é forte em programação e na capacidade de obter dados online de vários sites no arquivo csv?
 
Mihail Marchukajtes:
Está bem, vou colocar a informação aqui. Tenho alguma idéia de quais dados devem ser usados para fazer previsões de mercado, mas infelizmente não posso reunir todos eles na forma correta e completa. Se alguém me ajudou a organizar a reunião eu teria compartilhado com ele o otimizador e a estratégia em geral. Os dados já são suficientemente bons, mas para sermos super, precisamos de acrescentar algo. Quem é forte em programação e na capacidade de obter os dados online de vários sites no arquivo csv?
O meu modelo é baseado em dados multi-tarefa e diversificados. Eu tenho experiência em analisar dados. Eu ficaria feliz em participar.
 

Eu escrevi no meu blog sobre a escolha dos parâmetros da rede neural - SELECTING NEUROSET CONFIGURATION.

Pelo menos na fase inicial é melhor fazê-lo, ou seja, mais tarde, se necessário, você pode simplificar o NS.

O exemplo de escolha no blog é abstrato, mas foi a partir de considerações semelhantes que eu escolhi os parâmetros do meu NS. Os resultados de aprendizagem geralmente não são maus.

Um pouco assustador é o volume de NS - no exemplo de 3 MA, já são mais de 100 neurônios, e ainda não é um TS, mas apenas um modelo para ele.

 
Yuriy Asaulenko:

Eu escrevi no meu blog sobre a escolha dos parâmetros da rede neural - SELECTING NEUROSET CONFIGURATION.

Pelo menos na fase inicial é melhor fazê-lo, ou seja, mais tarde, se necessário, você pode simplificar o NS.

O exemplo de escolha no blog é abstrato, mas foi a partir de considerações semelhantes que eu escolhi os parâmetros do meu NS. Os resultados de aprendizagem geralmente não são maus.

Um pouco receoso do volume de NS - no exemplo de 3 MA, já são mais de 100 neurónios, e ainda não é um TS, mas apenas um modelo para ele.

Vamos tentar desta forma - no fim-de-semana ou na próxima semana vou lançar aqui preditores interessantes, e tu dizes-me a tua opinião sobre eles. Apenas preditores sob a forma de indicadores em MT5, 4 deles

Vou tentar usá-los como preditores no comércio, e terei a oportunidade de organizar um Desafio - que será capaz de ensinar NS a ganhar com esses preditores :) Ainda não os aprendi, mas não experimentei até agora.

 
Maxim Dmitrievsky:

Vamos tentar desta forma - no fim-de-semana ou na próxima semana vou colocar aqui preditores interessantes e tu vais dar a tua opinião sobre eles...? Apenas preditores na forma de indicadores em mt5, 4 deles

Será possível organizar um Desafio - que será capaz de ensinar NS a ganhar por estes preditores :) Mas, por enquanto, não posso ensinar o deputado a negociar lucrativamente usando-os.

(Bem, eu ainda tenho um longo caminho a percorrer antes de começar a negociar a sério). Já o faço há mais de um mês.

Se eu quiser usar seus indicadores, será interessante, mas não vou usar os meus. Entretanto, a base (a versão inicial de 2008) está disponível aqui -ButterworthMoving Average - indicador para o MetaTrader 4. É claro que agora tudo foi feito de forma diferente.

 
Yuriy Asaulenko:

Bem, eu ainda tenho um longo caminho a percorrer antes de poder realmente trocar). Já o faço há mais de um mês.

Se você tiver um bom Conselheiro Especialista, será útil para mim. Entretanto, a base (a versão inicial de 2008) pode ser encontrada aqui -ButterworthMoving Average - indicador para o MetaTrader 4. Claro, agora tudo é diferente.


Sim, eu vou fazer isso, só porque às vezes meu cérebro se transforma em um tubo e eu preciso de uma opinião externa :)
 

Não quero perturbar ninguém, mas, infelizmente, a maioria de vocês não sabe como preparar bem os alvos. Todos aqueles resultados inspiradores (75-80% de precisão) em fichas de velas lentas (>10min) são, na realidade, puro suadouro. A precisão de 55% é suficiente para fazer Sharpe Ratio maior que 2, e 60% de precisão em dados lentos é o mesmo graal, que é a lenda, Sharpe Ratio 3-4, ninguém negocia assim em reais, só os caras do HFT, mas eles têm uma escala diferente de custos de negociação, há menos SR <2 não é rentável.

Em resumo...

NÃO VER O META(alvo)!

Em outras palavras, ao calcular o alvo, você não pode usar os dados que são HOWEVER usados no cálculo das características, caso contrário, o resultado será um poky. Por razões óbvias, um "truque de mão" como o ZZ para o inferno, interpola entre extremos em área onde as características são calculadas, o resultado é exorbitante, pelo menos 90% de precisão sem problemas, mas é uma falsificação. Esta é a base para discussões obscurantistas sobre "a previsão não é importante", ainda se deve desenvolver o TS, etc. Então, na verdade, estes "90%" ainda são os mesmos 50% "amados".


Seja razoável :)

 
Aliosha:


Em resumo...

NÃO VER o alvo(características)!

Em outras palavras, ao calcular o alvo, você não pode usar dados que são TUDO utilizados no cálculo das características, caso contrário, o resultado será uma varredura. Por razões óbvias, um "truque de mão" como o ZZ para o inferno, interpola entre extremos em área onde as características são calculadas, o resultado é exorbitante, pelo menos 90% de precisão sem problemas, mas é uma falsificação. Esta é a base para discussões obscurantistas sobre "a previsão não é importante", ainda se deve desenvolver o TS, etc. Então, na verdade, estes "90%" ainda são os mesmos 50% "amados".


Seja razoável :)

Não posso concordar com as suas conclusões sobre ZZ, assim como com as suas conclusões em geral.

O RSI, por exemplo. O que interpola ZZ ou vice-versa para este preditor em particular. Entretanto eu posso mostrar que o RSI como um preditor para ZZ não tem uma má capacidade de previsão. E, por exemplo, a ondulação não tem capacidade de previsão para ZZ e é 100% ruído para ZZ - completamente inútil como um preditor. Você pode obter um modelo baseado em mashka com menos de 10% de erro, mas se você executar esse modelo treinado em um novo arquivo não associado a um arquivo de treinamento, você receberá um erro arbitrário.

Além do problema que você mencionou que existem preditores entre os preditores para uma RZ que essa mesma RZ deriva, existe outro problema que é fundamental e independente da variável alvo: é o problema que o preditor NÃO está relacionado com a variável alvo é o ruído para uma determinada variável alvo (RZ não é exceção). O ruído é um preditor muito conveniente. É sempre possível encontrar valores entre os valores de ruído que irão reduzir o erro de previsão. Quando eu não entendi isso, eu tive um erro de previsão em torno de 5% com muita freqüência.

Mas se alguém for capaz de limpar o conjunto inicial de preditores do ruído para uma determinada variável alvo, então é extremamente difícil reduzir o erro abaixo de 30%, pelo menos para mim.

Conclusão: Os preditores de ruído que são ruído para uma determinada variável-alvo levam ao excesso de formação e ZZ não é excepção.

 
SanSanych Fomenko:

Não posso concordar com as suas conclusões sobre ZZ, nem com as suas conclusões em geral.

O RSI, por exemplo. O que interpola ZZ ou vice-versa para este preditor em particular. Entretanto eu posso mostrar que o RSI como um preditor para ZZ não tem uma má capacidade de previsão. E, por exemplo, a ondulação não tem capacidade de previsão para ZZ e é 100% ruído para ZZ - completamente inútil como um preditor. Você pode obter um modelo baseado em mashka com menos de 10% de erro, mas se você executar esse modelo treinado em um novo arquivo que não está associado a um arquivo de treinamento, você receberá um erro arbitrário.

Além do problema que você mencionou que existem preditores entre os preditores para uma RZ que essa mesma RZ deriva, existe outro problema que é fundamental e independente da variável alvo: é o problema que o preditor NÃO está relacionado com a variável alvo é o ruído para uma determinada variável alvo (RZ não é exceção). O ruído é um preditor muito conveniente. É sempre possível encontrar valores entre os valores de ruído que irão reduzir o erro de previsão. Quando eu não entendi isso, eu tive um erro de previsão em torno de 5% com muita freqüência.

Mas se alguém for capaz de limpar o conjunto inicial de preditores do ruído para uma determinada variável alvo, então é extremamente difícil reduzir o erro abaixo de 30%, pelo menos para mim.

Conclusão: o sobretreinamento é causado por preditores de ruído que são ruído para uma determinada variável alvo e ZZ não é exceção.


Muito bem! Vamos fazer um debate sobre este tópico extremamente importante. Sugiro que façamos uma série de experiências para chegarmos ao fundo disto.

Então, eu discuto:

1) Correto, síntese e classificação de um feixe de séries temporais aleatórias, em 2 classes, dá 50% de precisão (como uma moeda), com amostras suficientes (de 5-10k). Se houver um viés de precisão estatisticamente significativo(>51%) então há erros no processo de síntese e/ou classificação de características.

2) Quando usamos alvos que usam dados usados no cálculo de características, obtemos um viés significativo de precisão (55, 60, 90%) SOBRE TEMPOS RANDOM que, a priori, não podem ser previstos (50%). O que significa que este luto é falso.

 
Aliosha:


2) Quando usamos os dados de alvos usados no cálculo dos traços, obtemos um viés significativo de precisão(55, 60, 90%) sobre os TEMPOS RANDOM que não podem ser previstos a priori(50%). O que significa que este medidor é falso.

E porquê verificar alguma coisa? Para mim é óbvio.

Eu dei um exemplo de RSI-ZZ - nada em comum, e você pode construir um modelo com menos de 50% de erro.

Outro exemplo: mashka-ZZ - erro facilmente inferior a 10%. Quando testado em um novo arquivo, um resultado completamente arbitrário.