Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 453

 

O tópico caiu em adivinhação de borras de café - pelo menos eles trouxeram uma ciência chamada astrologia.


Porquê incomodar-se com disparates e culpar tudo na entrada do modelo? Tem sido discutido durante quase cem páginas que você só deve pegar aqueles preditores que afetam a variável alvo. Eu sempre faço datamining e nunca tenho modelos com mais de 40% de erro. É verdade, os modelos com menos de 30% de erro são difíceis de encontrar. Mas eu nunca tenho um ultraje tão grande como 50%.

 
SanSanych Fomenko:

O tópico caiu em adivinhação de borras de café - pelo menos eles trouxeram uma ciência chamada astrologia.


Porquê incomodar-se com disparates e culpar tudo na entrada do modelo? Tem sido discutido durante quase cem páginas que você só deve pegar aqueles preditores que afetam a variável alvo. Eu sempre faço datamining e nunca tenho modelos com mais de 40% de erro. É verdade, os modelos com menos de 30% de erro são difíceis de encontrar. Mas eu nunca tenho um ultraje tão grande como 50%.

Porque você tem "mistura de cavalos pessoas, características, mira, ZZ ...", enquanto prevê a cor do castiçal ou retorno, em tais freqüências (>5min), teria mais ou menos o mesmo.

 
Dr. Trader:

Experiência. Que tal tomar diferentes gbpusd, usdchf, usdrub e outros símbolos populares e usá-los para prever o eurusd.

Aqui estão duas mesas em atache, train.csv e teste.csv, neles o alvo é o crescimento eurusd m5 para a próxima barra, e os preditores são audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], etc. Existem 12 símbolos no total, os incrementos das 3 barras anteriores da história são retirados de cada um deles. Em geral, tudo é claro pelo nome de colunas.
A mesa de treino tem 10000 filas, ou seja, cerca de 7 semanas.

Eu tentei treinar um modelo e obtive r^2 = 0,0006164161 nos dados do treinamento, e se arredondarmos o alvo e os resultados para as classes -1 e 1, a precisão é de 0,5052. Isto é muito mau. Mas é simplesmente irrealista tomar dezenas de barras para cada exemplo de treino e dezenas de personagens em si, o meu modelo nestas centenas de colunas vai levar semanas a treinar.
No banco de ensaio, os resultados de validação do modelo estão em baixo, r^2 = -0,003390913 e precisão 0,4907. O aleatório foi, o aleatório é, e ainda é.

Mas é tudo aborrecido e inconclusivo.
Foi interessante quando olhei para os pesos que o modelo deu a cada preditor (quanto maior o peso, melhor):


Conclusão: tentar prever a direção do eurusd na próxima barra m5 é melhor usando antes de tudo audusd, usdrub, usdsgd

Sim, o resultado não é bom, mas é justo e o testador terá o capital próprio relevante, não o mesmo erro no forward 30% e Sharp Ratio +-0,5 que deve ser 10))))

As suas fichas não são nada boas, pelo menos para cada instrumento alguns retornados passados com janela exponencialmente crescente (1,2,5,10,30,60...) e é melhor você pegar os minutos.

 

Para ser honesto, comecei a pensar a mesma coisa sobre o Yura Reshetov há muito tempo. Uma vez ele disse: "Vou-me embora daqui". Fiquei tão surpreendido que, no início, pensei que ele podia ter entrado numa organização secreta, nunca se sabe... então o site parou de funcionar e assim por diante. Que pena se assim for, que descanse em paz ......

Na verdade, a seriedade do seu trabalho é inegável..... Mas parece-me que ele não a terminou apenas um pouco..... Acho que vou desmontar o método dele e lixá-lo... bem, vejamos 12

 
tóxico:

Porque você tem "mistura de cavalos pessoas, chips, mira, ZZ...", e se você estivesse prevendo cor de vela ou retorno, em tais frequências(>5min), você teria mais ou menos a mesma coisa.


Aqui não tenho exactamente nada misturado: o principal problema na datamining, a principal quantidade de trabalho.... E o que você tem aqui é diversão intelectual.

 
SanSanych Fomenko:

Aqui não tenho exactamente nada misturado: o principal problema na datamining, a principal quantidade de trabalho.... E você tem alguma diversão intelectual a decorrer aqui.

Eu só estou com o HFT prevê tudo em todos os nobres, eu estava expondo o conjunto de dados, e 10 min e acima não há nada lá, nos preços em si, ele precisa de outros dados, macro, notícias, etc no próprio preço zero, eficiência proverbial.

 
A outra é esta:

Meus prefixos HFT são todos muito respeitáveis, eu expus o conjunto de dados, e 10 min e acima não há nada lá, nos próprios preços, precisa de outros dados, macro, notícias, etc. no próprio preço zero, eficiência notória.

Prefiro concordar contigo. Mas e as pessoas que se abrem por sinais, como TA, e me asseguram que ganham regularmente e com prazer?

Há 2 possibilidades: 1. eles desejam pensar e é tudo apenas conversa fiada, e 2. mais de 10mins ainda há algo de valor preditivo.

 
Não tenho a certeza:

Meus predicados do HFT são todos finos e dignos, eu tenho um conjunto de dados, e 10 min e acima não há nada lá, nos próprios preços, ele precisa de outros dados, macro, notícias, etc no próprio preço zero, eficiência notória.

Você tem o HFT para negociar? Se não for segredo, claro, e "honestamente"...

 
Vizard_:

Não se assuste, há muito tempo que me rio dele e da Vova, embora Mishka os ultrapasse a todos)))
Não brilhe a luz e não discuta, deixe-os eles mesmos)))


Então... mais..... Não se consegue que ninguém fale, não se consegue que ninguém diga nada de bom.... Vejo-te apenas a rir na esquina.... De que é que tu serves?

Provavelmente, o mesmo que eu. Não.... Mas pelo menos eu sou engraçado.)

 
Vizard_:

Desculpe, Teacher))))))


Muito bem... Eu não estou zangado contigo..... Só estou curioso, sabes, puramente teoricamente..... Só por uma questão de experimentação. Vou enviar o meu conjunto de dados novamente, vai envolver 3 futuros, ou seja, quase 9 meses de dados, você vai construir um modelo e dar algum veredicto. O ideal seria rodar o seu modelo no meu computador, mas não insisto muito nisso..... Só por curiosidade....

Então, uh... Devo afixá-lo?