Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1777

 

Eu ouvi uma idéia inteligente em algum lugar, algo como - se houver sinais com pelo menos algum significado estatístico, mesmo o mais mínimo, ao combiná-los você pode obter uma precisão próxima de 100%.

Eu decidi verificar...

Eu fiz uma data sintética com um alvo binário, e para cada valor do alvo liguei um chip com alguma probabilidade de acerto.

Fiz 10 destes chips com probabilidades de 51:49 para um alvo e 49:51 para outro.

Eu treinei a floresta.

obtidos com novos dados.

 Accuracy : 0.5145   

não são 10 características, mas 100

 Accuracy : 0.534 

Consegui-o com 1000 sinais.

Accuracy : 0.558 

Então a conclusão é: precisamos melhorar a qualidade dos atributos, não podemos ir longe com a quantidade...

Vamos tentar aumentar a probabilidade, digamos, por volta das 55:45.

10 características dão

Accuracy : 0.6055 

100 traços dão

Accuracy : 0.7985    

vamos tentar outro aumento na probabilidade de 60:40

10 características

Accuracy : 0.729 

100 sinais

 Accuracy : 0.968 


Então, acontece que para viver em Sochi em cada vela você tem que ter 100 regras/características/AMO que dão 60% de respostas corretas... e ainda têm de ser diferentes ao mesmo tempo... Será que é possível fazer isso?

 
mytarmailS:

Eu ouvi uma idéia inteligente em algum lugar, algo como - se houver sinais com pelo menos algum significado estatístico, mesmo o mais mínimo, ao combiná-los você pode obter uma precisão próxima de 100%.

Eu decidi verificar...


Correlação do EURCAD nos dados diários com os pares:

AUDCHF CADCHF CHFJPY EURCHF
EURCAD -0.22 -0.33 -0.39 0.37


Coeficiente de determinação daregressão linear mais simples EURCAD = a*AUDCHF + b*CADCHF + c*CHFJPY + d*EURCHF + k

R^2 = 0.99622555

 
Dimitri:

Correlação EURCAD em dados diários com pares

A correlação não é uma previsão, mas sim uma medida. Ou será que não estou a perceber?

 
mytarmailS:

A correlação não é uma previsão, mas uma medida. Ou será que não estou a perceber?

A correlação mostra a significância estatística de cada variável - ela é baixa.

Juntos eles formam um modelo que explica a dinâmica da variável dependente em 99,6%.

 
Dimitri:

A correlação mostra a significância estatística de cada variável - ela é baixa.

Juntos eles formam um modelo que explica a dinâmica da variável dependente em 99,6%.

bem sim, mas explica não prevê, a correlação é simplesmente uma medida da relação entre as variáveis, qual é a conclusão do seu pensamento? eu ainda não entendi (

se você procurar por correlação cruzada entre pares
 
mytarmailS:

Bem, sim, mas explica não prevê, a correlação é simplesmente uma medida da relação entre as variáveis, qual é a conclusão do seu pensamento? Eu não entendo (

"Já ouvi essa idéia inteligente em algum lugar, algo como - se houver sinaiscom algum significado estatístico, mesmo o mais baixo, ligando-os entre si pode produzir precisão próxima de 100%" (c)

A correlação mostra a significância estatística das variáveis independentes para prever o dependente em um modelo de regressão linear.

 
Dimitri:

"Já ouvi esta ideia inteligente algures, algo como - se houver sinais com algum significado estatístico, mesmo o mais baixo, junte-os e pode obter uma precisão próxima dos 100%" (c)

Referia-me a características que podem prever de alguma forma, e não apenas uma correlação.

 
mytarmailS:

Traços que podem prever de alguma forma, não apenas a correlação

E a capacidade de prever é determinada por como?

 
mytarmailS:

Eu quis dizer atributos que são de alguma forma preditivos, não apenas correlacionais.

Existe uma variável dependente e um conjunto de possíveis variáveis independentes.

Como é definida a "capacidade de previsão"?

Empurrando tudo no mundo para dentro do modelo?

 
mytarmailS:

Bem... Bonito e plausível. Eu gostaria de ver o equilíbrio do comércio em si e um gráfico com entradas.

Nunca me disseste como negociar - por isso não sei que tipo de TS devo inventar.

mytarmailS:

Presumo que este seja um conjunto de 10 modelos? Como é que os modelos diferem uns dos outros?

Não, são apenas 10 modelos para ver o spread, a única diferença é a semente, ou seja, o valor aleatório para começar a aprender (usado para estimar os splits e selecioná-los).