Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1778

 
Dmitry:

E a capacidade de prever é determinada por como?

Bem, não por correlação...

talvez por correlação cruzada através da estimativa do atraso...

Dimitri:

Empurrando tudo no mundo para dentro do modelo?

Porque não? Na formação, a validação cruzada vai eliminar o que não é necessário, ou algumas estatísticas...

Como você sabe "o que é o quê"? Como você sabe "o que é o quê" até que você verifique?

 
Aleksey Vyazmikin:

Você ainda não disse como negociar - então eu não sei que tipo de TS inventar.

Como? É óbvio)) ZZ para cima significa comprar, para baixo significa vender.

Você previria a direção ZZ, não é verdade?

 
mytarmailS:

não por correlação...

talvez por correlação cruzada através da estimativa do atraso...

Porque não? A validação cruzada vai eliminar o que não é necessário no treino, ou algumas estatísticas...

Como você sabe "o que é o quê"? até o testares?

Bem, eu falaria longamente sobre o problema da redundância, especialmente relevante para a NS, mas eu sou preguiçoso.

A propósito, é este problema que muitas vezes se torna a causa da fraca capacidade preditiva do modelo

 
mytarmailS:

Como? É óbvio)) ZZ para cima é uma compra, para baixo é uma venda.

Estás a prever a direcção da ZZ, não estás?

Isso seria um contratempo, provavelmente.

Você já tentou calcular a média/alivar o indicador de classificação com a janela para eliminar outliers?

 
Aleksey Vyazmikin:

Isto vai acabar por ser um contratempo, provavelmente.

Você já tentou calcular a média/alivar o indicador de classificação com a janela para eliminar outliers?

Neste caso, a média é igual ao atraso. Você precisa melhorar a qualidade da classificação, o alisamento não é uma opção.

Tente como está!

Dmitriy:

Bem, eu falaria longamente sobre o problema da redundância, especialmente relevante para a NS, mas eu sou preguiçoso.

A propósito, este mesmo problema é frequentemente a causa da fraca capacidade de previsão do modelo.

É por isso que eu acho que nesta direção, os sinais já podem ser treinados pela AMO ou regras de trabalho, esses sinais devem ser qualitativos, informações compactadas e minha mini experiência na página anterior provou isso.

Eu ainda não entendo como prever a correlação (não sei).

 
mytarmailS:


E como prever por correlação eu ainda não entendo(

Previsão de novo....

O coeficiente de correlação ajuda a identificar antecipadamente os preditores mais significativos - quanto maior a correlação entre a variável dependente e o preditor, mais significativa essa variável é para o modelo.

Portanto, no seu exemplo, há dois caminhos a seguir. O primeiro, o seu é substituir um preditor de cada vez no modelo e ver o quanto a precisão da previsão melhora. Isso é muito tempo.

O segundo, use o coeficiente de correlação para selecionar antecipadamente preditores sem importância que façam ruído no modelo.


O simples problema da redundância é que você pode adicionar 100+1 novos preditores ao modelo, mas 100 preditores adicionarão 0,01% à qualidade da previsão, enquanto 1 adicionará 10%. E não vale a pena sobrecarregar o modelo com aqueles 100 novos preditores - sobreajustar

 
mytarmailS:


E a propósito, num grande número de preditores, a árvore é uma porcaria, regras florestais aleatórias.

 
Dmitry:

Previsão de novo....

O coeficiente de correlação ajuda a identificar antecipadamente os preditores mais significativos - quanto maior a correlação entre a variável dependente e o preditor, mais significativa essa variável é para o modelo.

Portanto, no seu exemplo, há dois caminhos a seguir. O primeiro, o seu é substituir um preditor de cada vez no modelo e ver o quanto a precisão da previsão melhora. Isso é muito tempo.

Em segundo lugar, use o coeficiente de correlação para selecionar antecipadamente os preditores sem importância que ruídos aumentam o modelo.

Bem, a correlação é apenas uma das opções de peneirar e definitivamente não é a melhor... Você também pode usar cointegração, correlação cruzada, correlação não linear, etc. e será ainda melhor, mas todos eles são hierarquicamente inferiores ao simples erro de classificação, por isso eu escolhi critérios de erro de previsão de uma característica

Dimitri:

E a propósito, num grande número de preditores, a árvore é uma porcaria, regras florestais aleatórias.

Eu concordo parcialmente, mas em termos mais amplos a floresta é a mesma regra, a única diferença é a complexidade.

Há um pacote em R que pode comprimir uma floresta de 200 árvores em uma ou três regras, removendo todas as desnecessárias e supérfluas, a perda de qualidade da classificação é de 0,5-2%, esta é uma compressão de informação para a qual devemos nos esforçar + interpretabilidade

 
mytarmailS:

Neste caso, a média é igual ao retardamento. Você precisa melhorar a qualidade da classificação, o alisamento não é uma opção.

Tente como está!

Não é uma opção. Há demasiada interferência no apartamento.

Naturalmente, você pode mudar o limite de ativação 0,65 - comprar, 0,35 - vender.


 
Aleksey Vyazmikin:

Isso não é uma opção. Há muita coisa a acumular no apartamento.

Você poderia, é claro, mudar o limite de ativação para 0,65 - comprar, e 0,35 - vender.

Mostre-me um gráfico com as profissões