Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 179

 
Dr. Trader:


Você está falando de análise de componentes PCA ou algo mais? Não me lembro de todos os exemplos que coloquei aqui :)

Se estás a falar de PCA, não podes fazer um doce com o lixo de qualquer maneira. Você tem que ter bons preditores misturados com maus, então o PCA pode tirar os maus dos bons.

Você subestima os resultados positivos da sua experiência. Não há grãos. Mas existe uma ferramenta abrangente para combater males como o sobretreinamento.

O primeiro passo é remover o lixo - que é o que tem um impacto decisivo no sobretreinamento. E, neste primeiro passo, o PCA é muito útil. Após esta etapa, os preditores relevantes para a variável alvo permanecerão, e toda a fantasia desaparecerá. Mas não superestime a importância deste passo - é o primeiro passo. Depois disso, os próximos passos são necessários:

  • rfe antes de cada treinamento
  • reciclagem do modelo em cada novo bar (idealmente) ou nos fins de semana.

E as suas experiências com o rfa vão revelar-se extremamente úteis.

PS.

Note que eu me mantive deliberadamente em silêncio sobre trabalhar com os próprios modelos.

 
SanSanych Fomenko:

Você subestima os resultados positivos da sua experiência. Não há grãos. Existe uma ferramenta abrangente para combater o flagelo do sobretreinamento.

O primeiro passo é eliminar o lixo - que é o que tem um impacto decisivo na reconversão profissional. E, neste primeiro passo, o PCA é muito útil. Após esta etapa, os preditores relevantes para a variável alvo permanecerão, e toda a fantasia desaparecerá. Mas não superestime a importância deste passo - é o primeiro passo. Depois disso, os próximos passos são necessários:

  • rfe antes de cada treinamento
  • reciclagem do modelo em cada novo bar (idealmente) ou nos fins de semana.

E as suas experiências com o rfa vão revelar-se extremamente úteis.

PS.

Note que me mantive deliberadamente em silêncio sobre o trabalho com os próprios modelos.

Você pode explicar mais sobre a PCA? Como é que se elimina o lixo desta maneira?
 
SanSanych Fomenko:

Você subestima os resultados positivos da sua experiência. Não há grãos. Existe uma ferramenta abrangente para combater o flagelo do sobretreinamento.

O primeiro passo é eliminar o lixo - que é o que tem um impacto decisivo na reconversão profissional. E, neste primeiro passo, o PCA é muito útil. Após esta etapa, os preditores relevantes para a variável alvo permanecerão, e toda a fantasia desaparecerá. Mas não superestime a importância deste passo - é o primeiro passo. Depois disso, os próximos passos são necessários:

  • rfe antes de cada treinamento
  • reciclagem do modelo em cada novo bar (idealmente) ou nos fins de semana.

E as suas experiências com o rfa vão revelar-se extremamente úteis.

PS.

Note que me mantive deliberadamente em silêncio sobre o trabalho com os próprios modelos.

Retraining the model on each bar.... Isto significa que uma única barra tem impacto em todo o modelo? À luz da importância de cada barra na aprendizagem, a sua luta interminável com a reciclagem torna-se compreensível...
 
Andrey Dik:
Retraining the model on every bar.... Isso significa que uma única barra afecta o modelo inteiro? Devido à importância de cada barra no treino, deixa claro a sua luta interminável com a reciclagem...

O modelo que estou a tentar actualizar agora - estou, sim, estou a aprender mais em cada novo bar. Para ser honesto, não vejo um grande impacto... Por vezes, para dezenas de barras seguidas, o modelo permanece o mesmo de antes (o mecanismo de protecção contra a sobreposição do modelo). Mas se algum banqueiro disser algo errado nas notícias, e o preço correr mal em algum lugar - há a esperança de que o modelo alcance todas as mudanças recentes dentro de um par de bares. Não faz muito sentido adaptar o modelo a cada barra, mas se existe uma maneira de reagir rapidamente às mudanças - é uma pena não usá-lo.

Mihail Marchukajtes:
Você pode explicar mais sobre a PCA? Como se elimina o lixo de tal maneira?

Cerca de cem páginas atrás, Sannych postou um link para o artigo "Análise de componentes principais" neste tópico. Eu usei-o para fazer um código e introduzi-o aqui também. Você deve ler muitas páginas para encontrá-lo.

Eu também gostei deste artigo. Mas não tem R nem MQL, só contém excel. Mas explica mais claramente o princípio de funcionamento. h ttp://www.chemometrics.ru/materials/textbooks/pca.htm

 
Mihail Marchukajtes:
Posso falar mais sobre a PCA? Como é que se peneiram o lixo de tal maneira?

Veja como funciona o método dos componentes principais.

Mas há também um comentário interessante do darkAlert que explica porque este método não funciona em algumas tarefas de aplicação. Eu cito:

"Você esqueceu de mencionar que o PCA (como outros métodos clássicos de redução de dados multivariados) só procura por dependências lineares..."

Quando aplicado à negociação, o método não é adequado devido ao fato de que as propriedades preditoras na forma de valores de índices e oscilos alimentados aos insumos são inerentemente não lineares.

Как работает метод главных компонент (PCA) на простом примере
Как работает метод главных компонент (PCA) на простом примере
  • habrahabr.ru
В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...
 

^GSPC é retirado de http://finance.yahoo.com, eu acho que é confiável

UNRATE, PAYEMS, GDP are taken from FRED (provavelmente https://fred.stlouisfed.org/) , essa é a parte complicada, obrigado pelo aviso.

Prefiro usar o eurusd de hora em hora mais tarde.

*algum esfregou algo, foi uma resposta ao facto de todos aqueles índices governamentais por vezes recalcularem e mudarem os seus valores históricos.

 
Vizard_:
Você pode, mas eu não vou dizer)))
A significância é calculada a partir do peso da desesperação. É isso mesmo. Seja para usar ou não,
se a redução dimensional é necessária, se você não acabar jogando o bebê fora com a água,
aplicar em abysmally ou pré-processamento... outra pergunta...

Não estou a fazer pré-processamento de uma forma muito mais simples com alguns dados apagados, o que eu acho que não é bom..... Porque é necessário alimentar cada sinal ao TC sem apagar. Há uma única idéia, que é trazer a variável de saída para a entrada. Tal, algum elemento de encaixe :-) MAS

se para levar em conta que a variável de saída é controlada pela quantidade de lucro do TC, então mudando este parâmetro, em qualquer caso, é possível saber qual a qualidade dos dados de entrada que temos. HM.... Deixe-me explicar. Há uma filosofia de seleção da variável de saída Um exemplo simples temos dois sinais:

O ganho do Blue é de 1 pip. Nas minhas condições de configuração diz para marcar com um os sinais com mais de 50 pips. Este azul será marcado como 0, embora o mercado tenha tendência a subir e este sinal azul possa ser marcado como 1. Ao ajustar o parâmetro de lucro, incluímos e excluímos outros no nosso conjunto de saída para obter a máxima capacidade de generalização..... Isto pode ser feito em uma faixa de menos 100 pips espalhados. Com o método da força bruta leva muito tempo, mesmo em incrementos de 10 deve funcionar pelo menos dez vezes...... De qualquer forma, a questão permanece em aberto.

 
Mihail Marchukajtes:
Você pode elaborar sobre o PCA? Como se peneiram o lixo desta maneira?

Não só sou demasiado preguiçoso para encontrar uma ligação para ti neste tópico, como também não preciso de o fazer.

Se tiver a gentileza de navegar por este tópico. O PCA não peneira o lixo sem mais nem menos - há uma nuance nisso. Por isso faz sentido procurá-lo.

 
Dr. Trader:

O modelo que estou a tentar actualizar agora - estou, sim, estou a aprender mais em cada novo bar. Para ser honesto, não vejo um grande impacto... Por vezes, para dezenas de barras seguidas, o modelo permanece o mesmo de antes (o mecanismo de protecção contra a sobreposição do modelo). Mas se algum banqueiro disser algo errado nas notícias, e o preço correr mal em algum lugar - há a esperança de que o modelo alcance todas as mudanças recentes dentro de um par de bares. Não faz sentido adaptar o modelo a cada barra, mas se existe uma forma de reagir rapidamente às mudanças, vamos usá-lo.


Tentei repetidas vezes insistir numa ideia que é óbvia para mim: não há nenhuma ferramenta que possa ser utilizada sem um pequeno erro de reconversão do modelo.

É preciso ir pelo grão: limpar o lixo óbvio, escalonar, talvez Voh-Soh, seleccionar preditores, apanhar um modelo..... e depois acontece que tudo tem de ser deitado fora, pois o alvo é apenas um total dud....

Na minha prática há literalmente 3-5% de erro em menos a cada passo. E se inicialmente o modelo deu um erro de mais de 40%, e foi requalificado, eu consegui mover o modelo não requalificado para 20%. Cerca de seis meses de trabalho.

 

OK, há algum especialista em MQLs aqui???? Já que estamos todos aqui :-)

Você pode me dizer como otimizar uma variável para que a outra chegue a 0 ???? Ou pelo menos perto de zero .....

Geralmente otimizando uma variável com base em outra variável....