Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 804

 
Yuriy Asaulenko:

Não fiques triste, estou ciente disso). Embora, se você se sentir mais confortável, você pode continuar.

Mas você está certo.

 
Aleksey Vyazmikin:
Por favor, diga-me, é suficiente procurar correlação com os dados alvo na fase inicial, se sim, que limiar de correlação deve ser usado?
A correlação é um método linear. Se há uma, não vale a pena fazer uma horta com NS. A regressão linear é suficiente.
 
Grigoriy Chaunin:
A correlação é um método linear. Se está presente, não vale a pena fazer uma horta com NS. A regressão linear é suficiente.

Obrigado pela sua resposta.

Que tal aplicar a regressão linear para identificar as relações mais robustas, adicionando funcionalidades adicionais?

 
Não entendo a pergunta. No entanto, a regressão linear não funciona nos mercados financeiros.
 

Tenho pensado nisto já há algum tempo.... na verdade.

Nós temos uma matriz de dez por dez, o que podemos dizer sobre isso?

A quantidade de dados é de 100.

Depois podemos calcular a quantidade de informação contida nestes dados que também será expressa em algumas unidades. O que mais contém este conjunto de dados, além da quantidade de dados e da quantidade de informações???? Eu não vou perder o meu tempo a responder. A quantidade de conhecimento. Tudo isto é natural em relação ao alvo. Então, se olharmos para a relação de causa e efeito, obtemos o seguinte modelo.

Quantidade de conhecimento -> Quantidade de dados -> Quantidade de informação.

Portanto, para prever é necessário apenas SABER sobre um valor necessário a partir de um conjunto de dados, em vez de quantidade de informação.

O conhecimento em si é uma coisa muito frágil que pode ser perdida por uma conversão de dados não confiável. Uma mudança descuidada, mesmo em um registro por uma pequena quantidade, pode reduzir significativamente a quantidade, se não removê-la completamente.

É por isso que não é recomendado tornar os dados de entrada mais complexos com conversões. Quanto mais complexa for a transformação, menos conhecimento se deixa no resultado final.

Então... Só de pensar em voz alta na matéria, algumas pessoas não vão entender e vão continuar o seu caminho sem chegar à estação final....

 
Mihail Marchukajtes:

Tenho pensado nisto já há algum tempo.... na verdade.

Nós temos uma matriz de dez por dez, o que podemos dizer sobre isso?

A quantidade de dados é de 100.

Depois podemos calcular a quantidade de informação contida nestes dados que também será expressa em algumas unidades. O que mais contém este conjunto de dados, além da quantidade de dados e da quantidade de informações???? Eu não vou perder o meu tempo a responder. A quantidade de conhecimento. Tudo isto é natural em relação ao alvo. Então, se olharmos para a relação de causa e efeito, obtemos o seguinte modelo.

Quantidade de conhecimento -> Quantidade de dados -> Quantidade de informação.

Portanto, para prever é necessário apenas SABER sobre um valor necessário a partir de um conjunto de dados, em vez de quantidade de informação.

O conhecimento em si é uma coisa muito frágil que pode ser perdida por uma conversão de dados não confiável. Uma mudança descuidada, mesmo em um registro por uma pequena quantidade, pode reduzir significativamente a quantidade, se não removê-la completamente.

É por isso que não é recomendado tornar os dados de entrada mais complexos com conversões. Quanto mais complexa for a transformação, menos conhecimento se deixa no resultado final.

Então... Só de pensar em voz alta na matéria, algumas pessoas não vão entender e vão continuar o seu caminho sem chegar à estação final....

Além disso, você pensou e arredondou números para dezenas e perdeu alguns dados, geralmente é prejudicial pensar, enquanto algumas pessoas continuam...

 
Aleksey Vyazmikin:

Obrigado pela sua resposta.

Que tal aplicar a regressão linear para identificar as relações mais robustas, adicionando funcionalidades adicionais?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
Grigoriy Chaunin:
Não entendo a pergunta. No entanto, a regressão linear não funciona nos mercados financeiros.

Então não há correlação? Acho queMaxim Dmitrievsky respondeu à pergunta abaixo.

Obrigado pela resposta.

 
Tente plotar autocorreção nos dados de preços e você verá imediatamente se há correlação ou não. Adicionar indicadores é inútil. O indicador é uma função do preço. Portanto, construímo-lo apenas com base em dados de preços.
 

Para os fãs de validação cruzada, teste de amostragem, OOS e outras coisas, não me cansarei de me repetir:

SanSanych e Vladimir Perervenko em particular

Testes fora da amostra
Este é o método de validação mais popular e também abusivo. Resumidamente, os testes fora da amostra requerem que se reserve uma parte dos dados a serem utilizados para testar a estratégia após o seu desenvolvimento e se obtenha uma estimativa imparcial do desempenho futuro. No entanto, testes fora da amostra
reduzir o poder dos testes devido a uma amostra menor
os resultados são tendenciosos se a estratégia for desenvolvida através de múltiplas comparações
Em outras palavras, os testes fora da amostra são úteis apenas no caso de hipóteses únicas. O uso de testes fora da amostra para estratégias desenvolvidas através de mineração de dados mostra a falta de compreensão do processo. Neste caso, o teste pode ser usado para rejeitar estratégias, mas não para aceitar nenhuma. Nesse sentido, o teste ainda é útil, mas os desenvolvedores de estratégias de negociação sabem que um bom desempenho em estratégias fora da amostra para estratégias desenvolvidas através de múltiplas comparações é, na maioria dos casos, um resultado aleatório.
Alguns métodos foram propostos para corrigir o significado fora da amostra para a presença de múltiplas comparações tendenciosas, mas em quase todos os casos reais o resultado é uma estratégia não significativa. No entanto, como mostramos na Ref. 1 com dois exemplos que correspondem a dois grandes regimes de mercado, estratégias altamente significativas mesmo após a aplicação de correcções por enviesamento também podem falhar devido à mudança dos mercados. Portanto, os testes fora da amostra são estimativas imparciais de desempenho futuro apenas se os retornos futuros forem distribuídos de forma idêntica aos retornos passados. Em outras palavras, a não-estacionariedade pode invalidar quaisquer resultados de testes fora da amostra.


Conclusão: Os testes fora da amostra aplicam-se apenas a hipóteses únicas e assumem a estacionaridade. Neste caso são úteis, mas se estas condições não forem cumpridas, podem ser bastante enganadoras.

O ROS só pode ser usado para cancelamento de hipóteses ou apenas para problemas estacionários conhecidos.

Mas não para procurar estratégias e selecionar características/avaliar a estabilidade do sistema