Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 388
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Eu já tenho preditores, por estranho que pareça. Eu tenho um robô pronto, que construí em menos de um mês. O mais importante são os preditores, está fora de questão, sim. Bem, isso é quem tem experiência em quê... Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados num instante, eu trabalho como analista há 5 anos :) Na minha opinião, a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e selecionar, levar 2-3 semanas :)
E em números?
Sobre a amostra de treinamento, a amostra de teste e a amostra de validação.
O mais importante: em um novo arquivo que foi originalmente separado dos três anteriores.
Todos estes quatro valores não devem diferir muito um do outro. Se eles diferirem mais de 10% em erro (30% de desvio e 35% de desvio, por exemplo), então raspe-o.
E o que eu tenho na conta real não tem importância nenhuma - os sinais morrem depois de um ano ou mesmo depois de dois anos.
E quanto ao facto de os incrementos não indicarem tendências de forma alguma?
Sim, eles fazem.
Ou o modelo prevê o incremento ou a direção - é para isso que servem os modelos de classificação.
Não tenho conhecimento de nenhum modelo de classificação que reconheça movimentos nas notícias. E para a GARCH este é o objectivo do modelo - trabalhar o movimento ocorrido. Fat tails - este é o movimento nas notícias quando as tendências se quebram e ocorrem inversões bruscas.
Bem, podes ver o aumento em diferentes períodos de tempo.
Existem modelos GARCH interessantes para vários períodos de tempo. O significado é o seguinte.
Suponhamos que prevemos o incremento no H1. O modelo requer dados de entrada que caracterizam a distribuição. Como tais dados de entrada (geralmente volatilidade) não tomamos a hora anterior, mas os minutos dentro da hora atual.
Na minha opinião, é importante dividir a história inteira em intervalos com o mesmo comportamento. Por exemplo, aqui está uma imagem do preço de fecho do EURUSD durante 5 anos, pode ver que houve uma tendência até cerca do 2T14, depois o resto de 14 e início de 15 é outra, e depois disso a terceira começou e ainda continua. Tentar obter a temperatura média no hospital e usá-la para diagnosticar a condição de um único paciente é errado, imho.
Se tomarmos, por exemplo, a tendência actual algures desde o início do século XV até aos nossos dias, e pelo menos isolar/extrapolar as tendências, a periodicidade, obtemos um resultado bastante credível, imho. Aqui está a imagem, em verde é o preço de fecho previsto para as próximas duas semanas.
E em números?
Sobre a amostra de treinamento, a amostra de teste e a amostra de validação.
O mais importante: em um novo arquivo que foi originalmente separado dos três anteriores.
Todos estes quatro valores não devem diferir muito um do outro. Se diferirem mais de 10% em erros (30% de desvio e 35% de desvio, por exemplo), aparafuse-os.
Se diferirem em mais de 10% (desvio de 30% e 25%, por exemplo, então que se lixem.) O que vale o dinheiro real - é nada, os sinais morrem após um ano ou mesmo dois anos.
Eu não preciso de tantas amostras inúteis, há treinamento e testes suficientes, eu escolho parâmetros via AG, depois escolho resultados que são, no máximo, parecidos com o para frente e para trás. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate quando se negocia no mercado, pois o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.
Reciclagem todas as semanas, até agora a segunda semana está a +35%. Do que se trata, é dinheiro real )
E o que vale o dinheiro real não é nada, há sinais que morrem em um ano ou até dois ...
Eu já tenho os preditores, estranhamente. Já existe um bot pronto, que fica no real, escrito em menos de um mês. O mais importante são os preditores, o que está fora de questão, sim. Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados na hora, eu trabalho como analista há 5 anos :) Na minha opinião, a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e selecionar, levar 2-3 semanas :)
Em números allenorm, não há necessidade de tantas amostras inúteis, treinamento e teste isso é suficiente, através da GA eu escolho parâmetros, então eu escolho resultados que são tão semelhantes quanto possível para trás e para frente. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate em caso de negociação no mercado, já que o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.
Reciclagem todas as semanas, até agora a segunda semana está a +35%. Eu sei do que se trata, isto é dinheiro a sério).
Por favor, diga-me quais são os seus preditores?
Quer mesmo criar um modelo de mercado para os próximos anos...?
Não, claro que não.
Estou ocupado a conseguir algumas garantias para algum futuro.
Em números allenorm, não há necessidade de tantas amostras inúteis, treinamento e teste isso é suficiente, através da GA eu seleciono parâmetros, então eu escolho resultados que são tão semelhantes quanto possível para trás e para frente. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate quando se negocia no mercado, pois o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.
Reciclagem todas as semanas, até agora a segunda semana está a +35%. O que está no real é sobre, é dinheiro real )
Eu também tenho duas parcelas.
A primeira parcela: três amostras são retiradas aleatoriamente e verificadas. A última secção, que segue a primeira, é uma corrida sequencial, de preferência com um testador.
Completamente esquecido, embora eu já tenha escrito muitas vezes.
A etapa descrita acima é a segunda etapa.
O primeiro passo é a seleção de preditores "relevantes" para a variável alvo. Posso provar que resultados muito bons são obtidos por aqueles conjuntos de preditores em que prevalecem os preditores que nada têm a ver com a variável alvo - o ruído -. Os resultados do treino são muito bons em ruído. E eu consegui obter um erro de menos de 10% nas três partes acima mencionadas, baixando para 3%! E depois recebi um erro completamente aleatório na segunda parte.
Se você começar a eliminar os preditores de ruído, o erro aumenta durante o treinamento, mas diminui na segunda seção. Se você se livrar dos preditores de ruído, você recebe aproximadamente o mesmo valor de erro. No meu conjunto de preditores, é um pouco menos de 30%.