Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 388

 
Maxim Dmitrievsky:


Eu já tenho preditores, por estranho que pareça. Eu tenho um robô pronto, que construí em menos de um mês. O mais importante são os preditores, está fora de questão, sim. Bem, isso é quem tem experiência em quê... Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados num instante, eu trabalho como analista há 5 anos :) Na minha opinião, a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e selecionar, levar 2-3 semanas :)



E em números?

Sobre a amostra de treinamento, a amostra de teste e a amostra de validação.

O mais importante: em um novo arquivo que foi originalmente separado dos três anteriores.

Todos estes quatro valores não devem diferir muito um do outro. Se eles diferirem mais de 10% em erro (30% de desvio e 35% de desvio, por exemplo), então raspe-o.


E o que eu tenho na conta real não tem importância nenhuma - os sinais morrem depois de um ano ou mesmo depois de dois anos.

 
SanSanych Fomenko:

E quanto ao facto de os incrementos não indicarem tendências de forma alguma?

Sim, eles fazem.

Ou o modelo prevê o incremento ou a direção - é para isso que servem os modelos de classificação.

Não tenho conhecimento de nenhum modelo de classificação que reconheça movimentos nas notícias. E para a GARCH este é o objectivo do modelo - trabalhar o movimento ocorrido. Fat tails - este é o movimento nas notícias quando as tendências se quebram e ocorrem inversões bruscas.


Bem, podes ver o aumento em diferentes períodos de tempo.

Existem modelos GARCH interessantes para vários períodos de tempo. O significado é o seguinte.

Suponhamos que prevemos o incremento no H1. O modelo requer dados de entrada que caracterizam a distribuição. Como tais dados de entrada (geralmente volatilidade) não tomamos a hora anterior, mas os minutos dentro da hora atual.

Na minha opinião, é importante dividir a história inteira em intervalos com o mesmo comportamento. Por exemplo, aqui está uma imagem do preço de fecho do EURUSD durante 5 anos, pode ver que houve uma tendência até cerca do 2T14, depois o resto de 14 e início de 15 é outra, e depois disso a terceira começou e ainda continua. Tentar obter a temperatura média no hospital e usá-la para diagnosticar a condição de um único paciente é errado, imho.


Se tomarmos, por exemplo, a tendência actual algures desde o início do século XV até aos nossos dias, e pelo menos isolar/extrapolar as tendências, a periodicidade, obtemos um resultado bastante credível, imho. Aqui está a imagem, em verde é o preço de fecho previsto para as próximas duas semanas.


 
SanSanych Fomenko:


E em números?

Sobre a amostra de treinamento, a amostra de teste e a amostra de validação.

O mais importante: em um novo arquivo que foi originalmente separado dos três anteriores.

Todos estes quatro valores não devem diferir muito um do outro. Se diferirem mais de 10% em erros (30% de desvio e 35% de desvio, por exemplo), aparafuse-os.


Se diferirem em mais de 10% (desvio de 30% e 25%, por exemplo, então que se lixem.) O que vale o dinheiro real - é nada, os sinais morrem após um ano ou mesmo dois anos.


Eu não preciso de tantas amostras inúteis, há treinamento e testes suficientes, eu escolho parâmetros via AG, depois escolho resultados que são, no máximo, parecidos com o para frente e para trás. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate quando se negocia no mercado, pois o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.

Reciclagem todas as semanas, até agora a segunda semana está a +35%. Do que se trata, é dinheiro real )

 
SanSanych Fomenko:

E o que vale o dinheiro real não é nada, há sinais que morrem em um ano ou até dois ...

Quer mesmo criar um modelo de mercado para os próximos anos...?
 
Maxim Dmitrievsky:


Eu já tenho os preditores, estranhamente. Já existe um bot pronto, que fica no real, escrito em menos de um mês. O mais importante são os preditores, o que está fora de questão, sim. Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados na hora, eu trabalho como analista há 5 anos :) Na minha opinião, a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e selecionar, levar 2-3 semanas :)

Por favor, que preditores você usa?
 
Maxim Dmitrievsky:


Em números allenorm, não há necessidade de tantas amostras inúteis, treinamento e teste isso é suficiente, através da GA eu escolho parâmetros, então eu escolho resultados que são tão semelhantes quanto possível para trás e para frente. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate em caso de negociação no mercado, já que o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.

Reciclagem todas as semanas, até agora a segunda semana está a +35%. Eu sei do que se trata, isto é dinheiro a sério).

Você sabe melhor sobre as amostras.
 
pantural:
Por favor, diga-me quais são os seus preditores?
Um que já descrevi aqui é o valor da inclinação da linha de regressão e até um exemplo de bot, os outros são um segredo :)
 
Ivan Negreshniy:
Quer mesmo criar um modelo de mercado para os próximos anos...?

Não, claro que não.

Estou ocupado a conseguir algumas garantias para algum futuro.

 
Maxim Dmitrievsky:


Em números allenorm, não há necessidade de tantas amostras inúteis, treinamento e teste isso é suficiente, através da GA eu seleciono parâmetros, então eu escolho resultados que são tão semelhantes quanto possível para trás e para frente. Você nunca irá treinar um modelo para todo o histórico de cotações, além de oferecer 3 períodos independentes, e negociar no 4º é um disparate quando se negocia no mercado, pois o mercado muda durante esse tempo. Por isso, certifique-se de que o modelo não está sobre-equipado, numa secção fora da amostra de treino, e é só isso.

Reciclagem todas as semanas, até agora a segunda semana está a +35%. O que está no real é sobre, é dinheiro real )

Eu também tenho duas parcelas.

A primeira parcela: três amostras são retiradas aleatoriamente e verificadas. A última secção, que segue a primeira, é uma corrida sequencial, de preferência com um testador.

Completamente esquecido, embora eu já tenha escrito muitas vezes.

A etapa descrita acima é a segunda etapa.

O primeiro passo é a seleção de preditores "relevantes" para a variável alvo. Posso provar que resultados muito bons são obtidos por aqueles conjuntos de preditores em que prevalecem os preditores que nada têm a ver com a variável alvo - o ruído -. Os resultados do treino são muito bons em ruído. E eu consegui obter um erro de menos de 10% nas três partes acima mencionadas, baixando para 3%! E depois recebi um erro completamente aleatório na segunda parte.

Se você começar a eliminar os preditores de ruído, o erro aumenta durante o treinamento, mas diminui na segunda seção. Se você se livrar dos preditores de ruído, você recebe aproximadamente o mesmo valor de erro. No meu conjunto de preditores, é um pouco menos de 30%.

 
Não é preciso treinar máquinas, é preciso primeiro ter nervos de ferro e conexões nos escalões superiores do poder para poder comerciar de forma lucrativa.