Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1588

 
Aleksey Mavrin:

Houve alguma tentativa de aplicação de métodos estatísticos para a elaboração de gráficos, análise de castiçais e outras coisas de nível superior?

Eu não uso devoluções.

Mesmo que sejam utilizados como dados primários (representação gráfica), são necessários outros preditores, comprimindo a informação para criar proporções e vectores.

 
sibirqk:

Na minha opinião, há flutuações periódicas na temperatura do planeta devido a causas naturais. Nos últimos cem anos, o aquecimento natural começou e fatores antropogênicos foram sobrepostos a ele.

Se o desmontarmos em poucas palavras:

1. O efeito estufa é apenas um dos muitos factores que influenciam a temperatura média da Terra.

2. Para explicar a influência antropogénica, a percentagem de CO2 antropogénico na atmosfera é importante. Actualmente está a um por cento, ou seja, bastante pequeno. Muito mais se deve aos incêndios florestais e à queima de erva. Mais o sequestro de CO2, o desmatamento, reduz-o.

3. o balanço de CO2 que entra na atmosfera e seu sequestro é quase como um balanço da oferta e da demanda no mercado forex, muitos canais diferentes com diferentes tempos de investimento descarte. Não é exactamente fácil de simular. Mas há observações experimentais.

No final do século XX, máquinas como os espectrômetros de massa aceleradores de AMS surgiram, principalmente para as necessidades dos arqueólogos. Sua principal característica é que as amostras para determinação das proporções de isótopos podem ser muito pequenas - miligramas. Foram rapidamente adaptados para outros fins tecnológicos, médicos e, em particular, para fins de investigação climática. Estas máquinas medem a relação C12/C14 com muita precisão. Na gênese natural, ela é determinada pelo fundo cósmico e a relação é bastante estável. Mas quando a era dos testes nucleares começou, a concentração de C14 aumentou dramaticamente, foi dispersa pelo mundo e absorvida pelas árvores. Os locais e datas dos testes são conhecidos, os anéis anuais das árvores são facilmente contados, você pode determinar exatamente como a concentração de C14 estava mudando no local onde a árvore estava crescendo. Ao fazer tais medições em todo o mundo, foi possível acompanhar a rapidez com que o CO2 migra na atmosfera - foi muito rapidamente que, de meio a um ano, a concentração se estabilizou em todo o mundo. E, mais importante ainda, levou menos de dez anos para que a concentração voltasse ao fundo. Ou seja, todo o CO2 atmosférico está em constante atualização. Isto significa que a concentração actual é um equilíbrio de emissões/remoções em que o papel do CO2 antropogénico da queima de carvão, petróleo e gás não é tão significativo como é declarado nos meios de comunicação social.

Isto é, na minha opinião:

a) A quantidade de CO2 produzida pelo homem não aumenta significativamente a sua concentração natural, uma vez que é propagandizada.

b) O CO2 não é a única causa do efeito estufa.

c) O efeito estufa está longe de ser a única causa da mudança de temperatura na Terra.


Tanto quanto sei, o vapor de água afeta o efeito estufa de forma notável mais do que o CO2 e, em qualquer caso, a influência humana sobre o clima é exagerada. Mas não era isso que eu queria dizer quando estava a falar sobre a substância do artigo:

1) Um sistema formalmente determinístico mas bastante complexo não pode ser estudado sem os métodos de um matstat.

2) As respostas dadas por um matstat têm sempre alguma incerteza. É impossível evitá-lo completamente, porque é a natureza do assunto desta ciência.

3) Há sempre uma tentação de usar esta incerteza para obter a resposta "certa".

4) Para evitar a adequação da resposta ao resultado desejado, a significância estatística das conclusões deve ser sempre avaliada.

 
Aleksey Nikolayev:

No nosso caso, só podemos trabalhar de forma significativa com não estacionaridade, o que de uma forma ou de outra se reduz à estacionaridade. Estacionaridade por partes, modelos autoregressivos, hmm, etc.

A principal razão é que apenas uma realização do processo é sempre conhecida. Por exemplo, se tomarmos o reconhecimento da fala, há qualquer palavra que podemos dizer quantas vezes quisermos. As citações para um instrumento concreto em um intervalo de tempo concreto estão em uma única variante. A propósito, é provavelmente a razão pela qual muitas pessoas aqui não distinguem o processo aleatório das suas realizações.

Muito verdade, é por isso que o MO nunca funcionará com tais dados, eles precisam ser reprocessados em tal série que se repetirá e é bastante realista.

Por que não é praticamente discutido? porque é a pergunta número um.
 
mytarmailS:
Porque é que isto quase nunca é discutido? ... Porque essa é a pergunta número um.
Fuma o meu último elo.
 
Aleksey Mavrin:

Houve alguma tentativa de aplicação de métodos estatísticos para a elaboração de gráficos, análise de castiçais e outras coisas de nível superior?

claro, por exemplohttps://journals.plos.org/plosone/article?id=10.1371/journal.pone.0212320

Mas sabe qual será o resultado se os usar de verdade...

Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data
Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data
  • journals.plos.org
Forecasting stock prices plays an important role in setting a trading strategy or determining the appropriate timing for buying or selling a stock. We propose a model, called the feature fusion long short-term memory-convolutional neural network (LSTM-CNN) model, that combines features learned from different representations of the same data...
 

Eu costumava estar envolvido com modelagem matemática (MM) e também programei problemas de otimização usando o método de programação linear simplex.

E quando a aprendizagem de máquinas (ML) começou a se espalhar, aqui eu pensei que era o mesmo que MM. Mas não é bem a mesma coisa.


Para forex em primeiro lugar, precisamos criar um modelo de estratégia de negociação (TS) levando em conta muitos fatores.

O próprio robô não é capaz de criar o modelo TS desde o início. É porque algum programa não será capaz de criar por si só a idéia de limitação, ou seja, aquele fator que influencia o modelo ou TS.

O robô só será capaz de encontrar os limites dessa restrição.

Se você criou um modelo ruim com restrições ruins, nenhuma otimização lhe dará o resultado necessário.

Você deve saber quais fatores afetam o TS, e não pode passar sem o fator humano aqui.


Deixe-me dar-lhe um exemplo de apenas um destes factores que eu uso no meu robô comercial. Deixe-me dar-lhe um pequeno "segredo" :)

Este factor é bem conhecido de muitas pessoas- a velocidade da mudança de preços. No entanto, nos meus cálculos, não só determino a velocidade, mas também a aceleração e desaceleração da velocidade por inércia.

A velocidade é determinada em intervalos de 1 segundo. Não só é considerada a frequência de entrada das carraças, mas também o número de pontos (comprimento) entre as carraças.

Para que ou em que casos este factor é utilizado.

É usado quando se abre um pedido. Ao introduzir a limitação de velocidade, impedimos a abertura da ordem durante os fortes saltos nos preços.

E impede que uma ordem seja aberta até que a velocidade tenha diminuído até um certo valor, e ainda quando não tenha passado um certo período de tempo.

Eu também uso isto para determinar o ângulo da tendência. Quanto maior for a velocidade, maior é o ângulo de tendência.

 

Colegas a todos os olá,

Desculpe-me por uma pergunta tão tola, mas o evento OnBookEvent está funcionando no MT5? Estou tentando testá-lo, mas ele não entra em loop por alguma razão e parece que é ignorado. Mas em teoria, as cotações mudam na revisão do mercado. HMM...

 
Aleksey Nikolayev:

No nosso caso, só podemos trabalhar de forma significativa com não estacionaridade, o que de uma forma ou de outra se reduz à estacionaridade. Estacionaridade por partes, modelos autoregressivos, hmm, etc.

A principal razão é que apenas uma realização do processo é sempre conhecida. Por exemplo, se tomarmos o reconhecimento da fala, podemos dizer qualquer palavra quantas vezes quisermos. As citações para um instrumento específico em um intervalo de tempo específico estão em uma única realização. A propósito, é provavelmente a razão pela qual muitas pessoas aqui não distinguem um processo aleatório das suas realizações.

É divertido ver como as pessoas zombam da boa e velha estatistica (não) estacionária, implicando tudo, menos persistência relativa no tempo da distribuição. Provavelmente algum "guru" da econometria do passado, fez tal jogada uma vez, provavelmente sobre algo mais e em algum contexto teórico estreito e o tema da não-estacionariedade como principal obstáculo para criar o "graal" tornou-se viral. Obviamente, o preço cumulativo estatisticamente não estacionário na sua forma pura não interessa a muitas pessoas, e mesmo que os retornos fossem estacionários (sem mudança de distribuição), não daria muito para negociar de qualquer forma (as opções desapareceriam como um instrumento apenas).

Provavelmente vale a pena definir e/ou especificar o termo "não-estacionariedade no Forex", para que as pessoas familiarizadas com estatísticas clássicas possam entender do que estamos a falar.

Nos mercados pela sua natureza não há estatística, mas "jogo" não-estacionariedade com "perturbações" (fatores fundamentais), ou seja, "multidão" prevê o preço entre "perturbações", cada participante tenta prever o resto da multidão em média, e "fundamental" (política, economia, turnos de tempo de trapo...), então tudo se decompõe.

Todo o problema é como detectar a "mudança do mercado" o mais rápido possível e ao mesmo tempo "treinar" o sistema nos dados "do mercado atual", porque aprender com os mercados passados só vai confundir o sistema, os mercados antigos não existem mais, não só é inútil e prejudicial, mas treinar em janelas de dados muito pequenas não é legal, faz sentido apenas para os usuários soft, e como as pessoas comuns trabalhando com 15M e assistir - um mistério...

 
Andrei:

É engraçado ver como as pessoas troçam da boa e velha (des)estacionariedade estatística, implicando tudo, menos persistência relativa ao longo do tempo da distribuição.

......

Todo o problema é como detectar "mudanças de mercado" o mais rápido possível e ao mesmo tempo "treinar" o sistema com dados "do mercado atual", porque aprender com mercados passados só confundirá o sistema, os mercados antigos não existem mais, não só não tem sentido e é prejudicial, mas treinar em janelas de dados muito pequenas não é legal, faz sentido apenas para usuários leves, e como pessoas comuns trabalhando com 15M e relógio - um mistério...

Não "persistência relativa da distribuição", mas a independência do MO, variância e função de distribuição do tempo.

E como se "detecta mudanças de mercado"?

Bem, você detectou uma "mudança de mercado" - você precisa de uma amostra de comprimento suficiente para treinar o sistema sobre os novos dados. E se antes ou quando a amostra for suficientemente longa "mudança de mercado" ocorrer novamente - o que fazer?

 
Dmitry:

Não "persistência relativa da distribuição", mas independência do MO, variância e função de distribuição ao longo do tempo.

Não, é a dependência, e é uma dependência constante).

Dmitriy:

E como se "detecta mudanças de mercado"?

Bem, você detectou "mudança de mercado" - para treinar o sistema sobre novos dados você precisa de uma amostra de comprimento suficiente. E se antes ou quando a amostra for suficientemente longa "mudança de mercado" ocorrer novamente - o que você faz?

Você pode tentar detectar com MO

Dimitri:

Bem, você detectou uma "mudança de mercado" - você precisa de uma amostra de comprimento suficiente para treinar o sistema sobre os novos dados. E se antes ou quando a amostra atingir um comprimento suficiente, "o mercado muda" novamente - o que fazer?

Esta é a pergunta certa, você não precisa fazer nada, espere até que haja uma amostra ligeiramente significativa estatisticamente, qualquer ação nesta situação será para dar sorte, se não houver nenhum informante interno.