Regressão Bayesiana - Alguém já fez um EA usando este algoritmo? - página 46

 
Yuri Evseenkov:

A uma tentativa de aplicar a fórmula Bayesiana. Novamente.

Tarefa. Usando o teorema de Bayes, determinar qual o valor de um tique que ainda não chegou é o mais provável.

Dado. Série cronológica x,y.

y=ax+b Uma linha desde o último tick até o futuro.

P(a,b|x,y)=P(x,y|a,b)*P(a)*P(b)/P(x,y); (1) fórmula Bayes.

P(a,b|x,y)é a probabilidade de que os coeficientes a e b correspondam às coordenadas x e y de um tick futuro.

Precisamos encontrar a e b que esta probabilidade (ou mais corretamente,uma medida de probabilidade) seja máxima.

P(x,y|a,b) - vamos tomar o histograma real da distribuição de carrapatos por níveis de preço como uma função de probabilidade. A função é definida por uma matriz bidimensional (matriz): faixa de preço - probabilidade, relação percentual de carrapatos dentro desta faixa para o número total de carrapatos.

P(b) - a distribuição normal dos incrementos é tomada como uma probabilidade a priori b. PRNG com o valor normalmente distribuído é utilizado.

O coeficiente P(a) a determina a inclinação da linha reta e o sinal do incremento previsto. Até agora, estou pensando em usar o código de regressão linear que coloquei anteriormente. Isto é, tomar como unidade a probabilidade do coeficiente a ali encontrado. E em (1) substituir a probabilidade P(a) calculada levando em conta a diferença deste a e o calculado para o y dado.

Talvez você tenha algumas idéias sobre como o sinal incremental de cada carrapato se comporta?


Esboço de 2 indicadores, trabalhando em carrapatos. O primeiro define A e B para a regressão linear (para lances e pedidos separados, por precaução), e traça uma linha. O segundo é um histograma de valores de carrapato (vermelho - Pergunte, azul - Licite). Cada barra de carrapato é um novo carrapato, eles não coincidem com as barras do próprio gráfico.

Isto é tudo o que entendi do correio. O que vem a seguir? Se eu entender a lógica, eu vou terminá-la.


Arquivos anexados:
 
Dr.Trader:

O uso de carrapatos para previsão é, em minha opinião, perigoso, e o modelo deve ser criado para cada corretor separadamente.

Sobre os carrapatos reais - eles podem ser muito diferentes de corretor para corretor.

Eu concordo. Eu escrevi acima. Vou dizer novamente.

Forex são muitas corretoras, empresas forex, cozinhas - européias, chinesas, bahamianas, bermudas ... Há muitos deles. Nenhum deles domina e não contribui decisivamente para a formação de preços, e nenhum dos participantes do mercado também não. A suposição é baseada no teorema do Limite Central da teoria da probabilidade (CLT) :

"A soma de um número suficientemente grande de variáveis aleatórias pouco dependentes com aproximadamente a mesma magnitude (nenhuma soma domina, nenhuma contribuição determinante para a soma) tem uma distribuição próxima do normal"(Wikipedia).

Como eu o entendo em relação ao forex. Se recolhermos todos os carrapatos de TODAS as corretoras em uma barra M5 (milhões de carrapatos), então a distribuição de carrapatos dentro da barra estará próxima de uma normal. E quanto mais antigo for o prazo, mais próxima estará. Cada corretora em particular tem seu próprio fluxo de cotações que difere do fluxo global dominante pela medida de depreciação desta corretora. Este fluxo dominante no gráfico é uma curva (certamente não reta!) da qual nenhuma empresa de corretagem pode ir longe.

Aqui neste tópico, as pessoas reagiram cepticamente à formulação wikipedia do CDT. Também me parece incorreto. Embora eu tenha encontrado esta formulação em outras fontes desde então. Até mesmo a Referência MQL4 tem um exemplo do indicador de acordo com esta formulação.

Assim, penso que o TPT rege um número suficientemente grande de incrementos no período da fraca influência de fatores fundamentais.

 
Dr.Trader:

Esboço de 2 indicadores, trabalhando em carrapatos. O primeiro define A e B para regressão linear (para lances e pedidos separados, só por precaução), e traça uma linha. O segundo é um histograma de valores de carrapato (vermelho - Pergunte, azul - Lance). Cada barra de carrapato é um novo carrapato, eles não coincidem com as barras do próprio gráfico.

Isto é tudo o que entendi do correio. O que vem a seguir? Se eu entender a lógica, eu vou terminá-la.


Quero calcular as probabilidades usando a fórmula Bayes. A regressão linear e o coeficiente encontrado só se aplicam para calcular a probabilidade a priori P(a).
 

Suponha que haja um preço de referência, que é dado pelos provedores de liquidez, e as cotações dos corretores simplesmente ricocheteiam em torno dele. Nesse caso, a cotação de cada corretor dançará em alguma faixa em torno do "preço principal", formando uma espécie de cúpula sobre o histograma. Se você somar os histogramas da cúpula, você acaba com algo parecido com uma distribuição normal em forma, eu concordo.

Mas ainda não funciona para nós, estamos trabalhando com citações de um corretor em particular, e uma distribuição normal é improvável. Estou observando o histograma há algum tempo, meu corretor me dá um máximo de 4000 ticks (isso é cerca de 20 minutos), eu os uso todos para o histograma. É mais como um meio-elipse deitado de lado. Se o preço começa a subir/cair - o elipse cresce um lado fino, mas eventualmente toma sua forma novamente. Mas às vezes há dois picos. Você pode tentar descrever este valor médio por alguma outra distribuição e usá-lo em cálculos (e não gaussianos). Se você fizer um histograma em um pequeno número de carrapatos, por exemplo uma centena, é apenas uma distribuição em salto constante, acho que não vai funcionar, você precisa de mil ou mais carrapatos.

O histograma na foto aqui tem o terço direito como resultado de rápidas mudanças de preço, então tudo deve tomar a forma dos dois terços esquerdos.

 
Dr.Trader:

Suponha que haja um preço de referência, que é dado pelos provedores de liquidez, e as cotações dos corretores simplesmente ricocheteiam em torno dele. Nesse caso, a cotação de cada corretor dançará em alguma faixa em torno do "preço principal", formando uma espécie de cúpula sobre o histograma. Se você somar os histogramas da cúpula, você acaba com algo parecido com uma distribuição normal em forma, eu concordo.

Mas ainda não funciona para nós, estamos trabalhando com citações de um corretor em particular, e uma distribuição normal é improvável.

Essa é outra questão. Diz respeito à aplicação prática.

Na fórmula (1) a função de probabilidade P(x,y|a,b) é um verdadeiro histograma de carrapatos reais de um corretor de concreto real. Por exemplo, a probabilidade P(x,y|a,b)=0,12 se 12% de todos os carrapatos na janela caírem em y(preço)+largura(conjunto). Eu construo o histograma no perfil.



Depois há os multiplicadores de correção, as probabilidades a priori P(a) e P(b). Portanto, como P(b) escolhi uma distribuição normal dos preços PRIRATE. Ora, está escrito nos posts anteriores.

 

Li o documento no primeiro post, ele não sai bem de todo.

Não foi possível passar por muitas das fórmulas, então aqui está apenas uma paráfrase gratuita. O autor tem uma oferta e um preço de pedido de bitcoin por meio ano, com um intervalo de 10 segundos. Ele faz um programa (classificador) que levará os preços atuais, e retorna três sinais - comprar, vender e apenas manter posições abertas. A previsão é feita com 10 segundos de antecedência. A cada 10 segundos, o programa deve receber novos dados e contá-los todos novamente. Os dados iniciais são divididos em vários vetores e utilizam esses vetores para a previsão de preços. O classificador recebe três conjuntos de dados - um para os últimos 30 minutos, o segundo para os últimos 60 minutos, o terceiro para os últimos 120 minutos (cada conjunto ainda é o preço com intervalo de 10 segundos). Eu não entendo mais. As fórmulas são muito semelhantes à neurônica, ou seja, cada valor de entrada corresponde a algum peso. Mas estes pesos são aplicados a três matrizes ao mesmo tempo. E, de repente, acontece que os pesos não podem ser encontrados (mas este é um neurônio, não é?) e temos que experimentar todas as variantes. Empiricamente o autor deduziu alguma fórmula, que deveria ajudar na otimização dos pesos, rejeitando o que obviamente não é adequado, e em algum lugar é usada a regressão Bayesiana. Também o resultado da regressão é provavelmente usado como um valor de entrada para o classificador.

Parece-me um trabalho de um estudante feito algumas noites antes de sua chegada. Não existem prufs assalariados :)

Embora seja utilizada a regressão Bayesiana, ela está lá como uma pequena parte de algum sistema complexo. Talvez devido aos pesos otimizados, sua influência seja reduzida a zero. Eu poderia também colocar um gerador de números aleatórios na neurônica ou calendário maia, de qualquer forma sua influência será reduzida a zero durante a otimização.

 
Eu não consegui passar pelo primeiro posto em inglês. Estou tentando entender os exemplos do teorema Bayesiano em outras áreas. E estou apenas tentando calcular as probabilidades de ocorrência deste ou daquele preço usando a fórmula Bayes. E a distribuição normal não é um atributo necessário em absoluto. É apenas uma das hipóteses de uma das probabilidades a priori até agora.
 

Encontrei dois artigos sobre o assunto do ramo - podem ser úteis para os entusiastas

Artigo 1.

Regressão Bayesiana com STAN: Parte 1 regressão normal

Artigo 2

Regressão Bayesiana com STAN Parte 2: Além da normalidade

Cada artigo é um anúncio para dois livros com o mesmo título

Bayesian regression with STAN: Part 1 normal regression
Bayesian regression with STAN: Part 1 normal regression
  • Lionel Hertzog
  • datascienceplus.com
This post will introduce you to bayesian regression in R, see the reference list at the end of the post for further information concerning this very broad topic. Bayesian regression Bayesian statistics turn around the Bayes theorem, which in a regression context is the following: $$ P(\theta|Data) \propto P(Data|\theta) \times P(\theta) $$...
 

Vocês - engenheiros, físicos, operadores de rádio - são tão estranhos.....

Muitas vezes eu já lhes disse aqui que quants, alt-traders, market-makers - eles não são idiotas, que são BONS em matemática, que não são pagos SOFTLY a 100K+ por ano + bônus, mas todos vocês parecem não receber isso.

O preço no mercado de ações é uma expressão de um sistema CONNECTED, portanto qualquer modelo de preço útil (marginalmente adequado) NÃO PODE ser simples. Sim, pode haver regressão Bayesiana no interior, mas apenas como método numérico auxiliar. E você está atirando um rebanho para "este seu tailrex, nós o pisaremos aqui só com o método Bayesiano!

Bem, talvez isto chegue até você: a lista de métodos matemáticos usados ativamente no comércio pelos grandes criadores de mercado, bancos e fundos de hedge funds. Esta lista também é dividida por sub-especialidades, ou seja, por tipos de instrumentos financeiros negociados e por tipos de previsão nos bancos. Esta lista foi elaborada por um ex-funcionário sênior do Citi e do JPMorgan. A lista não é secreta, você pode descobrir a partir de 5-10 livros sobre matemática financeira (em inglês). Mas no fórum russo, e mesmo em uma forma tão completa - a lista é rara.

Cientista de dados, estaticista
25.000 USD
Descrição do trabalho
REQUISITOS PROFISSIONAIS (valorizamos ao máximo o desejo de aprender em movimento)

Conhecimento avançado de estatísticas e séries cronológicas: Processos estocásticosFerramentas: SSA/SVD, RSSA, FIMA/ARFIMA, Modelo Exógeno Autoregressivo Não Linear (NARX), (N)GARCH e seus derivados, Hurst Exponent e suas aplicações, Análise de Quantificação de Recorrência (RQA)
Experiência de programação (ou pronto para aprender) em Python (e conjunto de bibliotecas para todas as coisas estatísticas)
Bibliotecas de análise de dados em Python (theano, keras, Torch, Pandas, NumPy, scikit-learn) ou seus equivalentes em R
alguma experiência com Aprendizagem de Máquina, filtragem colaborativa, análise de agrupamento, Teoria dos Gráficos
Outras abordagens combinadas: ANFIS (sistema de inferência fuzzy baseado em rede adaptável)
Redes Neurais: aprendizagem sem supervisão: RNN (Redes Neurais Recorrentes), FNN, RBF, etc.

TAREFAS & MEIO AMBIENTE:
análise estatística de dados financeiros, aplicações econométricas

Moderadores: por favor, apaguem acidentalmente o link para a fonte original, eu não posso, ele ainda está pendurado em seu fórum de banco de dados no porão do post. Caso contrário, eles vão pensar que é publicidade. Obrigado.

Все вакансии компании TenViz LLC
Все вакансии компании TenViz LLC
  • www.work.ua
New York, US, based product (services) company with growing sales on 3 continents and 25−35 employees and contractors. We have a growing team in Ukraine, and are hiring full- and part-time people with...
 
Machine Learning, Analista de Redes Neurais
28000 UAH

Descrição do trabalho

PROFESSIONAL REQUIREMENTS (valorizamos ao máximo o desejo de aprender em movimento):

Conhecimento de Redes Neurais Artificiais e Machine Learning, incluindo:

FeedForward Neural Network (FNN)
Família de Redes Neurais Recorrentes (RNN): incluindo Modelo de Memória de Longo Prazo (LSTM)
CNN - Convolutional Neural Networks
Radial Basis Function (RBF)
abordagens combinadas ANFIS (Adaptive Network-based Fuzzy Inference System)
Experiência de programação (ou pronto para aprender) em Python (e conjunto de bibliotecas para todas as coisas estatísticas)
Bibliotecas de aprendizagem de máquinas e de análise de dados em Python (theano, keras, Torch, Pandas, NumPy, scikit-learn)
Adicionalmente, um bom conhecimento de R e/ou Matlab seria útil

ÁREAS DE CONHECIMENTO RELACIONADAS:

conhecimento avançado de estatísticas e séries cronológicas (Processos estocásticos e ferramentas): ARFIMA, Modelo Exógeno Autoregressivo Não Linear (NARX), Wavelet Transforms
modelos de estimativa de espectro - Análise de Espectro Singular (SSA) (SVD)
Filtragem colaborativa, Análise de Cluster, Teoria dos Gráficos

TASKS (ordem priorizada):

análise estatística de dados financeiros, aplicações econométricas
construção de serviços e estruturas para o processamento de consultas interativas distribuídas sobre grandes volumes de dados do mercado financeiro