Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 155

 
J.B:

É uma estimativa empírica do ganho de qualidade de classificação com - sem este fator, tudo é simples, informação mútua e determinação em sistemas multi-fator não-lineares funcionam de forma não confiável. E os números 4-5% não é um dogma, você só tem que entender, que usando "todos os mercados" e fluxos de informação sem dinâmica de preço de determinado instrumento pode-se prever seu futuro para algum horizonte <5% pior, isso é tudo. Isto é, se você tiver uma probabilidade de um minuto de prever o aumento futuro na frente do ativo, por exemplo 70%, então excluindo o preço da série prevista dos dados para análise você obtém 70 - (70-50)*0,5 = 69% quase dentro dos limites de ruído da diferença. Bem, claro, se você tem dados em tempo real de todos os mercados mundiais e não apenas mercados, mas sem informações internas, e se apenas um instrumento tem o preço... infelizmente, qualquer que seja a IA que você criou, é mais fácil criar um terminador do que vencer um mercado com tais dados.

Bem, está bem.

Digamos que não estou classificando o ganho para cima/para baixo, estou construindo um modelo de regressão. Portanto, R^2 ou alguma outra métrica determinística (por exemplo, métrica robusta de desvio absoluto) está bem.

Quanto à informação mútua - é descarada ou há fortes evidências de que a métrica não funciona de forma confiável? Eu tenho as minhas dúvidas.

Atualização: Eu fiz muitas pesquisas sobre dados sintéticos e reais usando informações mútuas. Se a dependência é estacionária, a métrica funciona bem em todos os lugares. Se a dependência estiver à beira do ruído, a métrica pode mostrar dependência zero. Mas, no geral, não vejo nenhuma razão para o seu pior desempenho em sistemas multivariados não lineares do que, por exemplo, o F1. Você pode ler sobre isso aqui:https://habrahabr.ru/company/aligntechnology/blog/303750/

Mas quando eu classifiquei um movimento de preços incremental eu tive aproximadamente a seguinte imagem (para 5 pares de moedas juntos, ou seja, um modelo para todos):


Isso é pelo menos a mediana dos valores de precisão em 50 amostras pendentes na região de 57%, no máximo. Para pares de moedas individuais, eu alcanço precisão mediana acima de 60%. Isto é apenas sobre os dados das séries cronológicas.

 
Alexey Burnakov:

1) Esta não é uma visão ingênua. É a direcção da busca. E não necessariamente uma rede neural. A tese é esta: de valores passados de uma série temporal de preços você pode extrair informações suficientes para negociação lucrativa (superando custos), independentemente do horizonte temporal do teste a termo real.

Também vou publicar alguns gráficos sobre este tema. Estou actualmente a preparar material para um artigo.

2) PS: Pessoalmente, levando em conta todos os fatores que levam ao excesso de treinamento, e tentando tomar a condição mais conservadora e confiável do modelo, acontece que mais de 30-40% por ano (com um máximo de 25% de drawdown) não pode se espremer para fora. Mas já excede o rendimento mediano dos fundos de cobertura. Todos os outros interesses cósmicos supostamente obtidos a longo prazo apenas na análise técnica da série temporal - é uma mentira.

1) Claro que temos de procurar em todo o lado, apenas sugeri que se usasse mais informação e apenas isso, e além de um comerciante estabelecido não pode ser desviado, apenas podemos adicionar informação ao seu modelo existente.

2) os retornados medianos mesmo os fundos hedge americanos são tristes abaixo dos índices, os mais duros dificilmente dão 15-20% em média em 10 anos, embora os modelos não são permitidos a negociar com modelos afiados* abaixo de 2-3 e claro que a capacidade é de $10^6-9, de acordo com os cálculos todos deveriam ter pelo menos 20-30% mas....

 
J.B:

1) Claro que você tem que procurar em todos os lugares, eu apenas sugeri usar mais informações e apenas, e além de um comerciante estabelecido não pode ser desviado do seu próprio caminho, você só pode adicionar informações ao seu modelo existente.

2) os retornados medianos mesmo os fundos hedge americanos são tristes abaixo dos índices, os mais íngremes apenas 15-20% dão uma média de 10 anos, embora o modelo não é permitido negociar com um Sharpe* abaixo de 2-3 e, claro, a capacidade de lá $10^6-9, os cálculos devem ser de pelo menos 20-30% mas....

1) é sim

2) bem, sim... mas este Sharp 2-3 como é calculado? Como é que os fundos calculam, ou melhor, COMO é que eles determinam que esta é uma estimativa Sharpe real sobre um comércio real?

 
Alexey Burnakov:

PS: Pessoalmente, comigo a lutar com todos os factores que levam ao excesso de aprendizagem e a tentar tomar a condição de modelo mais conservadora e fiável, acontece que é impossível espremer mais de 30-40% por ano (com um drawdown máximo de 25%). Mas já excede o rendimento mediano dos fundos de cobertura. Todos os outros interesses cósmicos supostamente recebidos, a longo prazo, apenas com base em análises técnicas baseadas em séries temporais - é uma mentira.

))) Hilariante!

Que vantagem você tem sobre esses 30-40% ao ano?

 
Dmitry:

))) Hilariante!

Qual é a vantagem de fazer isto 30-40% por ano?

Carga máxima de depósito de 10% (1:10).

Bem, devo mencionar que às vezes tenho visto exemplos de fazer ainda mais durante anos. Mas foi à mão ou com drawdowns à beira de uma falta.

 
Alexey Burnakov:

Carga máxima de depósito de 10% (1:10).

Bem, devo salientar que às vezes tenho visto exemplos de anos a fazer mais do que isso. Mas foi à mão ou com drawdowns à beira de uma falta.

Não me refiro à carga do depósito, mas sim à alavancagem - com que alavancagem você ganha esses 30-40% por ano?
 
mytarmailS:

Gente lá é uma idéia, vale a pena conferir, eu tive isso há muito tempo, eu queria conferir mas não consegui descobrir o pacote e de alguma forma esqueci e abandonei, mas aqui eu li o ramode J.B e lembrei, afinal ele também fez algo parecido:)

Estamos a falar de correlação cruzada - podemos calcular o quanto uma BP fica atrás da outra e se existe alguma ligação entre elas...

A essência da minha idéia foi monitorar simultaneamente um grande número de pares e construir algo como uma matriz de correlação cruzada para comparar cada par e encontrar pares que se sucedem, mas um fica para trás e comercializar esse atraso, uma vez que o mercado não tem nada mais constante do que o tempo, acho que os cálculos devem ser feitos constantemente em cada nova barra, para perceber imediatamente quando uma nova relação aparece e também para perceber imediatamente quando essa relação desaparece ...

Você pode tomar qualquer coisa, qualquer preditor, mas acho que a melhor abordagem é aos pares, porque os criadores de mercado quando o preço do seu instrumento é quase sempre guiado por um ou um monte de outros instrumentos, e os indicadores clássicos são improváveis de caber.

posso tentar treinar um neurônio usando preditores que mudam dinamicamente, em resumo, tudo é limitado apenas pela imaginação ...

Eu próprio tentaria implementá-lo, mas estou ocupado com outro projecto e não quero desabafar.

A função padrão ccf() da correlação cruzada em P

é um pacote avançado com divisão pré-espectral em níveis e depois verificando se há "wavemulcor" cruzado. e você pode comparar muitos BPs ao mesmo tempo

Infelizmente, é um fracasso, os pares andam por conta própria, a entropia é outra questão, o que é mais interessante.
 
Dimitri:
Não estou a falar de carregamento de depósitos, estou a falar de alavancagem - com que tipo de alavancagem estás a ganhar esses 30-40% por ano?
Oooh, vejo que não percebes o que é uma vantagem. Eu especifiquei alavancagem 1:10 entre parênteses, no máximo (se várias negociações forem realizadas no mercado).
 
E a propósito, sim, já comecei a escrever um artigo, vou publicá-lo neste tópico assim que estiver pronto. Esse será o meu tratado .... :-)
 
Alexey Burnakov:
Oh, vejo que não entende o que é alavancagem. Eu especifiquei alavancagem 1:10 entre parênteses no máximo (se vários negócios vierem a estar no mercado).

10% é a carga do depósito.

Se você tem um depósito de $1.000, você o carrega em 10% - você abre uma negociação por $100.

Agora, ATENÇÃO, dependendo da alavancagem fornecida pelo seu corretor/treinador você pode comprar diferentes lotes - $10.000 (1:100), $5.000 (1:50), $20.000 (1:200).

P.S. fuckerbaby........