Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 156

 
E, a propósito, as percentagens cósmicas a longo prazo são ganhas em 5 minutos, com um aumento correspondente nas transacções, por isso..... tudo se encaixa....
 
Alexey Burnakov:


2) bem, sim... mas este Sharpe 2-3 como é calculado? Como é que os fundos calculam, ou melhor, como é que eles determinam que esta é a verdadeira estimativa Sharpe num comércio real?


A questão é que nos modelos, o Sharp é a relação de retorno ao risco, há muitas variações, o que contar como retorno, como a estúpida porcentagem de crescimento ou regressão da dinâmica de crescimento, e o risco é CKO ou drawdown máximo, etc. As diferenças não são fundamentais, mas se 2-3 fosse uma realidade todos seriam bilionários, em negociações reais por várias razões sai muitas vezes menos, mesmo quando é feito pela equipe de doutorado. Mas muito tem a ver com capacidade, se muitos modelos trocarem por $100K ou mesmo até $10M a situação seria muito mais agradável, mas isso nem sequer pagaria o investimento e os salários com bónus dos empregados.

 
J.B:

Isso é o que acontece com os modelos, Sharpe é a relação de retorno ao risco, há muitas variações do que contar como retorno, como o estúpido crescimento percentual ou regressão da dinâmica de crescimento, e o risco é CKO ou drawdown máximo, etc. As diferenças não são fundamentais, mas se 2-3 fossem reais todos seriam bilionários, em negociações reais por várias razões ele sai vezes menos, mesmo quando feito pela equipe de doutorado. Mas muito disso tem a ver com a capacidade, se muitos modelos fossem comercializados a $100K ou mesmo até $10M a situação seria muito mais agradável, mas isso nem sequer pagaria o investimento e os salários com bónus dos funcionários.

O doutoramento não é um indicador. A reconversão será tão boa quanto a Sra. e a Bs. Daí a forte queda na métrica sobre o real.
 
Alexey Burnakov:

Bem, está bem.

Suponha que eu não estou classificando o ganho por cima/baixo, mas construindo um modelo de regressão. Portanto, R^2 ou alguma outra métrica determinística (por exemplo, métrica robusta de desvio absoluto) está bem.

Quanto à informação mútua - é infundada ou há fortes indícios de que a métrica não funciona de forma confiável? Eu tenho as minhas dúvidas.

Atualização: Eu fiz muitas pesquisas sobre dados sintéticos e reais usando informações mútuas. Se a dependência é estacionária, a métrica funciona bem em todos os lugares. Se a dependência estiver à beira do ruído, a métrica pode mostrar dependência zero. Mas, no geral, não vejo nenhuma razão para o seu pior desempenho em sistemas multivariados não lineares do que, por exemplo, o F1. Você pode ler sobre isso aqui:https://habrahabr.ru/company/aligntechnology/blog/303750/

Mas quando eu classifiquei um movimento de preços incremental eu tive aproximadamente a seguinte imagem (para 5 pares de moedas juntos, ou seja, um modelo para todos):


Isso é pelo menos a mediana dos valores de precisão em 50 amostras pendentes na região de 57%, no máximo. Para pares de moedas individuais, eu alcanço precisão mediana acima de 60%. Isto é apenas sobre os dados das séries cronológicas.

Desculpe, não há tempo para dar evidências sólidas, os dados de mercado não são estacionários e as dependências não são lineares, simular por exemplo um ruído fractal de 10 dimensões em 2d como este: vermelho uma classe verde a outra apenas em 10d

Como você vê, não são as dependências gaussianas um monte de "ilhas" e assim por diante. Bem, então calcule qual é a eficiência do uso de informação mútua ou r^2 ao adicionar e remover uma dimensão à medida que a classificação cai. R^2 é geralmente linear, em caso de separação da hipersuperfície de topologia complexa e muitas ilhas tudo é triste. Você não pode passar sem os critérios estatísticos clássicos aqui, você mesmo pode verificá-lo. E se houver 100d ou 1000d de tal confusão?

 
J.B:

Desculpe, não há tempo para dar evidências fortes, os dados de mercado não são estacionários e as dependências não são lineares, simular, por exemplo, ruído fractal dimensional 10 em 2d assim: vermelho uma classe verde a outra apenas em 10d

Como você vê, não são muitas as dependências gaussianas, existem "ilhas" e assim por diante. Bem, então calcule qual é a eficiência do uso de informação mútua ou r^2 ao adicionar e remover uma dimensão à medida que a classificação cai. R^2 é geralmente linear, em caso de separação da hipersuperfície de topologia complexa e muitas ilhas tudo é triste. Você não pode passar sem os critérios estatísticos clássicos aqui, você mesmo pode verificá-lo. E se houver 100d ou 1000d de tal confusão?

Não é provável...

Não me consegues entender. Estou a dizer, não estou a classificar, estou a construir um modelo de regressão. O que é que a classificação tem a ver com isso... Não estou a comandar hiper-aviões. Estou a fazer uma modelação condicional do valor mediano do alvo e a medir a sua qualidade através da análise de resíduos. É sempre assim que se faz.

Se estamos falando de classificação, então a exigência de normalidade de algo não é necessária, por exemplo, se a probabilidade de algo estar próximo de zero. A não-linearidade e a multidimensionalidade é apenas o escopo da informação mútua. Acho que não estás a par desta questão...

 
Dimitri:

10% é a carga do depósito.

Se você tem um depósito de $1.000, você o carrega em 10% - você abre uma negociação por $100.

Agora, ATENÇÃO, dependendo da alavancagem fornecida pelo seu corretor/treinador você pode comprar diferentes lotes - $10.000 (1:100), $5.000 (1:50), $20.000 (1:200).

P.S. fuckerbaby........


Não jures por um tópico leve...

Vamos fazer as contas.

Primeiro exemplo. Tenho 500 dólares. Um microlote vale 1000 dólares. Eu abro uma negociação com um microlote (porque compras de quantidades maiores não cabem mais dentro do limite de risco inerente) e assim uso alavancagem 1:2. Como o dealer me dá uma alavancagem máxima de 1:100, eu carrego meu depósito com 2% para comprar $1000 / 100.

Segundo exemplo. Se eu abrir 5 negociações, com o mesmo nível de capital, carrego meu depósito em 10% e uso alavancagem 1:10 (0,01 * 100000 * 5 / 500).

Ou seja, a alavancagem máxima fornecida depende apenas da percentagem da carga do depósito e dá-me a oportunidade de abrir o corte inteiro. A verdadeira alavanca envolvida fica ao meu critério. Mas o mínimo é de 1:2 para os meus investimentos.

Está tudo claro agora?

 
Alexey Burnakov:

Não jures por um tópico leve...

Vamos fazer as contas.

Primeiro exemplo. Eu tenho 500 dólares. Um microlote custa 1000 dólares. Eu abro uma negociação com um microlote (porque compras de quantidades maiores não cabem mais dentro do limite de risco inerente) e assim uso alavancagem 1:2. Como o dealer me dá uma alavancagem máxima de 1:100, eu carrego meu depósito com 2% para comprar $1000 / 100.

Se eu abrir 5 negociações, com o mesmo nível de capital, carrego o depósito em 10% e uso alavancagem 1:10 (0,01 * 100000 * 5 / 500).

Estamos entendidos agora?

Você está a usar a mesma vantagem que a cozinha lhe proporciona. Você não varia a alavancagem (ela é dada - uma constante), mas a quantidade de capital que você usa para uma determinada alavancagem.

Mais uma vez - que vantagem a cozinha lhe dá para o seu tipo de conta? 1:100?

 
Dimitri:

Você usa a mesma vantagem que a cozinha lhe proporciona. Não é a alavancagem que você está usando (é uma constante definida), é a quantidade de capital que você está usando para uma determinada alavancagem.

Mais uma vez - que vantagem a cozinha lhe dá para o seu tipo de conta? 1:100?


Alavancagem máxima - sim, 1:100. Mas eu não o uso. Mais uma vez.

 
Alexey Burnakov:

Não é probatório...

Não me consegues entender. Eu digo, eu não classifico, eu construo um modelo de regressão. O que é que a classificação tem a ver com isso... Não estou a comandar hiper-aviões. Estou a fazer uma modelação condicional do valor mediano do alvo e a medir a sua qualidade através da análise de resíduos. É sempre assim que se faz.

Se estamos falando de classificação, então a exigência de normalidade de algo não é necessária, por exemplo, se a probabilidade de algo estar próximo de zero. A não-linearidade e a multidimensionalidade é apenas o escopo da informação mútua. Acho que não estás a par desta questão...

Bem, como não uma classificação, vamos tomar por exemplo 1000 fatores, uma rede neural profunda com bem, por exemplo 100 saídas que dão probabilidades de movimentos para cima/para baixo de um determinado instrumento em diferentes horizontes temporais. Isso é uma regressão? A regressão é quando o preço é previsto.

Você pode usar informações mútuas, enquanto nós devemos simplesmente olhar através dos fatores e calcular a porcentagem de influência de cada um deles sobre a previsão final, para um modelo específico, o que é ainda pior. googleNet em termos de sofisticação. Não precisamos de regressão, não nos importa exatamente quanto um ativo valerá, complica o modelo e não tem sentido, o principal é que por N segundos ele se moverá na direção certa com uma determinada probabilidade.

 
Alexey Burnakov:

A alavancagem máxima é sim, 1:100. Mas eu não o uso. Vou dizer novamente.

OK, se você não entende as coisas elementares, então não vale a pena discutir.

Em resumo, você tem que dividir seu interesse pela porcentagem do fundo de hedge por cerca de 10.