Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1144

 
Graal:

Eu não diria "exatamente assim", a fórmula em si é correta, mas não deve ser calculada por retornos de negócios, mas por retornos diários (horários, etc.). Não me parece, a fórmula em si está correcta, mas precisamos de comparar estratégias não por retornos de ordens, mas por retornos diários (horários, etc.), pelo mesmo passo, para todos os estratagemas, então podemos compará-las por performance dependendo deste valor de coeficiente, caso contrário se este número for calculado por ordens e o seu número significativamente diferente, não é importante, por exemplo 0.01 Sharpe para uma estratégia e 5 para outra, não é claro qual delas é melhor ou pior, apenas o sinal (acima ou abaixo de zero Sharpe) é importante.

Então, embora pantural não esteja exatamente falando sobre o clássico Sharpe Ratio, mas mesmo assim ele levantou uma questão importante sobre isso. Embora eu pessoalmente não prefira usar o Sharpe Ratio, prefiro o Ratio of Profit to Maximum Drawdown como medida de desempenho da estratégia.

Eu diria que depende da EA. Se gerar uma ordem distinta de negociações, ou seja, quando uma posição é aberta e fechada e seu volume não muda entre a abertura e o fechamento - é melhor contar por negociações. Se o volume da posição muda suavemente com o tempo, então a identificação dos momentos de uma troca é menos significativa e pode ser calculada usando seu próprio método.

O método pantural é melhor para vender TCs e encontrar investidores) Portanto, com o tempo, acho que eles vão mudar para ele)

 
Aleksey Nikolayev:

Eu diria que depende do Conselheiro Especialista. Se gerar uma seqüência clara de negociações, ou seja, quando uma posição é aberta e fechada e seu volume não muda entre a abertura e o fechamento - é melhor contar por negociações. Se o volume da posição muda suavemente com o tempo, então a identificação dos momentos de uma troca é menos significativa e pode ser calculada usando seu próprio método.

O método pantural é melhor para vender o TS e encontrar investidores) Portanto, com o tempo, acho que eles vão mudar para ele)

em qualquer caso, a pantural já não tem como objetar :))

O que estás a fazer agora, apenas a vaguear por aí? Não queres discutir algumas coisas normais no campo MO? :) Eu preciso de uma pessoa que saiba muito sobre fórmulas. O tema ficou vazio, não há ninguém com quem discuti-lo.
 
Maxim Dmitrievsky:

O que estás a fazer agora, a vaguear ao acaso? Não queres discutir coisas normais no campo do MoD? Preciso de alguém com um bom domínio das fórmulas. O tema foi esvaziado e não há ninguém com quem discuti-lo.

Em princípio, estou pronto a dar a minha opinião sobre qualquer assunto. Mas a disponibilidade de sentido para vocês nas minhas declarações não posso garantir)

 
Maxim Dmitrievsky:

Atirei-te a informação do bandido? É um tópico muito interessante, mas com muitas fórmulas.

Sim, eu acho que sim. Mas atualize o link e escreva o que aproximadamente interessa.

 
Aleksey Nikolayev:

Sim, acho que costumava haver uma coisa assim. Mas atualize o link e escreva o que, intrinsecamente interessado.

o link acima, interessado em bandidos adversários para processos não estacionários, com algoritmos combinatórios (aparentemente, algo como mgua). eu mesmo no processo de familiarizar-se com a informação ainda

mais sobre isso depois

 
Maxim Dmitrievsky:

No livro deles, encontrei isto imediatamente:

Tudo o que o aprendiz sabe é que o verdadeiro ambiente está em algum conjunto E chamado de classe ambiental.

Como você vê este E definido para negociação?

 
Aleksey Nikolayev:

No livro deles, encontrei-o imediatamente:

Tudo o que o aprendiz sabe é que o verdadeiro ambiente está em algum conjunto E chamado de classe ambiental.

Como você vê este E definido para negociação?

Bem, é um ambiente arbitrário para um bandido, por exemplo, um conjunto de indicadores

por exemplo, um indicador rsi, para simplificar, um conjunto de incrementos múltiplos de preços
 
Maxim Dmitrievsky:

Bem, é um ambiente arbitrário para o bandido, como um conjunto de indicadores

por exemplo, um indicador rsi, para simplificar, um conjunto de vários incrementos de preço

No entanto, não entendo como o seu modelo se relaciona com a negociação. Da sua definição de estratégia (política) decorre que apenas olham para as acções realizadas e para os seus resultados. Sobre o ambiente (na sua opinião - um conjunto de indicadores) eles não o vêem ou nem conseguem vê-lo.

At deve depender apenas do histórico Ht-1 = (A1 , X1 , . . . . , At-1 , Xt-1 ). Uma política é um mapeamento das histórias para as ações.

Além disso, seu ambiente parece até ser capaz de acompanhar nosso comportamento e, portanto, a recompensa dependerá não só da ação em si, mas também de toda a sua pré-história.

Um ambiente é um mapeamento de seqüências históricas que terminam em ações para recompensas.

 
Aleksey Nikolayev:

No entanto, não compreendo a relação entre o seu modelo e o comércio. Da sua definição de estratégia (política) decorre que eles apenas olham para as acções tomadas e para os seus resultados. Eles não olham para o ambiente (na sua opinião - um conjunto de indicadores) ou nem sequer o conseguem ver.

At deve depender apenas do histórico Ht-1 = (A1 , X1 , . . . . , At-1 , Xt-1 ). Uma política é um mapeamento das histórias para as ações.

Além disso, seu ambiente parece até ser capaz de acompanhar nosso comportamento e, portanto, a recompensa dependerá não só da ação em si, mas também de toda a sua pré-história.

Um ambiente é um mapeamento de seqüências históricas que terminam em ações para recompensas.

Se a política for aproximada por algum modelo (digamos linear), então só conseguimos uma solução sobre os novos dados e pronto, substituindo-os pelo modelo

o que você está descrevendo é um processo de encontrar as maiores recompensas

O principal problema com a não-estacionariedade é quando ela pára de trabalhar com os novos dados. Os bandidos instáveis estão lá descritos, mas ainda não cheguei até eles. É verdade que não há lá nada que eu já não saiba, como acontece :) Mas precisa de algumas ideias{soluções sobre como dar recompensas adequadamente

A propósito, ontem eu implementei exatamente o bandido linear, o resultado é algo parecido com isto:

Na verdade, o exemplo ainda é descrito no meu artigo, mas usa uma floresta aleatória em vez de uma floresta linear. Linear deve ser menos sobretreinado

 
Maxim Dmitrievsky:


Para ensinar sobre o futuro e testar sobre o passado é algo que você só vê neste fórum))))