Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3101

 

Se medirmos a porcentagem de sinais de um tipo em cada mês da amostra para um segmento quântico separado e subtrairmos a porcentagem média de sinais lucrativos e construirmos um equilíbrio nos dados, poderemos ver o seguinte.

Esse é o segmento quântico selecionado de acordo com meu método, e o que vemos é que, do 38º ao 127º mês, houve uma tendência estável e, depois, começaram as flutuações.

Portanto, se a amostra for dividida de acordo com o método clássico 60+20+20, aprenderemos e tudo estará bem até cerca de 100 meses; depois, aos 40 meses, até 140, estaremos no positivo e, já na amostra independente para teste, veremos um movimento descendente com uma recuperação. Ao mesmo tempo, podemos ver que houve movimentos semelhantes na amostra para treinamento antes do 38º mês, mas que modelo os levará em conta e encontrará uma "explicação" para essas flutuações? Um modelo de madeira comum começará a extrair um pedaço de toda a amostra, enquanto é necessário prestar atenção em apenas uma parte dela.

É nisso que estou pensando, em uma maneira de criar um modelo que leve em conta as nuances descritas acima - e faça divisões não em toda a peça, mas como se fosse levar em conta separadamente as alterações em cada seção após a mesma divisão.

Talvez eu esteja reinventando a roda novamente e já exista uma solução? Eu já esbocei o sistema no papel, mas o código ainda está longe de ser desenvolvido....

 

Bem, este é o aspecto do histograma (de acordo com a versão do Excel)

Você pode ver que há meses em que os padrões não funcionaram.... e eles devem ser explicados por outras divisões, mas, de preferência, removendo-os onde eles se acumulam.

 

E o que eu quero - se não for treinar o modelo com tanto afinco, pelo menos detectar com antecedência, talvez de forma probabilística, a seção de mudança de uma mudança positiva no segmento quântico da probabilidade de um resultado favorável para uma negativa.

Aqui estamos pensando no alvo, a amostra já está se formando.

 

Se representarmos a porcentagem do delta de resultados positivos e negativos no segmento quântico de um mês como +1/-1, o gráfico já terá essa imagem, e já parecerá mais interessante.


 
Há um cortador de merda quântico que está tendo um desempenho ruim em algum lugar. O que fazer? Fazer a média de seus sinais com base nos novos dados em que ele teve um desempenho ruim, de modo que ele não tenha um desempenho tão ruim lá, mas também não tenha um desempenho tão bom em dados anteriores.
Qual é a pergunta, essa é a resposta, não se desculpe
 
Maxim Dmitrievsky #:
Há uma porcaria de corte quântico que está tendo um desempenho ruim em algum lugar. O que fazer? Fazer a média de seus sinais com base em novos dados nos quais ele teve um desempenho ruim, de modo que ele não tenha um desempenho tão ruim lá, mas também não seja tão bom em dados anteriores.
Qual é a pergunta, essa é a resposta, não se desculpe

Média, subtração e divisão :)

De qualquer forma, pelo que entendi, você está sugerindo mudar o alvo no local onde está o sinal "ruim"?

 
Valeriy Yastremskiy #:

Alexei Nikolaev em blogs sobre R implementou um modelo do jogo Cafe, ou a vitória da minoria, semelhante em termos de mercado, se a posição do jogador estiver em uma sociedade com menos participantes, ele ganha (no café, de acordo com a data, os jogadores que vieram no dia com o menor número de visitantes ganham, e com um grande número de visitantes perdem), mas esse é um modelo muito simples, na vida real ainda há muitos tipos de jogadores, desde o estado e outros grandes jogadores e pequenos jogadores, que são um grande número. O modelo ainda não foi criado de forma aproximada)

Mas os gráficos são muito parecidos com o tick wandering.

O modelo SB na precificação é uma variante básica e limitante, que aparentemente nunca acontece na realidade, como um análogo da física - um gás ideal. Esse modelo é obtido sob duas condições - a) um grande número de participantes; b) independência absoluta de suas estratégias de negociação em relação a outros participantes. É claro que a segunda condição é difícil de ser cumprida, portanto, podemos investigar como os desvios do modelo SB serão influenciados se, por exemplo, houver vários grupos (clusters) de participantes com estratégias diferentes no mercado. Ou se uma parte dos participantes tiver informações privilegiadas. Por definição, é impossível ganhar dinheiro com o SB puro; você só pode ganhar dinheiro com desvios dele.

 
mytarmailS #:

Pessoalmente, não vejo nenhuma utilidade para o modelo SB.

Ele não fornece nada, não enfatiza as boas propriedades, não suprime as propriedades ruins, não simplifica.

Sim, o gráfico se parece com preços, e daí?

É claro que o modelo SB em si é de pouca utilidade, ele só é útil quando os desvios do modelo são diagnosticados.

 
Maxim Dmitrievsky #:

Chamo de estacionariedade o termo econométrico usual: constância da média e da variância. Os mercados naturalmente não têm isso, eles não são um "monumento". A heterocedasticidade é removida, o restante está próximo do SB.

Em geral, o tipo de distribuição diz pouco sobre a previsibilidade. Trata-se de um jogo matemático, distante da negociação. Adicione um pouco de fluidez à cotação que cubra o spread. Ou um retorno constante à média em determinados momentos do dia. O spread não mudará, e será possível ganhar dinheiro. Isso e coisas do gênero podem ser chamadas de ineficiência. Para isso, escreva algoritmos levando em conta o fato de que não é possível prever tudo, e não é necessário. Eu não diria que existe essa maldição, apenas que existem ferramentas realmente eficientes das quais não se pode tirar nada.

É claro que sim, mas se você criar modelos de precificação com desvios compreensíveis do SB, poderá, por exemplo, gerar cotações artificiais com base nisso, mesmo que por mil anos. Em seguida, com base nessa cotação, aprenda com a ajuda do MO a determinar os locais onde houve desvios e tente fazer o mesmo com as cotações reais. Alternativamente.

 
sibirqk #:

O modelo SB em si é, obviamente, de pouca utilidade; ele é útil somente quando os desvios desse modelo são diagnosticados (encontrados).

Alexei Nikolaev disse a mesma coisa.
Qual é o nome dessa abordagem?