Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2651

 
mytarmailS #:



Isso é melhor?


=====================

Você pode complicar ainda mais as expressões

Sim, a lista é uma boa ideia.

Para criar um double real, você precisa de tipos de dados algébricos. Ainda não vi sua implementação no R e a otimização genética não funcionará com eles( não está claro que tipo de otimização funcionará com eles).

 

Não sei quanto a você, mas estou fascinado por esse algoritmo... Como as variáveis simples na parte inferior se somam a expressões grandes e complexas na parte superior, uma hierarquia, assim como na natureza....

 
Aleksey Nikolayev #:

Sim, a lista é uma boa ideia.

Para criar um double real, você precisa de tipos de dados algébricos. Ainda não vi sua implementação no R e a otimização genética não funcionará com eles( não está claro que tipo de otimização funcionará com eles).

Bem, sim, há limitações, porque cada dígito do GP é um elemento separado na lista, portanto, se houver muitos deles, haverá problemas(( , mas você pode sair dessa situação, como mostrei

 
mytarmailS #:

Não sei quanto a você, mas estou fascinado por esse algoritmo... Como as variáveis simples na parte inferior se somam a expressões grandes e complexas na parte superior, uma hierarquia, assim como na natureza....

Como ele é melhor que o MSUA? Você pode ficar fascinado por qualquer coisa, desde que seja útil).
 
Maxim Dmitrievsky #:
Como isso é melhor do que o MSUA? Você pode ficar fascinado por qualquer coisa, desde que seja bom para você).
Bem, é diferente.
A regressão simbólica é uma estrutura na qual você pode implementar qualquer lógica, só que é conveniente porque você não precisa escrevê-la sozinho....

E essa implementação de regras, sim, é muito semelhante à mgua - geração de recursos + seleção de recursos + criação de modelo
Tudo em um, como o mgua.
Bem, se você comparar essa implementação específica com o mgua:
O MGUA não consegue lidar com um grande número de recursos, pois é um exagero completo.
Isso é ruim, mas o mgua encontra a melhor solução garantida, o que é bom.

Nessa implementação, é exatamente o oposto
 
mytarmailS #:
Bem, é diferente.
A regressão simbólica é uma estrutura na qual você pode implementar qualquer lógica, o que é conveniente porque você não precisa escrevê-la sozinho....

E essa implementação de regras, sim, é muito semelhante à mgua - geração de recursos + seleção de recursos + criação de modelo.
Tudo em um, como o mgua.
Bem, se você comparar essa implementação específica com o mgua:
O MGUA não consegue lidar com um grande número de recursos, pois é um exagero completo.
Isso é ruim, mas o mgua encontra a melhor solução garantida, o que é bom.

Nessa implementação, é exatamente o oposto
Ah, sim, é um exagero genético e provavelmente há esquemas padrão para combinar características.
 

Um pouco sobre invariância a eventos

Suponhamos que queiramos descrever um padrão de cabeça e ombros (vamos supor que esse padrão exista) , nosso algoritmo analisa os últimos pontos H, digamos 7, como no exemplo

O retângulo verde mostra o escopo do algoritmo. Os últimos H-points, neste exemplo, 7 peças.

Os dados nesse formato são processados, alimentados no AMO etc., janela deslizante etc. Todos sabem disso...

Se descrevermos a regularidade por regras, será algo como x[1] < x[2] & x[2] > x[3] etc.....

Mas, na realidade, o mercado muda, se estende/encolhe, as amplitudes mudam, etc.....


Aqui está a realidade do mercado, e todos nós olhamos para os últimos 7 pontos e esperamos que nossa regra x[1] < x[2] & x[2] > x[3]... funcione )).

Como você pode ver, há um padrão, ele não foi a lugar algum, mas nosso GPT-5 de 10 camadas não verá nada).


Conclusões: todos os algoritmos de AMO "prontos para uso" funcionam com dados tabulares, ou seja, todos os algoritmos estão procurando padrões com vinculação rígida a índices, mas isso não funciona....

1) É necessário buscar algoritmos como regras associativas, que estão vinculadas a eventos, sequência de eventos, mas não estão vinculadas a índices.

2) Ou projetar nós mesmos as regras corretas e criar modelos a partir delas

3) Ou usar para o AMO a representação de dados usada para algoritmos de regras/sequências associativas, mas o número de recursos será de bilhões.

 
Aleksey Nikolayev #:

Não está claro que tipo de otimização funcionará com eles

O que você quer dizer com isso? Há uma otimização contínua que é dupla e uma otimização discreta que é inteira. Ou eu não entendi direito?

A GP é discreta, por isso há problemas com a dupla
 

Sobre o poder da diversificação

Digamos que temos uma UC que não está rendendo muito bem, não está nem um pouco bem.

Essa é sua curva de rendimento.

Na verdade, é um ruído aleatório com uma tendência muito fraca adicionada, a tendência é tão pequena que não é visível ao olho no ruído.

Aqui está a tendência.

Essa é uma estratégia que não permitiremos que seja negociada).

Mas e se tivermos 100 dessas estratégias não correlacionadas que são negociadas simultaneamente em uma conta?

Isso não é muito bom. E se tivermos 1.000 estratégias?

E 100 mil estratégias?

Isso é muito legal.

É possível gerar tantas estratégias com o MO? ....

 
mytarmailS #:
O que você quer dizer com isso? Há uma otimização contínua que é dupla e uma otimização discreta que é inteira. Ou não estou entendendo?

O GP é discreto, por isso há problemas com o duplo

Escrevi lá sobre tipos de dados algébricos. Eles generalizam tipos de dados complexos, como listas e árvores. Eles combinam uma estrutura discreta complexa e um conjunto de números reais armazenados nessa estrutura (que acaba sendo de tamanho não fixo). Assim, temos que combinar de alguma forma a otimização discreta na estrutura e a otimização contínua nos números armazenados nela. Não tenho a menor ideia de como fazer isso, pelo menos teoricamente.