Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2649

 
Aleksey Vyazmikin #:

Que bom que você descobriu - eu não percebi imediatamente, obrigado pelo esclarecimento.

Mas, então, verifica-se que o algoritmo no primeiro estágio deve encontrar pares de preditores que serão melhor separados em caixas e, em seguida, aplicar o "peeling" a eles.

Não, ele funciona para qualquer número de preditores. Em cada etapa, é escolhido qual preditor e qual fatia (esquerda ou direita) é ideal para cortar. As árvores de decisão convencionais fazem a mesma coisa: a cada etapa, tanto o preditor quanto seu ponto de corte são escolhidos para serem ideais para produzir duas novas caixas. A única diferença com o PRIM é que uma fatia limitada é cortada a cada etapa, resultando em um processo gradual, daí a palavra paciente no nome.

Pessoalmente, acho interessante outra modificação da abordagem padrão, em que cada caixa é cortada não em duas, mas em três novas caixas. Vou refletir um pouco sobre isso em outro momento.

 
Aleksey Nikolayev #:

Darei minha opinião sobre isso em algum momento.

Talvez seja melhor perceber e testar
 
Aleksey Nikolayev #:

Não, ele funciona para qualquer número de preditores. Em cada etapa, escolhe-se qual preditor e qual fatia (esquerda ou direita) a ser cortada é a ideal. As árvores de decisão convencionais fazem a mesma coisa: a cada etapa, tanto o preditor quanto seu ponto de corte são escolhidos como ideais para produzir duas novas caixas. A única diferença com o PRIM é que, a cada etapa, uma fatia limitada é cortada, resultando em um processo gradual, daí a palavra paciente no nome.

Pessoalmente, acho interessante outra modificação da abordagem padrão, em que cada caixa é cortada não em duas, mas em três novas caixas. Em algum momento, apresentarei algumas considerações sobre isso.

https://xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html
 
Aleksey Nikolayev #:

Não, ele funciona para qualquer número de preditores. Em cada etapa, escolhe-se qual preditor e qual fatia (esquerda ou direita) a ser cortada é a ideal. As árvores de decisão convencionais fazem a mesma coisa: em cada etapa, tanto o preditor quanto seu ponto de corte são escolhidos como ideais para produzir duas novas caixas.

Portanto, eu não afirmei o contrário - funciona - é apenas uma questão de implementação - se você pegar dois preditores com bons limites arbitrariamente, a caixa não sairá - esse é o ponto! É por isso que presumi que a busca por pares acontece de uma só vez.

Aleksey Nikolayev #:

O PRIM difere apenas no fato de que, a cada etapa, uma parte limitada é cortada, o que leva a um processo gradual, daí a palavra paciente no nome.

Cortar - o que significa - um pequeno resíduo após a divisão condicionalmente perto da raiz da árvore?

Aleksey Nikolayev #:

Pessoalmente, acho interessante outra modificação da abordagem padrão, quando cada caixa é cortada não em duas, mas em três novas. Em algum momento, farei algumas considerações sobre isso.

Por que não 5? :) Sou totalmente a favor da experimentação!

 
mytarmailS #:
Talvez uma realização e um teste sejam melhores

Não acho que isso vá acontecer. Até o momento, há apenas uma suposição incoerente.

Suponha que saibamos com certeza, de algum lugar, que a regra importante é A<x1<B, mas por enquanto existe uma regra a<x1<b, em que a<A e B<b. Uma boa regra será obtida em pelo menos duas etapas, por exemplo, 1) a<x1<B e 2) A<x1<B. Na prática, isso pode significar que uma etapa de particionamento em um preditor diferente ficará acidentalmente entre essas duas etapas e essa regra importante simplesmente não aparecerá no final. Portanto, o número de pedaços de particionamento em cada etapa pode não ser fixo, mas determinado a partir de considerações de otimização. Então, em casos especiais (quase como no caso do seno em tempos de guerra), seu número pode ser igual a cinco.

 
Aleksey Vyazmikin #:

Cortar - o que isso significa - um pequeno remanescente após o corte convencional próximo à raiz da árvore?

Provavelmente, não há nenhuma ideia de construir uma árvore bonita - eles só querem cortar um "bom pedaço") Estou próximo da ideia de que se deve cortar pedaços adequados para negociação, em vez de fingir ser um azulejista que precisa pavimentar todo o espaço sem lacunas) Isso está de acordo com a antiga citação "não tente estar no mercado o tempo todo". Os casos em que os preditores não se enquadram em "bons pedaços" são simplesmente ignorados, de modo que as árvores acabam não sendo muito úteis.

Sim, abandonar a árvore faz com que seja necessário mexer em possíveis interseções de caixas, mas, se for para funcionar, as árvores não são ruins)

 
Maxim Dmitrievsky #:
h ttps:// xgboost.readthedocs.io/en/stable/tutorials/feature_interaction_constraint.html

Parece ser algo mais sério do que meus pequenos experimentos). Tem a ver com levar em conta a estrutura de dependência entre os preditores, que é conhecida antecipadamente.

 
Aleksey Nikolayev #:

Não acho que vá funcionar. Até o momento, é apenas uma suposição desconexa.

Suponha que saibamos com certeza, de algum lugar, que a regra importante é A<x1<B, mas por enquanto há uma regra a<x1<b, em que a<A e B<b. Uma boa regra será obtida em pelo menos duas etapas, por exemplo, 1) a<x1<B e 2) A<x1<B. Na prática, isso pode significar que uma etapa de particionamento em um preditor diferente ficará acidentalmente entre essas duas etapas e essa regra importante simplesmente não aparecerá no final. Portanto, o número de pedaços de particionamento em cada etapa pode não ser fixo, mas determinado a partir de considerações de otimização. Então, em casos especiais (quase como no caso do seno em tempo de guerra), seu número pode ser igual a cinco).

Use a regressão simbólica, projete exatamente o que você deseja, não o que os outros algoritmos oferecem.

Você conhece o Rku, há um pacote, há exemplos, tudo já foi feito antes e para nós.

 
Aleksey Nikolayev #:

Parece ser algo mais sério do que meus pequenos experimentos). Tem a ver com levar em conta a estrutura de dependência entre os preditores, que é conhecida antecipadamente.

Se apenas 1 e 2 puderem interagir. Ou 3,4,5. Então, após a primeira divisão, por exemplo, em 3, todas as divisões posteriores serão apenas do conjunto 3,4,5.
Presumo que isso simplesmente construa 2 árvores a partir dos conjuntos 1,2 e 3,4,5. Se houver 10 conjuntos, então haverá 10 árvores. etc.
 
Mas isso é um busting. Depois, a primeira árvore em um conjunto. A segunda árvore de refinamento em qualquer outro conjunto e assim por diante.