Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2569

 
mytarmailS #:
Quem sabe se existe um teste de determinismo de tendências...
Você precisa saber se isto é realmente uma tendência ou uma flutuação aleatória...

Talvez o mesmo Hearst?


Testes para diferentes tipos de tendências fora da caixa

R best!!!!

Há um bom pacote de tendência em R. Para uma tendência linear, sens.slope() é bom a partir daí.

 
mytarmailS #:

O que há para entender sobre matemática financeira e RI, você precisa conhecer a mecânica do mercado e seus participantes

A multidão está destinada a perder na maioria dos casos, porque o seu contra-agente é um "grande jogador".

1) você precisa ver um desequilíbrio entre compradores e vendedores, por exemplo, se há muitos vendedores, então o "grande jogador" (o comprador) está do outro lado do negócio

Como agora no judeu, por exemplo, muitos vendedores

2) Há também negociação no momento contra a multidão - este é um criador de mercado

Vê-se sempre que o preço se move contra a multidão (correlação inversa).

Enquanto a multidão está a comprar e acredita no crescimento, o preço vai cair e vice-versa...

Esse é todo o mercado...


p.s. E eu vou ver o vídeo de certeza.

Também há problemas com isso, e não um pequeno problema. Temos apenas uma pequena fatia do mercado à nossa disposição, que não se sabe quão representativa e confiável é. A segunda imagem (sentimento geral) é inútil. Em primeiro lugar, as inversões ocorrem regularmente em extremos onde parece que a tendência "contra a multidão" deveria ter continuado. Em segundo lugar, a sanção simplesmente repete o preço (de cabeça para baixo e menos a tendência) - inverta qualquer oscilador e você obtém uma imagem muito semelhante. Bem, se o indicador repete o preço, significa que a sua previsão não é mais fácil do que o próprio gráfico de preços, certo? A primeira imagem (o vidro e as posições abertas) e o valor da relação de lucro são mais valiosos, mas também é assim... altamente questionável.


 
Aleksey Nikolayev #:

Não faz muita diferença (de um ponto de vista combinatório) como é exactamente codificado. A questão é a mesma - cada linha tem como características quais regras são aplicadas e quais não são. São sempre variantes 2^N, onde N é o número de regras. Depois disso cada uma dessas regras será incluída no conjunto final de 2^(2^N) variantes. É claro que é impossível tentar formalmente um número tão grande de variantes. É por isso que faz sentido arranjá-los de uma forma razoável. Por exemplo, primeiro pegamos todas as variantes descritas por apenas uma regra, depois todas as variantes descritas por apenas duas regras e assim por diante. Ou algo do género.

Talvez eu não esteja a explicar bem, mas quero salientar mais uma vez que estamos a trabalhar com a amostra inicial, que dentro do algoritmo de aprendizagem CatBoost é quantificada uma vez, ou seja Digamos que temos 1000 preditores, quantificamos cada um em 10 segmentos, como resultado temos 10000 segmentos - além disso o algoritmo CatBoost puxa aleatoriamente os preditores e correndo através das bordas/quanta faz uma divisão, para selecionar um quantum que está no meio, ele precisa construir 3 desigualdades ou criar 8 folhas, onde 7 folhas dirão disparates e uma dirá informações valiosas. Se o algoritmo vai construir tal árvore também não é certo, pois há um amor à aleatoriedade e um quantum vizinho pode entrar em uma folha. E que seja apenas uma árvore. No meu método uma desigualdade será suficiente - 2 folhas. Mesmo que todos os preditores sejam usados e cada um tenha 1 folha útil, o número de combinações ao criar o modelo será muito menor. Mas importante, também haverá menos ruído, pois não haverá tantas partições de amostra errôneas para estabilizar, que você precisa para construir uma nova árvore (princípio do boosting).

Aleksey Nikolayev # :

Mais cedo ou mais tarde muitos outros jogadores irão encontrá-los, por exemplo.

Então talvez se deva, de alguma forma, testar esta teoria? De acordo com o qual existe uma frequência mínima de recorrência de uma vantagem, após o aumento da qual é mais provável que ela desapareça, do que continue a existir?

Por exemplo, medimos a cada semestre, há uma vantagem de 1,5 anos - consideramos que meio ano vai funcionar, e se já são 2,5 anos não tem sentido e toma - a probabilidade é maior de que deixe de funcionar.

Não sou bom em fórmulas científicas, pode dizer-me como fazer este cálculo e verificar as hipóteses?

 
Aleksey Nikolayev #:

Há um bom pacote de tendências em R. Para uma tendência linear, sens.slope() é bom a partir daí.

obrigado

vladavd #:

Também há problemas com isso, e muitos poucos. Temos apenas uma pequena fatia do mercado à nossa disposição, que não sabemos o quanto é indicativo e confiável. O segundo quadro (sentimento geral) não é de todo útil. Em primeiro lugar, as inversões ocorrem regularmente em extremos onde parece que a tendência "contra a multidão" deveria ter continuado. Em segundo lugar, a sanção simplesmente repete o preço (de cabeça para baixo e menos a tendência) - inverta qualquer oscilador e você obtém uma imagem muito semelhante. Bem, se o indicador repete o preço, significa que a sua previsão não é mais fácil do que o próprio gráfico de preços, certo? A primeira imagem (o vidro e as posições abertas) e o valor da relação de lucro são mais valiosos, mas também é assim... altamente questionável.

Estás a perder-te em muitas coisas, és demasiado superficial e tens uma percepção irreflectida da informação.

 
Aleksey Vyazmikin #:

Talvez eu não esteja explicando bem, mas quero enfatizar novamente que estamos trabalhando com a amostra original, que dentro do algoritmo de aprendizagem CatBoost é quantificada uma vez, ou seja Digamos que temos 1000 preditores, quantificamos cada um em 10 segmentos, como resultado temos 10000 segmentos - além disso o algoritmo CatBoost puxa aleatoriamente os preditores e correndo através das bordas/quanta faz uma divisão, para selecionar um quantum que está no meio, ele precisa construir 3 desigualdades ou criar 8 folhas, onde 7 folhas dirão disparates e uma folha sobre informações valiosas. Se o algoritmo vai construir tal árvore também não é certo, pois há um amor à aleatoriedade e um quantum vizinho pode entrar em uma folha. E que seja apenas uma árvore. No meu método uma desigualdade será suficiente - 2 folhas. Mesmo que todos os preditores sejam usados e cada um tenha 1 folha útil, o número de combinações ao criar o modelo será muito menor. Mas importante, também haverá menos ruído, pois não haverá tantas partições de amostra errôneas para estabilizar, que você precisa para construir uma nova árvore (princípio do boosting).

Talvez você deva descrever sua abordagem em um exemplo de uma única árvore de decisão. Ainda assim, por si só, o impulso já constrói uma estrutura bastante complexa - uma sequência de árvores de refinação. E tuainda fazes outra coisa com ele).

Aleksey Vyazmikin #:

Então talvez precises de verificar esta teoria de alguma forma? De acordo com o qual existe uma frequência mínima de recorrência da vantagem, após o aumento da qual há mais probabilidade do seu desaparecimento, do que a continuação da sua existência?

Por exemplo, medimos a cada semestre, há uma vantagem de 1,5 anos - consideramos que meio ano ainda funcionará, e se já são 2,5 anos, não há sentido e pegamos - a probabilidade é maior de que deixe de funcionar.

Não sou forte em fórmulas científicas, pode me dizer como fazer tal cálculo e verificar a hipótese?

Algo como fórmula de radioatividade com meia-vida) Eu não acho que a atividade humana seja descrita por fórmulas tão simples) Sua "freqüência de vantagem" vai mudar, muito provavelmente de alguma forma muito imprevisível.

 
Aleksey Nikolayev #:

Talvez você devesse definir sua abordagem usando uma única árvore de decisão como exemplo. No entanto, o próprio impulso já constrói uma estrutura bastante complexa - uma sequência refinada de árvores. E tuainda fazes outra coisa com ele).

Sim, entendo que não é fácil entender imediatamente o método. Tenciono descrevê-lo com mais detalhes. E os dados são processados antes de serem submetidos ao CatBoost, mas eu quero fazer meu próprio algoritmo, que levará em conta as mudanças na dinâmica de "decadência", como você a chamou, ao se dividir.

Aleksey Nikolayev #:

Um pouco como uma fórmula de radioatividade com meia-vida) Eu não acho que a atividade humana seja descrita por qualquer fórmula tão simples) Sua "freqüência de vantagem" provavelmente mudará de alguma forma altamente imprevisível.

Pode não haver nada, mas como é que se verifica?

 
mytarmailS #:

obrigado

Estás a perder-te em muitas coisas, demasiado superficial e irreflectida sobre esta informação.

Sim, só trabalho com esta ferramenta há anos e ainda não pensei bem no assunto.

Com o que discorda exactamente?

 
Aleksey Vyazmikin #:

Sim, digamos que sim.

Não, agora tome a execução da regra da desigualdade como uma só e olhe para o valor médio da meta (digamos para a classificação binária) quando a regra é acionada pela amostra, se o valor médio inicial é, digamos, 0,45 na amostra, e após avaliação apenas por respostas é 0,51, então considere que o preditor (seu gráfico/quantum) tem um poder preditivo de 0,06, ou seja, 6%.

Reunimos muitos desses preditores com seções, que já são preditores binários independentes e os usamos para construir um modelo.

Combinar todos esses quanta com todos (com ou sem poder preditivo) não é de fato uma tarefa rápida, mas pode não ser irracional se for feita com um preditor de base no qual um quantum com poder preditivo é identificado.

Mas, mesmo em teoria, essa reciclagem seria menor, pois há menos combinações possíveis do que na amostra completa.

O que falta entender é por que tais padrões quânticos podem funcionar por 7 anos e depois parar de repente...

Compreendo bem o que estás a fazer?:


1) Temos 1 árvore.
2) Cada nó pode dar até 10 ramos (na figura encontramos menos, digamos 10 ramos), cada ramo é gerado por 1 quantum (um quantum é um pedaço de preditor em 10%: percentil ou 10% em amplitude, dependendo de qual método de quantização foi utilizado).
3) após a primeira divisão, encontramos 3 quanta, que posteriormente levam a uma folha bem sucedida
4) as divisões subsequentes encontram mais algumas boas divisões/quanta levando a folhas bem sucedidas
5) memorizamos os quanta bem sucedidos antes das folhas bem sucedidas
6) construímos uma nova árvore, que usa como preditores apenas os quanta que selecionamos

Para fazer isso com o mesmo método que quantificamos a primeira árvore, quantificar os preditores com nosso roteiro, obtemos 1000 preditores em 100, eles já são binários 0 ou 1. Se o valor do preditor estiver neste intervalo, ele = 1, se não estiver, ele = 0.
Como só selecionamos caminhos/quanta de sucesso, todos os valores do quanta selecionado = 1. Se todos os palpiteiros = 1, então a nova árvore não pode aprender. A resposta já é conhecida.

Ou já não há necessidade de construir uma nova árvore? Se o valor do preditor estiver dentro do quantum selecionado, vamos fazer isso imediatamente?

 
vladavd #:

Sim, eu só trabalho com esta ferramenta há anos, por isso não tenho pensado nisso de todo.

Discorda com o quê, exactamente?

Com que ferramenta exatamente?

 
mytarmailS #:

com que tipo de ferramenta?

Bem, o que está na fotografia? O copo e a sanção.