Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1396

 
Elibrarius:
Eu gosto de florestas. Se eu voltar para a NS, não será por muito tempo. Eu já passei um ano com eles.

ok )

 
elibrarius:

Eu não me esforço pela absoluta correção de uma previsão. Para mim, todos os negócios que dão lucro estão correctos.
Exemplos:

1) previu -10 obteve -8 - este é um excelente lucro, não um erro
2) previu -4,8 obteve -13 - lucro muito mais do que o previsto, isto é ainda mais não um erro.
3) previu -3,5 obteve +5, haverá uma perda - isto é um erro. Tal como todos os pontos à esquerda e acima de 0. Só que eles vão fazer uma perda e é um erro trocar sobre eles.

Você está absolutamente correcto no seu entendimento. Tudo o que necessitamos é de uma distorção da distribuição de probabilidades de negócios bem sucedidos para o nosso lado. Além disso, paradas, trailing stops e outros métodos de apoio à transação não foram cancelados, e o resultado real será melhor do que um fechamento estúpido de uma posição em 5 metros. Este é o caso da fotografia.

A robustez de que a Maxim fala no mercado é uma fantasia infundada. Se houver desvios reais da regressão (não importa o treinamento ou teste), nenhum modelo é capaz de zerar esses desvios. Em qualquer caso, os desvios permanecerão como estavam. A regressão irá sempre para o centro da distribuição, e nada mais.

Maxim, infelizmente, recuou para as florestas e RL, e percebe todas as informações externas como um ataque à sua visão de mundo e, talvez, ao significado dos seus resultados). Tudo está errado com ele, todos os disparates, jardim-de-infância, etc.

Quanto à mudança de NS para árvores florestais. São modelos mais ou menos equivalentes, e você não receberá nada de novo, ou no nível - os mesmos ovos, apenas no perfil. Ver o que a besta é, claro, não é irrazoável.

Mudar para Alglib nos MCLs pode dar-lhe algo a curto prazo. A longo prazo não é mais do que uma perda de ritmo, um beco sem saída. O mesmo Maxim já está rastejando para Python, e você está agitando para que o MO em Alglib-MCL assuma o controle. É engraçado.

 
Yuriy Asaulenko:

Tens toda a razão. Tudo o que precisamos é de uma distribuição distorcida da probabilidade de uma troca bem sucedida na nossa direcção. Além disso, paradas, trailing stops e outros métodos de suporte à transação não foram cancelados, e o resultado real será melhor do que um fechamento estúpido do negócio após 5 m. Este é o caso da fotografia.

A robustez de que a Maxim fala no mercado é uma fantasia infundada. Se houver desvios reais da regressão (não importa o treinamento ou teste), nenhum modelo é capaz de zerar esses desvios. Seja como for, o que eles eram é o que vão continuar a ser. A regressão irá sempre para o centro da distribuição, e nada mais.

Maxim, infelizmente, foi para a floresta e RL e vê todas as informações externas como um ataque à sua visão de mundo, e talvez o significado dos seus resultados). Tudo errado, todas as parvoíces, jardim de infância, etc.

Quanto à mudança de NS para andaimes. São modelos mais ou menos equivalentes, e você não recebe nada de novo, ou a um nível - os mesmos ovos, apenas em perfil. Para ver que tipo de besta não é supérflua, é claro.

Mudar para Alglib nos MCLs pode dar-lhe algo a curto prazo. A longo prazo não é mais do que uma perda de ritmo, um beco sem saída. O mesmo Maxim já está rastejando para Python, e você está agitando para que o MO em Alglib-MCL assuma o controle. É engraçado.

O andaime tem menos parâmetros para o próprio modelo. Em NS há mais deles e é difícil encontrar a combinação ideal, além de que você precisa de normalização e alinhamento. E o racionamento e a escalada flutuarão com o tempo, como resultado, o mesmo retreinamento não será correto. E as florestas digerem tudo em valores absolutos.

 

pelo menos aprender a interpretar correctamente a trama de dispersão, e isso é uma coisa boa.

Então você começará a entender que os erros tendem a crescer em vez de se anularem uns aos outros, e que o que é tomado como uma distribuição distorcida de probabilidade de um ponto é uma coisa momentânea que se soma a grandes erros

 
elibrarius:

A floresta tem menos parâmetros do próprio modelo. Mas existem mais em NS e é difícil encontrar uma combinação ótima, além de que você precisa de normalização e alinhamento. E o racionamento e a escalada variam com o tempo, como resultado o mesmo retreinamento não será correto. E as florestas digerem tudo em absoluto.

Não posso falar por todos eles, mas os modelos de andaimes que vi também precisam de ser escalados e assim por diante. A propósito, e eu não entendo como tudo isso pode funcionar sem pré-processar os sinais de entrada. Imagine dois sinais aproximadamente idênticos, um dos quais tem um preço inicial 10% mais alto do que o outro. E a volatilidade da maior (idêntica) será automaticamente 10% maior do que a primeira. Como isto pode ser tratado por NS ou Forest? E o resultado será idêntico.

 
Maxim Dmitrievsky:

pelo menos aprender a interpretar correctamente a trama de dispersão, e isso é uma coisa boa.

Então você começará a entender que os erros tendem a crescer em vez de se anularem uns aos outros, e que o que é tomado como uma distribuição distorcida de probabilidade de um único ponto é uma coisa momentânea que se soma a grandes erros

Maxim, aprende a ler os gráficos, não apenas os teus. Se os meus gráficos não te dizem nada, não posso fazer nada. Se você não quer, não lide com eles, ninguém está forçando. Honestamente, estou cansado de ti. Não quero dizer que estás a dizer disparates, mas eu tenho de o fazer.

 
Yuriy Asaulenko:

Maxim, aprende a ler gráficos, não apenas os teus próprios. Honestamente, estou cansado de ti. Não quero dizer que estás a dizer disparates, mas eu tenho de o fazer.

Então como você lê seus gráficos? Há alguma maneira especial de lê-los, ao contrário das convencionais? Ali está Elibrarius, não sei quanto ao pai dele, ele nem conseguia lê-lo bem.

Acabei de escrever o que vejo nestes gráficos... não se podem tirar conclusões.

e especificamente - o erro é um pouco melhor do que aleatório, talvez na ordem de 40%

 
Yuriy Asaulenko:

Não posso falar por todos eles, mas os modelos de andaimes que vi também precisam de ser escalados e assim por diante. A propósito, e eu não entendo como tudo isso pode funcionar sem pré-processar os sinais de entrada. Imagine dois sinais aproximadamente idênticos, um dos quais tem um preço inicial 10% mais alto do que o outro. E a volatilidade da segunda (idêntica) será automaticamente 10% superior à da primeira. Como isto pode ser tratado por NS ou Forest? E o resultado seria idêntico.

A floresta processará insumos com valores e volatilidade que diferem por ordens de magnitude.

Um deles irá dividir-se em nós, por exemplo por 0,00014, e o segundo por 41548,3.

E para a NS precisamos de reduzir todos os inputs para a mesma escala.

 
Maxim Dmitrievsky:

Como você lê seu horário? Há alguma forma especial de leitura, ao contrário das convencionais? Von Elibrarius, eu não sei sobre o patriarca, nem sequer o conseguia ler correctamente.

Acabei de escrever o que vejo nestes gráficos... não se podem tirar conclusões.

e especificamente o erro é ligeiramente melhor do que aleatório, talvez da ordem de 40%.

E daí? O que há de errado nisso? Se você levar 10 minutos, tudo será irreconhecível, e é difícil imaginar isso em uma hora).

 
elibrarius:

A floresta irá digerir insumos com diferenças de valor e volatilidade de ordens de magnitude.

Um deles irá dividir-se em nós de, por exemplo, 0,00014 e o outro em 41548,3.

E para os NS precisamos de reduzir todos os inputs a uma escala.

Eu não estou ciente disso. Eu só falei das florestas que vi. Para toda a Odessa não dirá.