Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2581

 
Maxim Dmitrievsky #:
Com python é conveniente agora. Eu escrevi o meu testador, mas é possível portar modelos ou negociar através da api. Se ONNX for adicionado, será um verdadeiro canhão.

Entrei em contacto com a M1 mac, agora estou à espera há meio ano pela chegada da catbusta, eles prometem uma libertação dentro de 2 semanas. Até agora via máquina virtual em vin.
Há um pacote de pitão para o backtest, porque não o usas?

Ou você escreveu um testador com otimização?
 
mytarmailS #:
Existe um pacote backtest para python, porque não o usa?

Ou você escreveu um testador com otimização?
Eu não gosto de prontas, elas não são flexíveis o suficiente. Eu o escrevi especificamente para minhas tarefas com minhas próprias métricas. Grosso modo, para citações de entrada e resultados de modelos. Além disso, agora tenho 2 modelos "contraditórios" que são reeducados várias vezes, melhorando de forma iterativa. Os resultados para melhorias também são retirados do meu testador.
 
Maxim Dmitrievsky #:
Um modelo aprende a negociar, o outro filtra sinais.
Compreendo que está na moda criar algoritmos generativos, mas qual é a verdadeira vantagem de dois algoritmos condicionalmente simples que estão a convergir e a melhorar um ao outro a partir de um algoritmo complexo que o faz em si mesmo, só que, grosso modo, constrói regras de decisão mais complexas em si mesmo do que os seus dois...
Honestamente não entendo os benefícios, é apenas uma moda
 
mytarmailS #:
Bem, eu entendo que agora está em voga a generativamente acalmar algoritmos, mas qual é a real vantagem de dois algoritmos condicionalmente simples que se acalmam e melhoram um ao outro a partir de um algoritmo complexo que o faz em si mesmo, apenas falando de forma aproximada constrói regras de decisão mais complexas em si mesmo do que os seus dois...
Honestamente não entendo os benefícios, é apenas uma moda
Então eu criei algo como isto e vi que é bom ) O problema é erros de modelo e encontrar padrões realmente estáveis, no autômato. Essa é a ideia básica desde o início. É aí que as abordagens já podem ser diferentes. Um modelo não pode corrigir-se a si mesmo, dois podem.

Digamos que você treina uma modelo, ela é má. O que fazer? Passar por algo sozinho? Nem pensar, o homem não nasceu para o trabalho duro, você substitui o homem por um segundo modelo.
 
Maxim Dmitrievsky #:
Digamos que se treina um modelo, é mau. O que você faz? Você mesmo tem que trabalhar em algo? Não, o homem não nasceu para um trabalho intensivo, você substitui a pessoa por um segundo modelo.
Ouça, finalmente familiarize-se com algoritmos de optimização e funções de fitness e pare de reinventar a bicicleta sobre rodas quadradas
 
mytarmailS #:
Veja, conheça algoritmos de otimização, funções de fitness e pare de reinventar a bicicleta sobre rodas quadradas
Isto é diferente. Através da otimização, haverá um ajuste. Através da análise e correção de erros do modelo também é um ajuste, mas você encontra padrões estáveis ao jogar fora coisas desnecessárias. Pelo menos você encontra algum planalto onde há estabilidade. Através de simples enumeração genética é mais difícil, mais uma punheta.
 
Maxim Dmitrievsky #:
Isto é diferente. Através da otimização, haverá um encaixe. Através da análise e correção de erros de modelo também é um ajuste, mas você encontra padrões estáveis, descartando coisas desnecessárias. Pelo menos você encontra algum planalto onde há estabilidade. Através de simples enumeração genética é mais difícil, é mais uma punheta.

Exemplo elementar.

você precisa treinar a AMO para obter o máximo lucro o que você vai fazer?


1) você faz um alvo

2) você combina os modeloscom métricas padrão como RMSE (isto é profundamente irrelevante)

3) criar um grupo de melhores modelos

4) escolher o melhor modelo do grupo com o maior lucro


Por que você acha que o seu grupo é o modelo de topo absoluto no sentido global? Você passou os modelos por dois filtros subjetivos

(1) o seu alvo e (2) a medida de erro RMSE.


Não é melhor mudar os pesos (se for um neurónio) e criar regras (se for uma árvore) com o objectivo de obter o máximo lucro, a questão é retórica ... claro, é melhor e mais rápido

A questão é que você está perdendo outros grupos de modelos que ganham e esses grupos ganham milhões

 
mytarmailS #:

Um exemplo elementar.

você precisa treinar a AMO para maximizar os lucros o que você vai fazer?


1) você faz um alvo

2) você encaixa os modeloscom métricas padrão, como RMSE (isto é profundamente irrelevante)

3) criar um grupo de melhores modelos

4) escolher o melhor modelo do grupo com o maior lucro


Agora uma pergunta: por que você acha que o seu grupo é o topo absoluto dos melhores modelos no sentido global? Você passou os modelos por dois filtros subjetivos

(1) o seu alvo e (2) a medida de erro RMSE.


Não é melhor mudar os pesos (se for um neurónio) e criar regras (se for uma árvore) com o objectivo de obter o máximo lucro, a questão é retórica ... claro, é melhor e mais rápido

A questão é que estás a perder outros grupos de modelos que estão a ganhar e estes grupos têm milhões

Eu seleciono R2 por balanço, mais o número mínimo de negócios perdidos, mas com a menor entropia (logloss) e a máxima acuracia. Portanto, os modelos são mais rentáveis por padrão. Acontece que é um critério combinado. Além disso, seria bom adicionar os resultados da validação cruzada à estimativa. Ainda não cheguei a esse ponto.
 
Maxim Dmitrievsky #:
Eu seleciono R2 por balanço, mais o número mínimo de negócios perdidos, mas com a menor entropia (logloss) e a máxima acuracia. É por isso que os modelos são os mais rentáveis por defeito.

Você pode selecionar a partir de modelos prontos ou criar um modelo. Essa é a diferença.

 
mytarmailS #:

Você seleciona a partir de modelos pré-fabricados, ou pode criar um modelo. Essa é a diferença.

É quando se sabe o que criar e porquê. Eles não são prontos, os negócios são amostrados aleatoriamente, como nos artigos. Não existem hipóteses a priori ou heurísticas em qualquer fase da preparação dos dados, existem algumas faixas de valores como os tempos máximo e mínimo de manutenção de negócios.

Basicamente, todo o mecanismo funciona para encontrar o desconhecido, mas supostamente está lá, mas não sabemos o quê.