Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3038

 
Maxim Dmitrievsky #:

Eu também não sou muito fã, mas Alexei diz que funciona.

A questão é por que ele não o usa) aparentemente ele não está muito satisfeito com o resultado.

Acontece que ele seleciona as regras, mas devemos entender que algumas delas não funcionam de forma constante de ano para ano, algumas delas param de funcionar e a outra parte continua a funcionar de forma constante.

É claro que estamos interessados naquelas que continuam funcionando - o que as distingue das outras é o mistério que melhorará significativamente qualquer TS.

É exatamente isso que estou tentando aumentar potencialmente o número de regras boas, selecionando um número limitado de seções de preditores para elas. Para fazer isso, precisamos identificar áreas de desempenho "estável" de cada preditor que será usado para criar regras. Essa é a tarefa na qual estou interessado no momento.

Não fiz experiências com outros alvos, pois estou procurando uma maneira menos dispendiosa do que a que tenho para extrair essas regras.

Entendi corretamente que você decidiu não fazer uma colaboração para comparar os dois métodos?

 
Aleksey Vyazmikin #:

Isso acaba selecionando regras, mas devemos perceber que algumas delas não funcionam de forma constante de ano para ano, algumas param de funcionar e a outra parte continua funcionando de forma constante.

É claro que estamos interessados naquelas que continuam funcionando - o que as distingue das outras é o mistério que melhorará significativamente qualquer TS.

É exatamente isso que estou tentando aumentar potencialmente o número de regras boas, selecionando um número limitado de seções de preditores para elas. Para fazer isso, precisamos identificar áreas de desempenho "estável" de cada preditor que será usado para criar regras. Essa é a tarefa na qual estou interessado no momento.

Não fiz experiências com outros alvos, pois estou procurando uma maneira menos dispendiosa do que a que tenho para extrair essas regras.

Entendi corretamente que você decidiu não fazer uma colaboração para comparar os dois métodos?

Estou pensando em fazer isso no automático por enquanto.

 
Aleksey Vyazmikin #:

Isso acaba selecionando regras, mas devemos perceber que algumas delas não funcionam de forma constante de ano para ano, algumas param de funcionar e a outra parte continua funcionando de forma constante.

A verdade é que, se pegarmos 1.000 TCs aleatórios, teremos exatamente os mesmos resultados.

Além disso, se fizermos outra amostra para o teste, um quarto tipo - Train-Test-Valid-Test2.

descobriremos que "a outra parte continua a funcionar de forma estável".

exatamente o mesmo não funcionará ))

É tudo aleatório, e o padrão encontrado é realmente aleatório.

 
mytarmailS #:

A verdade é que, se você pegar 1.000 TCs aleatórios, obterá exatamente os mesmos resultados.

Além disso, se fizermos outra amostra para o teste, teremos um quarto tipo - Train-Test-Valid-Test2.

você verá que "a outra parte continua a funcionar de forma estável".

não funcionará da mesma forma ))

É tudo aleatório, e o padrão que você encontra é realmente aleatório.

Treinei 10.000 modelos e sei que esse não é o caso - a maioria deles para de funcionar com novos dados.

E as folhas - sim, você não leu com atenção, aparentemente - eu escrevi que treinei com dados de 2014 a 2019 (alguns meses), incluindo validação, e mostrei como eles funcionaram em 2021 - ou seja, aqui estava um teste honesto, sem olhar para o futuro - com lucro de 50%.

Talvez tudo seja aleatório, mas todo aleatório tem uma ciclicidade de acordo com a qual acontece de não ser aleatório :)

 
Aleksey Vyazmikin #:

Treinei 10.000 modelos e sei que esse não é o caso - a maioria deles deixa de funcionar com novos dados.

E as folhas - sim, aparentemente você não leu com atenção - eu escrevi que treinei com dados de 2014 a 2019 (alguns meses), incluindo a validação, e mostrei como eles funcionaram em 2021 - ou seja, aqui estava um teste honesto, sem olhar para o futuro - com lucro de 50%.

Talvez tudo seja aleatório, mas todo aleatório tem uma ciclicidade, de acordo com a qual não é aleatório :)

Ciclicidade que não é cíclica... você está de volta ao aleatório.
 
Maxim Dmitrievsky #:
Por exemplo, se você obtiver um estado estável por meio do FF, isso caracterizará um estado estável de TC? Todos sabem que isso é kurwafitting
Essa é a única maneira de obter um FS estável por acaso, por força bruta.

O FS deve descrever as regras de um CT estável. Se o TC se mostrar instável, então as regras do FF estão erradas.

O problema é que ninguém conseguiu encontrar essas regras para o FF ainda (eu não as vi, pelo menos). Há duas maneiras: simplificar o TS para que ele tenha o menor número possível de graus de liberdade, o que significa que é mais provável que ele seja estável drenando ou estável derramando, ou encontrar regras para o FF, que é uma maneira mais complicada.

Em geral, não existe um conjunto universal de ações para um construtor de graal. Há uma terceira maneira: criar uma IA flexível de autoaprendizagem como o ChatGPT, mas mesmo nesse caso há o FF que é usado no treinamento. Eu queria dizer uma coisa: o FF sempre estará presente de uma forma ou de outra, não há como se livrar dele.

O problema não está na construção de um TS estável, mas nas características descritivas que são colocadas no FF.

 
Andrey Dik #:

O FF deve descrever as regras de um TC estável. Se o CT se mostrar instável, as regras do FF estarão erradas.

O problema é que ninguém conseguiu encontrar essas regras para os FFs (pelo menos eu não as vi). Há duas maneiras: simplificar o TS para que ele tenha o menor número possível de graus de liberdade, o que significa que é mais provável que ele seja estável de drenagem ou estável de vazamento, ou encontrar regras para o FF, que é uma maneira mais complicada.

Em geral, não há um conjunto universal de ações para um construtor de graal. Há uma terceira maneira: criar uma IA flexível de autoaprendizagem como o ChatGPT, mas mesmo nesse caso há o FF que é usado no treinamento. Eu queria dizer uma coisa: o FF sempre estará presente de uma forma ou de outra, não há como se livrar dele.

O problema não está na construção de um TS estável, mas nas características descritivas que são colocadas no FF.

Raciocínio bastante correto e competente, contraditório, é claro - "... não na construção de uma TS sustentável", apenas na tecnologia de construção/seleção/evolução de TS sustentavelmente lucrativas, e estamos nos esforçando para isso.

 
Andrey Dik #:

O FF deve descrever as regras de um TC estável. Se o CT se mostrar instável, as regras do FF estarão erradas.


O FF não pode resolver nenhum problema por definição. Ou há TANTO para melhorar em uma unidade por cento ou não há. Não é possível melhorar o lixo, não importa o quanto você vasculhe o lixo, o lixo continuará sendo lixo.

Portanto, as considerações iniciais sobre a relação entre o alvo e os preditores são iniciais . Além disso, é necessária uma avaliação quantitativa dessa relação e, além disso, não apenas uma avaliação da relação, mas uma avaliação quantitativa da capacidade dos preditores de prever valores futuros da variável-alvo (o professor). Não há lugar para o FF nessa cadeia de raciocínio, portanto, é possível pegar/escolher um algoritmo de MO, dos quais existem centenas, e usá-los como caixas pretas sem tentar "melhorar" nada em algoritmos específicos.

Além disso, as classes de FF são muito problemáticas - o cheiro de adaptação excessiva à história é muito forte.

 
Forester #:

Exatamente, nenhum. Não está claro por que você continua a falar de 20% como uma conquista...
Nem 20%, nem 8%, nem 50% significam nada. Os números não significam nada.

O equilíbrio é interessante. Não há gráfico?

Você tem uma coluna chamada erro de classificação, agora a classificação é irrelevante.

É impossível entender. Eu gostaria de poder.

Talvez você possa apresentar seus resultados com mais clareza?

 
louco, louco, louco, louco, louco, louco.

Quando isso vai acabar?