Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3179

 
Maxim Dmitrievsky #:
Observe, pois se você não receber um padrão na série original, o caminho hilbertiano não o levará à sua meta desejada. Seus esforços se transformarão em diabrura, e você encontrará um massacre ignominioso em vez de um paraíso.

😁😁

 

Perguntei aos desenvolvedores do boost o que fazer com a multicolinearidade e a seleção de recursos (pré-processamento).

Recebi uma resposta inequívoca: cara, esqueça isso :)

 
Maxim Dmitrievsky #:

E por que eu perguntaria se a conversão de flots para ints é necessária principalmente para a aceleração de dados muito grandes?

O bônus pode ser uma pequena calibração do modelo para melhor ou pior, conforme a sorte.

eles simplesmente lhe darão a mesma resposta, então você provavelmente tem medo de perguntar porque isso desvalorizará todos os seus anos de trabalho árduo :)

Como meu trabalho pode ser desvalorizado ao responder a uma pergunta se eu o julgo pelo resultado?

Sim, o resultado não é super em termos de crescimento de métricas, mas está lá, inclusive em outras manifestações.

Por exemplo, há amostras em que, sem o pré-processamento usando meu método, eu não conseguiria obter um modelo lucrativo em novos dados.

 
Maxim Dmitrievsky #:

Perguntei aos desenvolvedores do boost o que fazer com relação à multicolinearidade e à seleção de recursos (pré-processamento).

Recebi uma resposta inequívoca: cara, esqueça isso :)

E se houver um bilhão de características, devemos simplesmente esquecer isso? Ou ainda devemos selecionar as que não estão correlacionadas?
 
mytarmailS #:
E se houver um bilhão de características, podemos simplesmente esquecer isso? Ou ainda temos que selecionar as que não estão correlacionadas?
À vontade.
 
Maxim Dmitrievsky #:
À vontade
Em vez disso, por necessidade, deve ser filtrado, sem opção
 
Maxim Dmitrievsky #:

Perguntei aos desenvolvedores do boost o que fazer com relação à multicolinearidade e à seleção de recursos (pré-processamento).

Recebi uma resposta inequívoca: cara, esqueça isso :)

Há uma funcionalidade que poucas pessoas discutem, a julgar pelas informações sobre exemplos reais de sua aplicação.

Por exemplo, a capacidade de agrupar preditores e atribuir-lhes pesos. Também vejo o potencial de aprimoramento do modelo, mas não posso fazer experimentos aqui, pois isso exige muita pesquisa.

E não é um fato que a pessoa que originalmente manteve todo o projeto em sua cabeça ainda esteja trabalhando nele, é bem possível que haja colegas e outros que melhorem o próprio algoritmo em termos de velocidade de execução e corrijam bugs. Às vezes, aparecem pequenas falhas.

 
mytarmailS #:
Em vez disso, por necessidade, você precisa filtrar, sem opção
Provavelmente é mais fácil não criar um bilhão de recursos em primeiro lugar
 
Aleksey Vyazmikin #:

Há uma funcionalidade que poucas pessoas discutem, a julgar pelas informações sobre exemplos reais de sua aplicação.

Por exemplo, a capacidade de agrupar preditores e atribuir-lhes pesos. Também vejo o potencial de aprimoramento do modelo, mas não posso fazer experimentos aqui, pois isso exige muita pesquisa.

E não é fato que a pessoa que originalmente manteve todo o projeto em sua cabeça ainda esteja trabalhando nele, é bem possível que haja colegas e outras pessoas que melhorem o próprio algoritmo em termos de velocidade de execução e corrijam bugs. Bem, às vezes aparecem pequenas falhas.

Tudo isso é opcional
 
Maxim Dmitrievsky #:
Provavelmente é mais fácil não fazer um bilhão de sinais em primeiro lugar.
Para perceber que um recurso é ruim, é preciso verificá-lo, para vê-lo é preciso ter um recurso, para ter um recurso é preciso tê-lo....