Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2553

 
Dmytryi Nazarchuk #:
Regressão logística
A regressão floresta/bush é mais precisa.
 
elibrarius #:

Não, é uma base de dados de história memorizada...

Era uma pergunta retórica:))

 
mytarmailS #:

Era uma pergunta retórica :)))

Que estás a falar do assunto, eu sei))
É para os recém-chegados ao MO. Se eles entrarem aqui.

 
Vladimir Perervenko #:

Há três opções para lidar com amostras de ruído: apagar, re-particionar (corrigir a marcação) e separar as amostras de ruído em uma classe separada. Na minha experiência, cerca de 25% da amostra é "ruído". A melhoria da qualidade é de cerca de 5%, depende dos modelos e da preparação dos dados. Eu aplico-o ocasionalmente.

Há outro problema quando se usam os preditores - a sua deriva. E este problema tem de ser identificado e levado em conta tanto nos testes como no funcionamento. A tradução do artigo em anexo (procure por outros na rede) e há um pacote para os vagabundos. Não é o único. Mas a questão é que ao selecionar os preditores você precisa considerar não só a sua importância, mas também a sua deriva. No caso dos grandes drifters descarte ou transforme, no caso dos pequenos drifters leve-os em consideração (faça correções) ao testar e trabalhar.

Boa sorte.

O que queres dizer com "aplicar ocasionalmente"?

Ou há algum tipo de canalização que já provou a sua eficácia, ou é apenas especulação ociosa.

Fazer do ruído uma classe separada teoricamente não melhora o modelo (ele fica dentro do modelo e não vai a lugar nenhum)

sobre a deriva - isso é o básico, o tradeoff de viés-variação
 
Maxim Dmitrievsky #:
Já tentou prever a distribuição de futuras citações?
 
mytarmailS #:
Você já tentou prever a distribuição de futuras citações?

Já fiz algo assim, mas não entendo do que se trata.

Lembre-se, eu aglomerei futuros pedaços de comprimento fixo e previ o número do aglomerado. Cada cluster tem uma distribuição diferente, cada um tem uma estratégia diferente para cada um. Funcionou no Traine, falha em novos dados se você o fizer de frente.
 
Maxim Dmitrievsky #:

fez algo assim, mas não entendeu do que se tratava.

Lembre-se, eu agrupei futuros pedaços de comprimento fixo e previ o número de agrupamento. Cada cluster tem a sua própria distribuição, cada um tem a sua própria estratégia. Funcionou em Trayne, mas falha em novos dados, se você o fizer diretamente.

Eu lembro-me...

Eu tenho uma ideia ligeiramente diferente...

Se você pode prever qualitativamente a distribuição de futuras citações, digamos, para 50 velas adiante, então a partir desta distribuição você pode desenhar vários milhares de séries e treinar o modelo, e desta forma o modelo irá funcionar adequadamente para as novas 50 velas em teoria...

 
Eu verifico o fio de vez em quando, as mesmas caras, o mesmo modelo de discussão, talvez alguém tenha algo para mostrar?
 
Farkhat Guzairov #:
Visito periodicamente o tema, os rostos são os mesmos, a discussão de modelos é a mesma, talvez alguém tenha algo para mostrar?
Isto não é um problema a resolver.