Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2385

 
Maxim Dmitrievsky:

Eu acho que Alexey sugeriu poder de computação, ele gosta de calcular algo longo, talvez você devesse fazer uma cooperativa :)

R sem vetorização ainda será lento. Você poderia usar algum tipo de banco de dados rápido

Tenho peças lentas vectorizadas, a lógica do algoritmo deve ser optimizada, estou a tentar perceber agora, já tentei acelerar 5 vezes, já reescrevi o código...

Mais sinais são tão poucos, tão primitivos, que eu também devia fazer algo com ele, não gosto muito do alvo...

Oh, merda... é como uma reparação, o ego só pode começar...

 
mytarmailS:

Claro que não), e mesmo que o fizesses, isso não me afectaria de forma alguma).

Tente, mas o resultado será na melhor das hipóteses o mesmo que para a Floresta Aleatória, ou seja, nenhum...


Forrest output é uma soma de regras acionadas, as regras não são filtradas e rejeitadas de forma alguma, e as regras rejeitadas são cerca de 100%)

As regras não são verificadas quanto à repetibilidade (pode haver apenas uma resposta) ou adequação (funciona); as regras são apenas esticadas para os dados (o modelo encaixa nos dados)

O modelo aproxima uma amostra de treinamento aleatoriamente, esperando que a validação cruzada ajude, mas não o fará por razões objetivas (há muito poucos eventos importantes no mercado)


Tentei uma abordagem diferente, não me ajustei aos dados do modelo, mas formei hipóteses e verifiquei-as.

1) Eu formo hipóteses plausíveis(já filtradas) sob a forma de regras.

2) Hipóteses são testadas com dados pequenos

3) Hipóteses que foram testadas com dados pequenos são testadas com dados grandes.

Na verdade, apenas uma em um milhão de regras plausíveis permanece

É difícil para o leitor destreinado compreender a diferença entre as duas abordagens, mas a diferença entre elas é o abismo

Algum tipo de filosofia. Nada de concreto...
 
elibrarius:
Algum tipo de filosofia. Nada de concreto...

Bem, o caminho é anunciado mais cedo, e tudo é estritamente como pretendido. Gerar regras e verificá-las não é a abordagem usual onde as regras são selecionadas com base na lógica/objetivos do problema. Isto é, normalmente são geradas regras para a solução inicialmente. Isto leva à perda de regras que não são lógicas, mas que produzem resultados.

 
elibrarius:
Algum tipo de filosofia. Nada de concreto...
  • Muitas coisas são incompreensíveis para nós, não porque nossos conceitos sejam fracos; mas porque essas coisas não estão dentro do círculo dos nossos conceitos.
Valeriy Yastremskiy:

Ora, o caminho foi anunciado mais cedo e tudo está estritamente como planeado. Gerar regras e verificá-las não é a abordagem usual onde as regras são selecionadas com base na lógica/objetivos da tarefa. Isto é, normalmente são geradas regras para a solução inicialmente. Isto leva à perda de regras que não são lógicas, mas que produzem resultados.

+++

 
mytarmailS:
  • Muitas coisas nós não entendemos, não porque nossos conceitos são fracos; mas porque essas coisas não estão no âmbito de nossa compreensão.

+++

Um pouco mais de filosofia))

 
É típico que tais abordagens tenham resultados que podem ser convencionalmente chamados de "anti hamster" - o que significa que o hamster é visto mas não visto. Isto é bastante típico para filas semelhantes a implementações de SB.
 
Aleksey Nikolayev:
É típico que tais abordagens tenham resultados que podem ser convencionalmente chamados de "anti hamster" - o que significa que o hamster é visto mas não visto. Isto é bastante típico de filas semelhantes às implementações de SB.

Eu discordo. O problema com o grande número de regras e lógicas de seleção certamente está aí. Os alvos são os mesmos em ambas as abordagens.

E que o caminho está completamente errado, bem, estamos a verificar as regras e a corrigir o caminho))))

 

Eu tenho alguma outra abstração de MO que deveria encontrar padrões reais (se houver algum), mas não é certo

Não consegui encontrar nenhuma referência maçónica ou pentagoniana no google, por isso estou a mantê-la em segredo por agora.

Eu inventei a abstracção quando eu estava a tirar sementes de girassol.
 
Maxim Dmitrievsky:

Eu tenho alguma outra abstração de MO que deveria encontrar padrões reais (se houver algum), mas não é certo

Não consegui encontrar referências maçónicas ou pentagonianas no google, por isso estou a guardar segredo por agora.

a abstracção inventada durante a colheita das sementes de girassol

Parece que me esqueci: padrões reais de SB (se houver algum) ))))

 
Maxim Dmitrievsky:

Eu acho que Alexei sugeriu poder de computação, ele gosta de fazer cálculos longos, talvez você possa fazer uma cooperativa :)

Ainda vai ser lento em R sem vectorização. Você poderia usar um banco de dados rápido

Além disso, eu faço esta abordagem há anos.

No entanto, eu adiei um pouco agora, pois é realmente muito lento, o que torna impossível mudar o alvo rapidamente (procure por um bom), e as regras individuais também param de funcionar, não importa como você as verifique na história.

Maxim, você pode ajudar, fazer um script em python que irá ciclar para criar modelo (ou 100 modelos) a partir do arquivo CSV, depois analisá-lo sobre a validade dos preditores com ferramentas CatBoost padrão, depois proibir / permitir o uso de preditores (CatBoost pode fazê-lo) em certas condições e criar um novo modelo novamente. Este método permitirá alocar importantes preditores que levarão à melhoria do modelo. Estou usando um método semelhante, mas é realmente inconveniente para mim, pois após adicionar/remover preditores tenho que reiniciar manualmente o loop.