L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 2018

 
Maxim Dmitrievsky:

Je pense que l'article voulait... Esquissez l'essentiel de l'approche. Je ne comprends toujours pas ce que vous faites :D

Je suis d'avis que les caractéristiques doivent être extraites automatiquement par le modèle lui-même à partir des séries temporelles (s'il y en a). Et il n'est pas nécessaire de faire quoi que ce soit manuellement. Les incréments sont suffisants. La question est celle de l'architecture. Par exemple, comme dans le PNL (traitement neuronal du langage), le réseau neuronal détermine lui-même le contexte dans les séquences de mots, c'est-à-dire la connexion entre les échantillons de séries temporelles.

L'arbre génétique et CatBoost sont faiblement connectés, l'article que je compte écrire sur CatBoost. Reporté à écrire pour la raison que j'ai trouvé des défauts dans la stabilité des indicateurs des prédicteurs et j'ai jeté toutes les forces sur la correction il, en même temps et les nouveaux prédicteurs ont fait. D'ici la fin de la semaine, je prévois de lancer le processus de calcul (sinon c'est gênant quand les serveurs sont inactifs) et j'essaierai d'écrire la première partie de l'article d'ici la fin du mois. L'article portera sur ma cuisine de modélisme sur CatBoost.

Avec les arbres génétiques, c'est plus compliqué, il n'y aura pas encore d'article à ce sujet, mais l'approche consiste à sélectionner des feuilles d'arbres qui classent de manière stable une partie des données sur l'historique - en fait 0,5 % à 3 % de toutes les réponses de l'échantillon, plus il y a de feuilles de ce type, mieux c'est, maintenant environ 1000 pour l'achat et la vente, en plus je recherche des feuilles qui filtrent également les feuilles sélectionnées, c'est-à-dire que j'effectue un entraînement supplémentaire qui augmente leur précision. Les feuilles sont regroupées en fonction de leur similarité (il y a encore du travail à faire), puis leurs réponses sont pondérées au sein de chaque groupe sur l'historique et le seuil auquel le signal d'un groupe de feuilles est généré est déterminé. Un filtre supplémentaire est un arbre génétique basé sur les réponses de toutes les feuilles ou seulement de groupes de feuilles. Cette approche permet d'augmenter significativement la complétude de la classification dans un échantillonnage déséquilibré, dans mon cas avec 3 cibles, où la cible "0" est d'environ 65%.

Le travail sur les critères de sélection des feuilles et la méthodologie de leur agrégation a un grand potentiel d'amélioration, et donc les modèles peuvent être de meilleure qualité.

 
Aleksey Vyazmikin:

Qu'est-ce que les prédicteurs ont à voir là-dedans ?

Il devait être confus, pensant aux siens)

 
Maxim Dmitrievsky:

Je suis d'avis que les caractéristiques devraient être extraites automatiquement par le modèle lui-même à partir des séries chronologiques (s'il y en a). Et il n'est pas nécessaire de faire quoi que ce soit manuellement. Les incréments sont suffisants. La question est celle de l'architecture. Par exemple, comme dans le PNL (traitement neuronal du langage), le réseau neuronal détermine lui-même le contexte dans les séquences de mots, c'est-à-dire la connexion entre les échantillons de séries temporelles.

Je suis d'accord sur l'architecture, nous avons besoin d'une architecture complètement différente, nous avons besoin d'un ensemble de réseaux :

1. identifier les images.

2. détermination de l'ordre spatial des images

3. rechercher des motifs dans les images placées dans l'espace

Maintenant, j'ai mon cerveau qui résout les réseaux 1 et 2 - en créant des prédicteurs, et avec la troisième tâche est fait CatBoost. Il sera difficile de combiner ces réseaux en un seul. Peut-être faut-il essayer de travailler avec chaque direction séparément, puis d'unir ces réseaux ?

 
Aleksey Vyazmikin:

Maintenant, je résous les réseaux 1 et 2 avec mon cerveau - en composant des prédicteurs, et CatBoost s'occupe de la troisième tâche. Il serait difficile de fusionner ces réseaux en un seul, essayez peut-être de travailler avec chaque direction séparément, puis de fusionner ces réseaux ?

Il faut surveiller les innovations, elles s'améliorent constamment. Les grilles modernes ont exactement la même tâche, celle de tout faire en même temps.

Rechercher des prédicteurs manuellement revient à frapper un rocher avec un pic. Et, comme tout le monde l'a vu, ça ne marche presque pas...
 
Maxim Dmitrievsky:

il faut être à l'affût des nouveaux produits, ils s'améliorent constamment. Les grilles modernes ont exactement la même tâche, celle de tout faire en même temps.

La recherche manuelle de prédicteurs fait déjà partie du passé, comme une pioche sur un rocher. Et, comme tout le monde l'a vu, ça ne marche presque pas...

Il faut une architecture très complexe pour tout faire en même temps, et plus l'architecture est complexe, plus la puissance de traitement est nécessaire.

Cependant, s'il y a un besoin en capacités (il y a de vieux serveurs et GPU), je suis prêt à les fournir pour l'idée ;)

 
Aleksey Vyazmikin:

Plus l'architecture est complexe, plus la puissance de traitement nécessaire est importante.

Cependant, s'il y a un besoin de puissance (il y a de vieux serveurs et GPU), je suis prêt à la fournir pour l'idée ;)

Ce n'est pas compliqué, il faut juste comprendre

Je n'ai pas besoin de courant du tout. J'ai fait apprendre LSTM sur mon ordinateur portable en quelques minutes sans carte graphique. Le pouvoir est un mythe.

 
Aleksey Vyazmikin:

Plus l'architecture est complexe, plus la puissance de traitement nécessaire est importante.

Cependant, s'il y a un besoin de puissance (il y a de vieux serveurs et GPU), alors je suis prêt à la fournir pour l'idée ;).

Prêt à lancer une idée, en personne ?

 
Maxim Dmitrievsky:

Ce n'est pas compliqué, il suffit de le découvrir.

Vous n'avez pas besoin d'électricité du tout. Je peux apprendre LSTM sur mon ordinateur portable en quelques minutes sans carte vidéo. Le pouvoir est un mythe.

Les architectures non complexes ne fonctionnent pas, vous l'avez dit vous-même. Ceux qui ne sont pas compliqués ont besoin de stationnarité... cycles.

Wow, quelques minutes, c'est cool, et quelle est la topologie du réseau, combien de couches, de neurones ?

 
dr.mr.mom:

Prêt à sonder des idées, en personne ?

Vous pouvez le faire en personne.

 
Aleksey Vyazmikin:

Les architectures non compliquées ne fonctionnent pas, vous l'avez dit vous-même. Ceux qui ne sont pas compliqués ont besoin de stationnarité... cycles.

Wow, quelques minutes, c'est cool, et quelle est la topologie du réseau, combien de couches, de neurones ?

Oh, mec... c'est pas compliqué dans le sens où tu peux comprendre

En général, quelques couches suffisent, il n'est pas nécessaire d'avoir une grande profondeur dans le forex.

Il y a des réseaux plus avancés pour la RV, plus cool que lstm. Cela pourrait être rentable à partir de là, je n'ai pas encore vérifié. Tous les "classiques" comme les boostings et les perseptrons ne sont pas adaptés à la BP.