L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1546

 
Maxim Dmitrievsky:

le sur-apprentissage au sens d'une faible généralisation. J'ai déjà écrit ci-dessus comment contourner le problème, mais il existe des approches plus élégantes, j'en suis sûr.

Il n'y a aucun problème avec la qualité de la formation sur le train + valide du tout.

C'est peut-être une question de données, ce n'est pas la première fois que j'entends de la part de différents formateurs que les données homogènes, comme l'incrément, sont mieux données aux NS, et que les arbres de différents types fonctionnent mieux avec des données non uniformes - modèles, nouvelles, facteurs de risque, temps, événements, densité des piles, intérêt ouvert, volumes.

Si vous ne savez pas comment procéder, vous serez peut-être surpris par la différence entre les signaux des prix ouverts et fermés.

 
Sergey Chalyshev:

Je vois que tout le monde essaie de former le réseau avec l'aide d'un professeur.

Quelqu'un a-t-il essayé d'entraîner le réseau en utilisant une fonction cible, telle que le facteur de récupération ?

Je sélectionne des feuilles et je construis un modèle à partir de celles-ci en fonction de mes paramètres.

 
elibrarius:

Ça ne le suggère pas.

Dans XGBoost, le premier arbre est le modèle brut. Les autres corrigent la première, et par un facteur microscopique. Vous ne pouvez rien obtenir en travaillant individuellement, ils ne donnent un bon résultat qu'en tant que groupe.
En catbust apparemment le même principe de base, avec ses propres particularités.

En fait, je suis également sceptique à ce sujet, sauf pour rendre l'arbre plus authentique - je prépare actuellement des données pour 6 divisions, je ne pense pas que ce soit suffisant.

Cependant, l'essence même de la pondération consiste simplement à évaluer toutes les feuilles du modèle sur la base de la comptabilité d'exercice, et il n'est pas exclu qu'il existe un bon modèle parmi elles, car le principe de construction des feuilles est respecté et tient compte de la construction indépendante par les gourmands, puis de la vérification de l'amélioration et de l'évaluation des arbres. Voyons voir.

 
Aleksey Vyazmikin:

C'est peut-être une question de données. Ce n'est pas la première fois que j'entends dire par différents professeurs que les données homogènes, telles que les incréments, sont préférables pour alimenter les NS, tandis que les arbres de différents types fonctionnent mieux avec des données hétérogènes - modèles, nouvelles, ratios de risque, temps, événements, densité des coupes, intérêt ouvert, volumes.

À propos des incréments, avez-vous essayé de mesurer par ATR, ou pourcentage du prix de clôture, plutôt qu'en pips ?

Je ne sais pas ce qu'il faut mesurer, je m'en fiche.

 
Maxim Dmitrievsky:

Tu te débats avec la mauvaise chose... Je me fous de ce que tu mesures.

Au contraire, je pensais que la conversion en valeurs naturelles aurait un effet, car j'ai toutes les valeurs normalisées et quantifiées (décomposées en fourchettes), et il s'avère que lorsque j'ai quitté les chiffres purs, l'apprentissage s'est détérioré de manière significative. Il est évident pour moi maintenant, que le prétraitement des données fait une différence.

 
Aleksey Vyazmikin:

Au contraire, je pensais que la conversion en valeurs naturelles aurait un effet, car j'ai toutes les valeurs normalisées et quantifiées (décomposées en fourchettes), et il s'avère que lorsque j'ai laissé les chiffres purs, l'apprentissage a été considérablement altéré. Il est évident pour moi maintenant que le prétraitement des données fait une différence.

Vous avez votre propre monde bizarre là-bas, avec ses propres bêtes...) Je n'utilise que les incréments et leurs équivalents, et parfois seulement les prix, comme les Pères l'ont ordonné.

 
Maxim Dmitrievsky:

Eh bien, vous avez votre propre monde bizarre là-bas, avec ses propres bêtes ;)) Je n'utilise que les incréments et leurs équivalents, et parfois seulement les prix, comme les Pères l'ont ordonné.

Peut-être vais-je croiser deux échantillons avec vos et mes prédicteurs, juste pour l'expérience ?

 
Aleksey Vyazmikin:

Que diriez-vous de croiser deux échantillons avec vos et mes prédicteurs, juste pour l'expérimentation ?

Pourquoi ? Tous les prédicteurs sont dérivés des rapatriés. Il suffit d'ajouter des retours aux vôtres et de les considérer comme croisés.

 
Maxim Dmitrievsky:

Pourquoi ? Tous les perdants sont issus des retours. Il suffit d'ajouter les retours aux vôtres et de considérer qu'ils sont déjà croisés.

Je ne sais pas quels retours ajouter, à quelle hauteur et combien.

 
Aleksey Vyazmikin:

Je ne sais pas quels retours ajouter, à quelle hauteur et combien de pièces.

Je ne sais pas non plus, c'est toujours différent.