L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1281

 
Essayez de faire des régressions comme Aleshenka fils et toxiques, et tradez seulement quand la prévision a une corrélation élevée avec le prix sur N barres. C'est plus facile comme ça que de souffrir avec des cours.
 
Maxim Dmitrievsky:
Essayez la régression
La régression (dans l'exécution de la forêt) sera testée, mais plus tard.
MaximDmitrievsky:
Négocier uniquement lorsque la prévision a une corrélation élevée avec le prix sur N barres.

C'est comme une tendance ? Lorsque vous comprenez qu'il s'agit d'une tendance, elle touche déjà à sa fin et il est temps de sortir plutôt que d'entrer.

 
elibrarius:
La régression (telle que réalisée par la forêt) sera testée, mais plus tard.

C'est comme une tendance ? Lorsque vous vous rendez compte que c'est une tendance, elle touche à sa fin et il est temps d'en sortir, pas d'y entrer.

Ils l'ont écrit comme ça, je ne sais pas... métaphoriquement en fait, ils pensaient que c'était trop difficile à comprendre.

 
Alexander_K2:

Je maintiens mon opinion : il y a deux parents incontestables du vénérable KsanKsanych (Fa). 1) Aliochenka le fils, qui a été rattrapé par des investisseurs en colère, et 2) le petit-fils Kesha, qui promet des milliards à quiconque lira les créations de son grand-père.

Ne confondez pas les deux !

S'il vous plaît, ne comparez pas SanSanych avec Aliocha, Magicien, etc. SanSanych est un pro, tandis qu'Aliocha et Magicien sont des démotivateurs du Forex qui ont perdu quelques centaines de dollars et se sont offusqués du monde entier. Je ne suis pas petit-fils de SanSanych, je le respecte simplement et trouve son article très utile, ce que l'on ne peut pas dire des articles et des enseignements de Konyukh l'Étalon, qui collectionne les références et les termes pour avoir l'air scientifique mais qui en fait est zéro sans bâton.

 
elibrarius:

Sur le plan de l'apprentissage, car les arbres sont sous-entraînés. Les arbres surentraînés auraient dû se trouver sur l'arbre de test, car l'arbre se serait également souvenu du bruit.
Avec des arbres non formés, cela n'a pas d'importance.
Mais la taille de l'échantillon compte. Plus il est grand, plus il est représentatif. Et mon terrain d'entraînement est 3 fois plus grand.

---------

D'après le tutoriel https://www.mql5.com/ru/blogs/post/723619, un grand échantillon représentatif rend inutile l'équilibrage entre les classes, ce qui réduit le caractère aléatoire temporel. J'ai transféré ça aux arbres non formés.
Mais peut-être ai-je tort et dois-je tester la signification des prédicteurs sur un graphique de test.

Comment déterminer si un arbre (une forêt d'arbres) est pré-formé ou non ?

Je pense en tout cas que la méthodologie devrait consister à vérifier la stabilité de l'arbre sur différents échantillons (comment cette stabilité change sur différentes parties de l'échantillon/des échantillons), la formation et le test. Autrement, vous mesurez le bruit, vous vous contentez de vous coucher sur l'historique, c'est-à-dire que vous ne trouvez pas de régularités à l'aide d'un arbre, vous décrivez seulement l'historique du mouvement des prix et n'importe quel prédicteur fera l'affaire - l'essentiel est qu'il soit stable et fréquent.

Je recherche les patrons (feuilles ou mini patrons catbust), qui sont rentables, de préférence chaque année (2014-2018) et répondent à quelques critères supplémentaires.

 
Kesha Rutov:

Petit-fils de Kesha, laissez-moi regarder à nouveau les "tendances", car tous les plaisantins ont été bannis, il ne reste que vous.

comment vos forêts prédisent-elles les tendances ? dites-moi
 
Aleksey Vyazmikin:

Comment déterminer si un arbre (une forêt d'arbres) est pré-formé ou non ?

Je pense en tout cas que la méthodologie devrait consister à vérifier la stabilité de l'arbre sur différents échantillons (comment cette stabilité change sur différentes parties de l'échantillon/des échantillons), la formation et le test. Autrement, vous mesurez le bruit, vous vous contentez de vous coucher sur l'historique, c'est-à-dire que vous ne trouvez pas de régularités à l'aide d'un arbre, vous décrivez seulement l'historique du mouvement des prix et n'importe quel prédicteur fera l'affaire - l'essentiel est qu'il soit stable et fréquent.

Je recherche des régularités de ce type (feuilles ou mini-catbustes), qui rapportent de préférence chaque année (2014-2018) et répondent à certains critères supplémentaires.

Les prédicteurs stables et fréquents associés aux cibles sont des modèles.

Les termes scientifiques stables et fréquents dans les messages sans rapport avec les résultats sont très probablement du sur-apprentissage :)

 
Ivan Negreshniy:

Les prédicteurs stables et fréquents associés aux cibles sont des modèles.

Imaginez que le prédicteur soit le jour/la nuit et que vous ayez plus d'une personne dans vos cibles pendant la journée par exemple, est-ce un bon prédicteur ? Ou bien n'est-ce pas une question de jour, mais le fait que les nouvelles importantes (affectant le marché) sont publiées plus souvent le jour que la nuit.

Ivan Negreshniy:

Et la présence constante et fréquente de termes de science-fiction dans des messages sans rapport avec les résultats est probablement due au sur-apprentissage :)

Je ne pense pas qu'il soit approprié de juger un homme qui fait beaucoup pour promouvoir le MO ici...

 
Maxim Dmitrievsky:

Petit-fils de Kesha, laisse-moi regarder à nouveau les "tendances", sinon tous les bouffons ont été bannis, il ne reste que toi.

comment vos forêts prévoient-elles les tendances ?

Je suis OK, taux d'erreur stable de 10-15%, sur les tests. Dans le trading réel, tout est mélangé et indéfini, mais je suis un preneur de risques, contrairement à vous et aux autres hommes d'écurie qui s'assoient sur le dos de parents âgés.

 
Aleksey Vyazmikin:

Comment déterminer si l'arbre est pré-entraîné ou non (une forêt d'arbres) ?

Je limite l'arbre à 1 ligne :

samples++ ; if(samples < 20){alors ne divisez plus le noeud, mais laissez la feuille}.

c'est-à-dire qu'il restera au moins 20 échantillons dans la feuille, pour la représentativité.

C'est toute la version que vous avez demandée))))

Le degré de doublure, c'est-à-dire le nombre d'exemples dans la feuille, peut être de 10, 100, 1000 ou optimisé. Dans xgboost, cela s'appelle min_child_weight.