L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3024
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Je propose de faire ce chapeau en python avec un arbre avec un choix de feuilles, en kolab, vous pouvez y glisser vos jeux de données.
si vous avez des idées sur ce qui est mieux/pire, des règles pour ne prendre que le meilleur ou à travers des filtres, suggérez-les
Je veux comparer, en faisant passer un ensemble de données par les deux approches. Nous comprendrons alors ce qu'il en est :)
Idée intéressante !
Tout d'abord, nous devons comprendre quelle implémentation de l'arbre permettra d'extraire facilement les règles de la feuille pour les retravailler.
Ensuite, la façon de construire l'arbre - gourmande ou génétique. J'ai vérifié les feuilles des arbres de toutes les populations (si je n'ai pas bien compris :))
Bien sûr, on peut utiliser la forêt au lieu de la génétique, mais il faut alors plus d'arbres pour chercher les feuilles, et il faut élaguer en fonction du pourcentage d'exemples dans la feuille par rapport à l'ensemble de l'échantillon. Les arbres forestiers peuvent être plus rapides que les arbres génétiques et ils auront évidemment moins de paramètres.
Le processus de génération de nouvelles feuilles doit être exécuté jusqu'à ce que le nombre requis (spécifié) de feuilles sélectionnées soit atteint.
Dans ce cas, avant de construire l'arbre, il est nécessaire d'assurer la génération d'un sous-échantillon aléatoire de deux types d'échantillons - le premier est la sélection de N parties à partir d'intervalles uniformes continus de la taille spécifiée en tant que pourcentage de l'échantillon d'apprentissage, le second est un sous-échantillon obtenu de manière totalement aléatoire.
Un ensemble aléatoire de prédicteurs utilisés pour construire l'arbre.
En ce qui concerne le prétraitement de toutes les données, il convient de réfléchir davantage.
Critères d'évaluation des feuilles - ils peuvent également être ajoutés ultérieurement, mais l'essentiel est que les métriques aient un seuil déterminé. Je ne sais pas quelles sont vos mesures et je ne me souviens pas de celles que j'ai utilisées - je dois analyser le code. Vous pouvez prendre l'équilibre, la matrice d'espérance et le facteur de récupération.
L'estimation doit avoir lieu à chaque intervalle de l'ensemble de l'échantillon d'entraînement, le nombre d'intervalles étant défini. Si le critère requis n'est pas atteint à un intervalle quelconque, la feuille est archivée ou éliminée. J'ai conservé une base de données de feuilles, en supprimant les doublons afin de ne pas avoir à les vérifier à nouveau.
Après avoir sélectionné les feuilles, il convient de les regrouper par similarité, peut-être la corrélation des rangs permet-elle de le faire correctement. Ensuite, il faut répartir les poids au sein du groupe et décider des règles de vote pour les groupes. Cependant, c'est peut-être déjà beaucoup, et cela vaut la peine d'apprendre au moins comment sélectionner les feuilles jusqu'à présent, ce qui sera efficace pour de nouvelles données.
Je ne sais pas exactement sur quel échantillon vous voulez faire l'expérience - celui que je vais donner ou celui qui sera créé au hasard ?
En tout état de cause, pour comparer les méthodes, l'échantillon doit être le même et pour un grand intervalle de temps, ce qui permettra de prendre en compte sinon la cyclicité, du moins les tendances des différentes phases du marché sur de grandes TF.
Permettez-moi de dire tout de suite que la méthode que j'ai utilisée est très lente. Il est peut-être préférable d'effectuer le processus d'évaluation des feuilles dans MQL5 - cela permettra de répartir la charge sur les cœurs.
Une idée intéressante !
Je vais esquisser un exemple simple sur un arbre pour l'instant et le tester immédiatement, puis nous l'étendrons si nécessaire.
sur n'importe quel jeu de données, via google disc vous pouvez télécharger et tester sans rien installer.
Je veux que cela fonctionne rapidement )Pour l'instant, je vais esquisser un exemple simple sur un arbre afin qu'il puisse être testé en une seule fois, puis nous l'étendrons à notre guise.
sur n'importe quel jeu de données, via google disc vous pouvez le télécharger et le tester sans rien installer.
Je veux qu'il fonctionne rapidement)Bien - l'essentiel est de commencer ! :)
Ce n'est plus drôle.
Qu'est-ce que "drôle" a à voir là-dedans ?
Y a-t-il un échantillon hors norme ou non ?
Qu'est-ce que le terme "drôle" a à voir là-dedans ?
Y a-t-il ou non un échantillon hors norme ?
Et si je trouve
et si je trouve
Il n'y a pas de "si". Il s'agit d'une norme de jugement. Toute estimation sans estimation hors échantillon n'est pas intéressante.
et si je trouve
Réalisez un graphique de dix périodes OOS en avant et en arrière.
Cela n'a rien à voir avec "si". Il s'agit d'une norme de jugement. Toute évaluation sans évaluation hors échantillon n'est pas intéressante.
Réalisez un graphique de dix périodes OOS en avant et en arrière.
C'est assez de rire.
Vous vous adressez à l'Égyptien ou à moi ?
Je constate que je suis assez satisfait de votre activité dans ce domaine.