L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1534
![MQL5 - Langage des stratégies de trading intégré au terminal client MetaTrader 5](https://c.mql5.com/i/registerlandings/logo-2.png)
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Indicateurs de l'échantillon sur lequel la formation a été réalisée.
Qu'en est-il de l'échantillon en dehors de la formation ? Les six prochains mois par exemple ?
Vous avez donc un logloss de ~1, ce qui signifie que le modèle est totalement effrayé par ce qui se passe.
Je suis aveugle, où est le logloss négatif ? J'ai spécifié un logloss pour l'ensemble du modèle.
Voulez-vous trouver un logloss séparé pour une entrée individuelle ? C'est-à-dire la quantité d'information entre les valeurs de la feuille et les valeurs cibles ?
Je ne suis pas sûr que logloss soit la bonne chose, je veux trouver des informations de qualité et logloss recherche plutôt la quantité de l'ensemble du modèle, peut-être que la quantité fera aussi bien - je ne sais pas. Une idée de comment faire ?
La classe "ne fait rien" est clairement déséquilibrée par rapport aux autres, et c'est ce que j'ai écrit plus haut qui peut être un tel problème à cause du modèle à 3 classes. Le reste des indicateurs est déprimant.
Ouais, déséquilibré, mais qu'est-ce qu'on peut faire... Vous pourriez bien sûr faire deux échantillons - en divisant l'échantillon en vecteurs, mais là encore, certaines des informations qui pourraient être utiles seraient perdues. En général, je suis d'accord pour dire que l'échantillon n'est pas équilibré, mais je ne sais pas comment faire sans perdre d'informations. J'ai essayé de dupliquer les lignes avec un petit nombre de cibles, mais l'effet est négatif.
Je suis aveugle, où est le logloss négatif ? J'ai spécifié un logloss pour l'ensemble du modèle.
Je ne suis pas sûr de ce qu'est le logloss, je veux trouver des informations de qualité, et le logloss cherche plutôt la quantité de l'ensemble du modèle, peut-être que la quantité fera aussi bien l'affaire - je ne sais pas. Une idée de comment faire ?
Oui, ce n'est pas équilibré, mais que pouvez-vous faire... Vous pourriez bien sûr faire deux échantillons - diviser l'échantillon en vecteurs, mais là encore, certaines des informations qui pourraient être utiles seraient perdues. En général, je suis d'accord pour dire que l'échantillon n'est pas équilibré, mais je ne sais pas comment faire sans perdre d'informations. J'ai essayé de dupliquer les lignes avec un petit nombre de cibles - l'effet est négatif.
Non négatif, mais tend vers un, c'est-à-dire le maximum. Il devrait tendre vers zéro.
logloss montre la corrélation entre vos caractéristiques et la cible, en gros, c'est-à-dire que 0 correspond à une corrélation totale, c'est-à-dire qu'elles décrivent bien la cible. 1 correspond à l'absence totale de description, c'est-à-dire qu'elles ne sont absolument pas informatives. C'est un bon indicateur dans le sens où il nous dit s'il y a une corrélation quelconque. Vous n'obtenez aucune corrélation du tout.
Je ne sais pas, faites-en une classe normale de 2 et non de 3.
Et sur un échantillon en dehors de la formation, quoi ? Les six prochains mois par exemple ?
Et l'échantillonnage en dehors de l'entraînement, pour ainsi dire... Pas fait, formé pour environ le 1er mars 2019, j'ai décidé d'utiliser toutes les informations de 2014.
Mais, décidé de voir par moi-même ce que ces arbres donnent, l'a collé dans EA et a fait trois passages avec 3 arbres différents du 1er mars 2019 au 15 septembre 2019.
1. Première étape de séparation
2. Vingtième étape de séparation
3. Quarante-huitième étape de la division
Et, en général, je suis moi-même surpris que les trois modèles aient des résultats positifs !
Il est intéressant de noter que le 2e modèle est plus lisse, tandis que le 3e modèle a déjà du mal à se glisser dans le côté positif.
Il est intéressant de noter que la précision des modèles n'est pas beaucoup plus mauvaise, et qu'elle s'est même parfois améliorée. Le tableau ci-dessous présente les changements en pourcentage par rapport à l'échantillon d'entraînement.
Je ne peux pas me prononcer sur l'exhaustivité et la perte de logarithme - il faut prendre les indicateurs et faire l'échantillonnage.
Et oui, la plupart des modèles bouclent lors de la formation à zéro, car il y a vraiment une prépondérance de cette classe par rapport aux deux autres, et les zéros sont alors plus faciles à trouver - c'est ce qui gâche tout.
n'est pas négatif mais tend vers un, c'est-à-dire vers le maximum. Elle doit tendre vers zéro.
Le logloss indique le degré de corrélation de vos caractéristiques avec la cible, en gros, c'est-à-dire que 0 correspond à une corrélation totale, c'est-à-dire qu'elles décrivent bien la cible. 1 correspond à l'absence totale de description, c'est-à-dire qu'elles ne sont absolument pas informatives. C'est un bon indicateur dans le sens où il nous dit s'il y a une corrélation quelconque. Vous n'obtenez aucune corrélation du tout.
Je ne sais pas, faites-en un grade normal 2 au lieu d'un grade 3.
Je ne suis pas sûr que Logloss en multi-classe en soit un... En général, je n'arrive pas à trouver comment mettre en œuvre la formule moi-même - je ne comprends pas ces cryptages de sources publiques. Et j'aimerais voir le logloss, pas le final, mais pour l'ensemble de l'échantillon, comment il évolue et où il s'affaisse. Et comme je l'ai compris, c'est plus correct avec un échantillon équilibré...
Je ne suis pas sûr que Logloss pour la multi-classification soit égal à un... En général, je n'arrive pas à comprendre comment mettre en œuvre la formule moi-même - je ne comprends pas ces cryptages de sources publiques. Et j'aimerais voir le logloss, pas le final, mais pour l'ensemble de l'échantillon, comment il évolue et où il s'affaisse. Et si je comprends bien, c'est correct dans un échantillon équilibré dans une plus grande mesure...
Je ne veux pas me creuser la tête à ce sujet... les grandes entreprises comme Yandex font des choses. Ils disent : fais ça et tout ira bien. Fais-le et ne le fais pas tout seul. Vous vous noyez dans la rhétorique et les différentes approches.
Il montre le changement au fur et à mesure qu'il avance dans la pente, en construisant des arbres.Et l'échantillonnage en dehors de la formation, pour ainsi dire... Ne l'a pas fait, s'est entraîné pour environ le 1er mars 2019, a décidé que je devais utiliser toutes les informations de 2014.
Mais, décidé de voir par moi-même ce que ces arbres donnent, l'a collé dans EA et a fait trois passages avec 3 arbres différents du 1er mars 2019 au 15 septembre 2019.
1. Première étape de séparation
2. Vingtième étape de séparation
3. Quarante-huitième étape de la division
Et, en général, je suis moi-même surpris que les trois modèles aient des résultats positifs !
Il est intéressant de noter que le 2e modèle est plus lisse, tandis que le 3e modèle a déjà du mal à se glisser dans le côté positif.
Il est intéressant de noter que la précision des modèles ne s'est pas beaucoup détériorée, et s'est même parfois améliorée. Le tableau ci-dessous montre les variations en pourcentage par rapport à l'échantillon de formation
Je ne peux pas me prononcer sur l'exhaustivité et la perte de logarithme - vous devez tirer les indicateurs et faire l'échantillonnage.
Et oui, la plupart des modèles bouclent lors de l'apprentissage à zéro, car il y a vraiment une prépondérance de cette classe par rapport aux deux autres, et puis les zéros sont plus faciles à trouver - c'est ce qui gâche tout.
Voilà ce que je reçois. Je viens de déplacer toute la logique du bot vers python, la forêt a été remplacée par boost. Je n'ai pas trouvé d'erreur, il semblerait qu'il n'y ait pas de coup d'œil. Selon les réglages, les acuras peuvent être augmentés jusqu'à 0,7-0,8, tout en réduisant le nombre de transactions.
L'échafaudage présente approximativement la même gamme d'erreurs, mais il ne s'agit pas d'acuras, mais d'erreurs de classification. Et il se comporte de la même manière en trayne, voire mieux. Mais c'est bien pire au test.
l'apprentissage :
L'apprentissage est 10 fois plus important
Qu'est-ce qu'il y a sur le chemin ? Des prix purs ?
incréments
Je finirai le connecteur ce week-end et le mettrai à l'épreuve. Je prévois de télécharger le modèle sur le nuage et de récupérer les signaux à partir du terminal. J'envisage de placer le modèle dans le nuage et de récupérer les signaux à partir du terminal. Je peux vous envoyer le client sur MT5Une approche simple et intéressante sur la façon de décrire les modèles pour le MoD
https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019