L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1534

 
Aleksey Vyazmikin:

Indicateurs de l'échantillon sur lequel la formation a été réalisée.

Qu'en est-il de l'échantillon en dehors de la formation ? Les six prochains mois par exemple ?

 
Maxim Dmitrievsky:

Vous avez donc un logloss de ~1, ce qui signifie que le modèle est totalement effrayé par ce qui se passe.

Je suis aveugle, où est le logloss négatif ? J'ai spécifié un logloss pour l'ensemble du modèle.

Maxim Dmitrievsky:

Voulez-vous trouver un logloss séparé pour une entrée individuelle ? C'est-à-dire la quantité d'information entre les valeurs de la feuille et les valeurs cibles ?

Je ne suis pas sûr que logloss soit la bonne chose, je veux trouver des informations de qualité et logloss recherche plutôt la quantité de l'ensemble du modèle, peut-être que la quantité fera aussi bien - je ne sais pas. Une idée de comment faire ?

Maxim Dmitrievsky:

La classe "ne fait rien" est clairement déséquilibrée par rapport aux autres, et c'est ce que j'ai écrit plus haut qui peut être un tel problème à cause du modèle à 3 classes. Le reste des indicateurs est déprimant.

Ouais, déséquilibré, mais qu'est-ce qu'on peut faire... Vous pourriez bien sûr faire deux échantillons - en divisant l'échantillon en vecteurs, mais là encore, certaines des informations qui pourraient être utiles seraient perdues. En général, je suis d'accord pour dire que l'échantillon n'est pas équilibré, mais je ne sais pas comment faire sans perdre d'informations. J'ai essayé de dupliquer les lignes avec un petit nombre de cibles, mais l'effet est négatif.

 
Aleksey Vyazmikin:

Je suis aveugle, où est le logloss négatif ? J'ai spécifié un logloss pour l'ensemble du modèle.

Je ne suis pas sûr de ce qu'est le logloss, je veux trouver des informations de qualité, et le logloss cherche plutôt la quantité de l'ensemble du modèle, peut-être que la quantité fera aussi bien l'affaire - je ne sais pas. Une idée de comment faire ?

Oui, ce n'est pas équilibré, mais que pouvez-vous faire... Vous pourriez bien sûr faire deux échantillons - diviser l'échantillon en vecteurs, mais là encore, certaines des informations qui pourraient être utiles seraient perdues. En général, je suis d'accord pour dire que l'échantillon n'est pas équilibré, mais je ne sais pas comment faire sans perdre d'informations. J'ai essayé de dupliquer les lignes avec un petit nombre de cibles - l'effet est négatif.

Non négatif, mais tend vers un, c'est-à-dire le maximum. Il devrait tendre vers zéro.

logloss montre la corrélation entre vos caractéristiques et la cible, en gros, c'est-à-dire que 0 correspond à une corrélation totale, c'est-à-dire qu'elles décrivent bien la cible. 1 correspond à l'absence totale de description, c'est-à-dire qu'elles ne sont absolument pas informatives. C'est un bon indicateur dans le sens où il nous dit s'il y a une corrélation quelconque. Vous n'obtenez aucune corrélation du tout.

Je ne sais pas, faites-en une classe normale de 2 et non de 3.

 
elibrarius:

Et sur un échantillon en dehors de la formation, quoi ? Les six prochains mois par exemple ?

Et l'échantillonnage en dehors de l'entraînement, pour ainsi dire... Pas fait, formé pour environ le 1er mars 2019, j'ai décidé d'utiliser toutes les informations de 2014.

Mais, décidé de voir par moi-même ce que ces arbres donnent, l'a collé dans EA et a fait trois passages avec 3 arbres différents du 1er mars 2019 au 15 septembre 2019.

1. Première étape de séparation


2. Vingtième étape de séparation


3. Quarante-huitième étape de la division

Et, en général, je suis moi-même surpris que les trois modèles aient des résultats positifs !

Il est intéressant de noter que le 2e modèle est plus lisse, tandis que le 3e modèle a déjà du mal à se glisser dans le côté positif.

Il est intéressant de noter que la précision des modèles n'est pas beaucoup plus mauvaise, et qu'elle s'est même parfois améliorée. Le tableau ci-dessous présente les changements en pourcentage par rapport à l'échantillon d'entraînement.


Je ne peux pas me prononcer sur l'exhaustivité et la perte de logarithme - il faut prendre les indicateurs et faire l'échantillonnage.

Et oui, la plupart des modèles bouclent lors de la formation à zéro, car il y a vraiment une prépondérance de cette classe par rapport aux deux autres, et les zéros sont alors plus faciles à trouver - c'est ce qui gâche tout.

 
Maxim Dmitrievsky:

n'est pas négatif mais tend vers un, c'est-à-dire vers le maximum. Elle doit tendre vers zéro.

Le logloss indique le degré de corrélation de vos caractéristiques avec la cible, en gros, c'est-à-dire que 0 correspond à une corrélation totale, c'est-à-dire qu'elles décrivent bien la cible. 1 correspond à l'absence totale de description, c'est-à-dire qu'elles ne sont absolument pas informatives. C'est un bon indicateur dans le sens où il nous dit s'il y a une corrélation quelconque. Vous n'obtenez aucune corrélation du tout.

Je ne sais pas, faites-en un grade normal 2 au lieu d'un grade 3.

Je ne suis pas sûr que Logloss en multi-classe en soit un... En général, je n'arrive pas à trouver comment mettre en œuvre la formule moi-même - je ne comprends pas ces cryptages de sources publiques. Et j'aimerais voir le logloss, pas le final, mais pour l'ensemble de l'échantillon, comment il évolue et où il s'affaisse. Et comme je l'ai compris, c'est plus correct avec un échantillon équilibré...

 
Aleksey Vyazmikin:

Je ne suis pas sûr que Logloss pour la multi-classification soit égal à un... En général, je n'arrive pas à comprendre comment mettre en œuvre la formule moi-même - je ne comprends pas ces cryptages de sources publiques. Et j'aimerais voir le logloss, pas le final, mais pour l'ensemble de l'échantillon, comment il évolue et où il s'affaisse. Et si je comprends bien, c'est correct dans un échantillon équilibré dans une plus grande mesure...

Je ne veux pas me creuser la tête à ce sujet... les grandes entreprises comme Yandex font des choses. Ils disent : fais ça et tout ira bien. Fais-le et ne le fais pas tout seul. Vous vous noyez dans la rhétorique et les différentes approches.

Il montre le changement au fur et à mesure qu'il avance dans la pente, en construisant des arbres.
 
Aleksey Vyazmikin:

Et l'échantillonnage en dehors de la formation, pour ainsi dire... Ne l'a pas fait, s'est entraîné pour environ le 1er mars 2019, a décidé que je devais utiliser toutes les informations de 2014.

Mais, décidé de voir par moi-même ce que ces arbres donnent, l'a collé dans EA et a fait trois passages avec 3 arbres différents du 1er mars 2019 au 15 septembre 2019.

1. Première étape de séparation


2. Vingtième étape de séparation


3. Quarante-huitième étape de la division

Et, en général, je suis moi-même surpris que les trois modèles aient des résultats positifs !

Il est intéressant de noter que le 2e modèle est plus lisse, tandis que le 3e modèle a déjà du mal à se glisser dans le côté positif.

Il est intéressant de noter que la précision des modèles ne s'est pas beaucoup détériorée, et s'est même parfois améliorée. Le tableau ci-dessous montre les variations en pourcentage par rapport à l'échantillon de formation


Je ne peux pas me prononcer sur l'exhaustivité et la perte de logarithme - vous devez tirer les indicateurs et faire l'échantillonnage.

Et oui, la plupart des modèles bouclent lors de l'apprentissage à zéro, car il y a vraiment une prépondérance de cette classe par rapport aux deux autres, et puis les zéros sont plus faciles à trouver - c'est ce qui gâche tout.

Pas mal ! Augmentez le volume et on peut déjà gagner quelque chose)
 
Maxim Dmitrievsky:

Voilà ce que je reçois. Je viens de déplacer toute la logique du bot vers python, la forêt a été remplacée par boost. Je n'ai pas trouvé d'erreur, il semblerait qu'il n'y ait pas de coup d'œil. Selon les réglages, les acuras peuvent être augmentés jusqu'à 0,7-0,8, tout en réduisant le nombre de transactions.

L'échafaudage présente approximativement la même gamme d'erreurs, mais il ne s'agit pas d'acuras, mais d'erreurs de classification. Et il se comporte de la même manière en trayne, voire mieux. Mais c'est bien pire au test.

l'apprentissage :

L'apprentissage est 10 fois plus important


Qu'y a-t-il sur le pas de la porte ? Des prix purs ?
 
elibrarius:
Qu'est-ce qu'il y a sur le chemin ? Des prix purs ?

incréments

Je finirai le connecteur ce week-end et le mettrai à l'épreuve. Je prévois de télécharger le modèle sur le nuage et de récupérer les signaux à partir du terminal. J'envisage de placer le modèle dans le nuage et de récupérer les signaux à partir du terminal. Je peux vous envoyer le client sur MT5
 

Une approche simple et intéressante sur la façon de décrire les modèles pour le MoD

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

A simple algorithm to detect complex chart patterns
A simple algorithm to detect complex chart patterns
  • Kahler Philipp
  • www.quanttrader.com
Finding complex chart patterns has never been an easy task. This article will give you a simple indicator for complex chart pattern recognition. You will have the freedom to detect any pattern with any pattern length. Not just 2-bar candlestick formations, but complex stuff like V-Tops spread over 20 bars. Defining a chart pattern I am using a...