L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 55

 
Vadim Shishkin:

J'ajouterai une intrigue : il n'est pas nécessaire de présenter un changement dans le taux de change d'un article échangé.

C'est comme se traîner par les cheveux hors d'un marécage.

Recherchez également d'autres sources de données.

Que Profit soit avec vous !

:)

Si c'est ce que vous voulez dire ? Eh bien, c'est une découverte américaine. Je serais heureux d'inclure plus d'informations, mais à part l'historique des prix, il est difficile d'obtenir autre chose dans ce volume.

Et tirer par les cheveux est une erreur. Les données contiennent le signal. Et il y en a suffisamment pour couvrir les coûts et faire des bénéfices. Cela a été pratiquement confirmé, bien que sur l'histoire. Et ceux qui ne peuvent l'extraire dansent avec le tambourin. J'ai une certaine expérience du verre mais je ne suis pas encore sûr de pouvoir en faire quelque chose.

 

***Je suis fatigué.

Y aura-t-il un État ?

 
Alexey Burnakov:

Je vous suggère de lire quelques bonnes notes sur la construction de systèmes de trading à partir d'une position de quant (un quant senior dans un grand fonds d'investissement). Les idées me semblaient raisonnables.

...

Qu'est-ce que vous approuvez ou désapprouvez ? Qu'est-ce que vous aimeriez mieux étudier ?

Au moins, avec une division stricte en échantillons de formation et de test par dates au lieu d'un mélange aléatoire préliminaire d'échantillons avec une distribution égale dans l'échantillon général et ensuite divisé en parties. Il peut arriver qu'une partie de l'échantillon contienne principalement des tendances verticales, tandis que l'autre partie contient des tendances latérales. Si nous appliquons un mélange aléatoire, la probabilité de rassembler des motifs similaires dans différentes parties de l'échantillon diminue.

D'ailleurs, un tel inconvénient est également présent dans le testeur de stratégie intégré de MetaTrader, c'est-à-dire qu'il divise l'échantillon d'entraînement et le test à terme strictement par dates. Par conséquent, les changements de tendance du marché proches de la ligne de démarcation peuvent conduire à un surentraînement délibéré.

 
Vadim Shishkin:
Mon garçon, sors d'ici.
 
Combinateur:
Mon garçon, sors d'ici.
C'est ça ? Vous n'avez rien d'autre à dire que l'impolitesse, n'est-ce pas ?
 
Alexey Burnakov:

En particulier, j'ai aimé celui-ci :

Ainsi, vous séparez strictement l'échantillon et le hors-échantillon ; - vous séparez strictement l'ensemble de formation et l' ensemble devalidation.

vous vous aveuglez sur les plages de dates ; - vous séparez les données exactement par des dates (avant le jour X - formation, après - validation)

vous utilisez la méthode de Monte Carlo pour éviter les biais liés aux points de départ ; - vous générez plusieurs résultats de la stratégie de trading, de sorte que vous n'obtiendrez pas d'ajustement pour les points d'entrée et de sortie.

et vous essayez diverses astuces de robustesse. - Appliquer des techniques de robustesse.

Que faites-vous d'autre pour vous assurer que vous ne vous trompez pas vous-même ?

Tout semble correct (mais je n'ai pas tout essayé moi-même), sauf la première. Il me semble que si l'on utilise strictement un ensemble de données d'apprentissage et que l'on choisit des prédicteurs pour cet ensemble, on obtient un super ajustement de ces mêmes prédicteurs, qui peuvent ne pas être fiables dans d'autres intervalles de temps. Je crée maintenant un nouvel échantillon de formation et de validation à chaque fois avant de former le modèle lors de la sélection des prédicteurs. Il est préférable de recréer des échantillons 3 fois et d'entraîner le modèle et de prendre la précision moyenne que de toujours utiliser les mêmes échantillons d'entraînement et de validation.

J'aime bien celui sur les réseaux neuronaux de protéines :) . Parfois, en raison d'une topologie malheureuse, ils produisent effectivement des résultats très insuffisants.

 
Vadim Shishkin:

***Je suis fatigué.

Y aura-t-il un État ?

Non. Il faut être plus intelligent que ça pour s'en rendre compte il y a longtemps. Il y a du développement ici.
 
Alexey Burnakov:
Non. Il faut être plus intelligent pour le comprendre il y a longtemps. Il y a un développement.
Oui. Pourriez-vous dire en quelle année se déroule le développement, et où vous pouvez voir ses résultats ? :)
 
Dr. Trader:

Tout semble correct (mais je n'ai pas tout essayé moi-même), sauf la première. Il me semble que si l'on utilise strictement un ensemble de données de formation et que l'on y adapte des prédicteurs, on obtient un ajustement excessif de ces mêmes prédicteurs, qui peuvent ne pas être valables dans d'autres périodes. Je crée maintenant un nouvel échantillon de formation et de validation à chaque fois avant de former le modèle lors de la sélection des prédicteurs. Il est préférable de recréer des échantillons 3 fois et d'entraîner le modèle et de prendre la précision moyenne que de toujours utiliser les mêmes échantillons d'entraînement et de validation.

J'aime bien celui sur les réseaux neuronaux de protéines :) . Parfois, en raison d'une topologie malheureuse, ils produisent des résultats très insuffisants.

Oui. J'aimerais vraiment voir leurs résultats. J'ai quelque chose à montrer.

Et vous ?

Cependant, la question semble être rhétorique.

 
Vadim Shishkin:
Ouaip. Pouvez-vous me dire combien d'années de développement sont en cours, et où je peux voir les résultats ? :)
Plusieurs années. Le résultat se trouve dans le fil de discussion.