L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3183

 

C'est exactement de la même manière que j'obtiens des modèles OOS fonctionnant ou non, grâce au même algorithme. Le symbole est le même, aucune nouvelle randomisation n'a été ajoutée. L'algorithme ne fait que trouver de manière aléatoire des modèles à long terme ou des modèles locaux. Parce que l'entraînement se fait sur un sous-échantillon aléatoire (40 % à l'intérieur de la fourchette sélectionnée), et qu'il y a toujours d'autres randomiseurs qui cherchent des modèles par le biais de la randomisation, que la randomisation poursuit.


 
fxsaber #:

Un.

Je ne comprends pas cette affirmation. Que signifient les deux options suivantes ?

  1. Il faut de nombreuses itérations de randomisation pour obtenir un personnage viable.
  2. Si vous créez un grand nombre de personnages aléatoires, la probabilité qu'il y en ait un qui fonctionne augmente.

L'algorithme de randomisation est le suivant :

  1. Un historique de tic-tac réel est pris.
  2. Une séquence d'incréments du prix moyen ((bid+ask)/2) est créée à partir de cet historique.
  3. Dans cette séquence, chaque terme est multiplié au hasard par +1 ou -1.
  4. Un nouvel historique est collecté à partir de la séquence d'incréments obtenue, où le temps et l'écart coïncident avec le point 1.
  5. Le nouvel historique est écrit dans un symbole personnalisé.
C'est-à-dire qu'un symbole réel est aléatoire. Vous pouvez appliquer le point 3 autant de fois que vous le souhaitez. Si, après le point 5, les cinq points sont répétés, cela revient à répéter le point 3 deux fois.

Oui, les points surlignés

Vous devez exécuter de nombreuses fois, de nombreux caractères. J'ai montré un exemple de mon suréchantillonneur ci-dessus. Il tire au hasard des échantillons de la même ligne pour l'entraînement et les résultats sont toujours différents sur OOS.

Exactement les mêmes chutes brutales sur OOS.
 
Je ne comprends pas l'intérêt de cette histoire de SB, qu'est-ce que cela prouve ? ) Vous pouvez obtenir la courbe que vous voulez sur l'OOS si vous le mélangez suffisamment de fois.
 
mytarmailS #:
Merde, je ne sais pas comment l'exprimer en termes simples.

Vous choisissez de meilleures variantes "à la main" sur OOS après optimisation sur le test et ce n'est PAS un fitting.....

Et si l'algorithme choisit les meilleures options sur l'OOS après optimisation, c'est un ajustement. Pourquoi ?

Choisir les meilleures variantes/options parmi l'ensemble des variantes, c'est de l'optimisation... Peu importe que vous le fassiez à la main ou à l'aide d'un algorithme.

Peut-être n'avez-vous travaillé qu'avec le testeur dans le cadre de la TA et pensez-vous que l'optimisation elle-même et ses modalités d'application sont des formules un peu figées, d'où notre malentendu.

Votre déclaration.

Forum sur le trading, les systèmes de trading automatisés et les tests de stratégies de trading

L'apprentissage automatique dans le trading : théorie, modèles, pratique et algo-trading

mytarmailS, 2023.08.16 13:23

Imaginez que vous n'ayez que 1000 variantes de TS, en général.


vos étapes 1 et 2

1) Vous commencez à optimiser/rechercher un bon TS, c'est ce que l'on appelle les données d'entraînement (ajustement/recherche/optimisation).

Disons que vous avez trouvé 300 variantes où le CT gagne de l'argent...

2) Vous recherchez maintenant, parmi ces 300 variantes, une CT qui passera OOS, ce sont les données de test. Vous avez trouvé, disons, 10 CT qui gagnent à la fois sur la formation et sur le test ( OOS ).


Qu'est-ce que le point 2 ?

Il s'agit de la même continuation de l'ajustement, mais votre recherche(ajustement/recherche/optimisation) est devenue un peu plus profonde ou plus complexe, car vous n'avez plus une seule condition d'optimisation (réussir la transaction), mais deux (réussir le test + réussir la transaction).

Imaginons qu'il y ait un million de fois plus de variantes : 1 milliard de CT, 300 millions de variantes de CT sont trouvées, où sur l'échantillon entraîné il y a de l'argent - c'est la p.1.

En p.1., l'optimisation se fait sur la base d'une fonction d'aptitude. Plus la valeur est élevée, plus l'aptitude est supposée élevée. L'optimisation consiste donc à trouver le maximum global. Tout cela se passe en p.1.


  • Une fois l'optimisation terminée, vous pouvez rechercher parmi 300 millions de résultats positifs les cinq qui passent OOS. Je ne le fais pas.
  • Ou bien vous pouvez prendre les cinq résultats les plus proches du maximum global et ne les examiner que pour les OOS.
Dans le premier cas, il s'agit donc d'une optimisation de la vue.

C'est à dire que c'est un ajustement dans sa forme la plus pure.


Si vous faites ce dernier, cependant, ce n'est pas un ajustement.

 
Maxim Dmitrievsky #:

C'est exactement de la même manière que j'obtiens des modèles OOS fonctionnant ou non, grâce au même algorithme. Le symbole est le même, aucune nouvelle randomisation n'a été ajoutée.

J'ai suivi une formation qui ne portait pas sur le même symbole. Il est évident qu'il y a des séries avec n'importe quelle caractéristique dans le nuage de randomisation.

 

L'avant est pire et l'arrière est meilleur. Et les situations inverses sont exactement les mêmes. C'est juste que je n'ai pas beaucoup reconstruit pour le moment.

 
fxsaber #:

Votre affirmation.

Imaginons qu'il y ait un million de fois plus de variantes au total : 1 milliard de TC, 300 millions de variantes de TC sont trouvées, où sur l'échantillon entraîné cela rapporte de l'argent - c'est le point 1.

En p.1., l'optimisation se fait sur la base d'une fonction d'aptitude. Plus la valeur est élevée, plus l'aptitude est supposée élevée. L'optimisation consiste donc à trouver le maximum global. Tout cela constitue le point p.1.


  • Une fois l'optimisation terminée, vous pourriez rechercher parmi 300 millions de résultats positifs les cinq qui passent OOS. Je ne le fais pas.
  • Ou vous pouvez prendre les cinq résultats les plus proches du maximum global et ne les examiner que pour les OOS.
Dans le premier cas, il s'agit donc d'une optimisation de la forme suivante

Il s'agit donc d'un ajustement pur.


Si vous faites le second, ce n'est pas un ajustement.

J'ai compris. Je m'excuse.

 
fxsaber #:

J'ai suivi une formation sur plus d'une caractéristique. Évidemment, dans le nuage de la randomisation, il y a des lignes avec n'importe quelle caractéristique.

Je ne vois pas de problème. Toutes ces TS sont randomisées parce qu'elles opèrent sur un marché non stationnaire. Mais certaines variantes peuvent apporter des bénéfices dans une certaine perspective.

 
Maxim Dmitrievsky #:

Oui, la mise en évidence

Vous devez exécuter plusieurs fois, plusieurs caractères.


J'ai montré un exemple de mon suréchantillonneur ci-dessus. Il tire au hasard des échantillons de la même ligne pour l'entraînement et les résultats sont toujours différents sur OOS.

Sur le symbole réel, je n'ai pas cet effet. Je choisis n'importe quel 40% de l'intervalle d'optimisation et après cela, les résultats sont très similaires sur OOS.

C'est le symbole que j'ai choisi pour la randomisation et j'ai donné ses graphiques d'entraînement.

Exactement les mêmes chutes brutales sur l'OOS.

Je ne les vois pas toujours.

 
fxsaber #:

Sur le symbole réel, je n'observe pas un tel effet. Je choisis n'importe quel 40% de l'intervalle d'optimisation et après cela les résultats sont très similaires sur OOS.

C'est le symbole que j'ai choisi pour la randomisation et dont j'ai donné les graphiques d'entraînement.

Je ne les vois pas toujours.

Cela signifie toujours qu'il y a plus d'alpha dans les ticks. J'ai trouvé un moyen de faire une recherche rapide dans ces graphiques (avec MO, cela aurait été très long). Je présenterai les résultats plus tard lorsque j'aurai terminé.