L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 1517

 
fxsaber:

Question 01.

Les indicateurs suivants n'ont qu'un seul paramètre d'entrée externe

  • Lissage exponentiel - période/coefficient.
  • PriceChannel (prix le plus élevé et le plus bas par intervalle) - taille de l'intervalle.
  • ZigZag - taille du genou minimal.

J'ai choisi ces indicateurs précisément en raison du minimum de paramètres d'entrée externes.

Est-il possible de reproduire leurs algorithmes à l'aide de méthodes MO. C'est-à-dire qu'il est possible de prendre n'importe quel historique, d'exécuter les indicateurs avec n'importe quels paramètres et de les transmettre au MO. Est-il possible d'obtenir l'algorithme indicateur approprié dans la sortie ?

La question porte sur l'établissement de la tâche pour le MO, c'est-à-dire que nous devrions marquer l'historique, je pense que le même PriceChannel est facile à enseigner, ZZ peut être second en complexité mais le Lissage Ekponentiel - ce n'est pas une classification mais une régression, probablement, la même idée peut être appliquée mais je n'ai pas traité la régression.

 

Question 03.

J'ai rencontré plusieurs fois de telles situations dans la pratique. TS montre le bénéfice sur l'intervalle de test. Lorsque j'exécute OOS pendant plusieurs fois plus longtemps, il affiche le même bénéfice. Une fois que j'ai misé sur le compte réel, le bénéfice reste le même pendant plusieurs mois.


Et à un moment donné, la systématique tombe. La réoptimisation du même TS ne donne aucun résultat positif. Dans le meilleur des cas, cela ralentit la dégringolade.

Au bout d'un moment, le programmeur comprend que tout est nul et quitte le compte réel. Vous observez pendant plusieurs mois comment le TS se perd dans le testeur.


Et tout à coup, deux semaines de profit, un mois de profit, un mois sans profit - profit. C'est le même TS. Vous le mettez sur le réel et vous obtenez tout ce qui est décrit dans le premier paragraphe.

Il ne s'agit pas d'une situation hypothétique, mais d'un cas pratique. Dans ce cas, le TS n'a démontré sa graalité que sur un petit nombre de symboles. Pour d'autres, c'était une fuite à longueur d'année.


Et, bien sûr, le TS n'a pas besoin de trader vingt-quatre heures sur vingt-quatre. Il aurait pu y avoir un intervalle de négociation intraday.


En ce qui concerne les pratiques communes d'application de la MO, a-t-il été possible d'obtenir un TS avec des caractéristiques similaires ?

 
fxsaber:

Question 02.

Laissez le TS avec quatre paramètres d'entrée effectuer des milliers de transactions sur un intervalle donné. Nous ajoutons deux paramètres d'entrée avec un faible nombre de variantes possibles comme filtre. Dans la sortie, nous avons un graphique en ligne droite jusqu'à environ un millier de transactions. Et tous sont répartis plus ou moins uniformément sur l'ensemble de la zone d'essai.


Quelle est la raison de la forte probabilité de perdre 5% de l'intervalle initial sur OOS ? Un intervalle énorme et seulement six entrées ont donné un résultat positif sur un très grand nombre de transactions. Et ce qui en est ressorti, c'est une crise à visage découvert.

Cela signifie-t-il qu'il y a plus de six paramètres ? C'est une sorte de référence à la première question: les algorithmes qui nous paraissent simples ne sont-ils pas en fait complexes par nature ?

Et pourquoi n'y aurait-il pas de prune ? Quelle est la similitude des données historiques - c'est une question distincte pour évaluer la justesse du modèle.

Et puis ce qui a été donné en entrée, comment l'histoire a été balisée pour la formation, ce qui a été enseigné - il y a beaucoup de nuances ici.

 
fxsaber:

Question 03.

J'ai rencontré plusieurs fois de telles situations dans la pratique. TS montre le bénéfice sur l'intervalle de test. Lorsque j'exécute OOS pendant plusieurs fois plus longtemps, il affiche le même bénéfice. Une fois que j'ai misé sur le compte réel, le bénéfice reste le même pendant plusieurs mois.


Et à un moment donné, la systématique tombe. La réoptimisation du même TS ne donne aucun résultat positif. Dans le meilleur des cas, cela ralentit la dégringolade.

Au bout d'un moment, le programmeur comprend que tout est nul et quitte le compte réel. Vous observez pendant plusieurs mois comment le TS se perd dans le testeur.


Et tout à coup, deux semaines de profit, un mois de profit, un mois sans profit - profit. C'est le même TS. Vous le mettez sur le réel et obtenez tout comme décrit dans le premier paragraphe.

Il ne s'agit pas d'une situation hypothétique, mais d'un cas pratique. Dans ce cas, le TS n'a démontré sa graalité que sur un petit nombre de symboles. Pour d'autres, c'était une fuite à longueur d'année.


Et, bien sûr, le TS n'a pas besoin de trader vingt-quatre heures sur vingt-quatre. Il aurait pu y avoir un intervalle de négociation intraday.


En ce qui concerne les pratiques communes d'application de la MO, a-t-il été possible d'obtenir un TS avec des caractéristiques similaires ?

Il s'agit donc à nouveau d'une question liée aux phases du marché et à ce que le TS/modèle MO a appris. Par exemple, j'ai formé le modèle sur CatBoost - tout est bon sur l'historique en dehors de la formation, je l'ai mis sur le réel et le modèle est resté silencieux pendant 3 mois - je l'ai enlevé et pour le dernier mois à travers les tests, je vois que j'ai manqué beaucoup de trades rentables (le mois dernier), mais alors apparemment le modèle lui-même a pris quelque chose en compte et n'a pas tradé, parce que le marché était vraiment très plat, et le modèle est réglé sur la tendance (à la minute).

 
Aleksey Vyazmikin:

Pourquoi n'y aurait-il pas d'écoulement ? Quelle est la similitude des données historiques ? C'est une question distincte qui permet d'évaluer l'exactitude du modèle.

Et puis, ce qui a été donné en entrée, comment l'histoire a été balisée pour la formation, ce qui a été enseigné - il y a beaucoup de nuances ici.

Quelle formation ? Un simple conseiller expert classique avec six paramètres optimisables. L'AG ordinaire montre d'excellents résultats sur l'intervalle.

Je ne suis pas intéressé par la réponse "pourquoi vous attendiez-vous à ce qu'il échoue sur OOS ? Et quelle est la raison pour laquelle il est raisonnable de perdre sur les OOS même avec un millier de transactions ?


Mon raisonnement d'amateur est le suivant.

Le CT a très peu de degrés de liberté. La probabilité d'ajustement diminue donc.

Des milliers de transactions uniformément réparties sur l'intervalle - cela signifie que le "modèle" à long terme sur cet intervalle a été détecté. D'autant plus que le graphique de l'équilibre est presque une ligne droite.


Qu'est-ce qui ne va pas dans ce raisonnement ? Je suppose qu'en fait les paramètres d'entrée ne sont pas six, mais conventionnellement un million. C'est le nombre de paramètres d'entrée de la machine universelle qui reproduisent l'algorithme TC. C'est-à-dire que l'algorithme lui-même est un certain ensemble de paramètres d'entrée.

 
fxsaber:

Quelle formation ? ! Un EA classique ordinaire avec six paramètres optimisables. L'AG ordinaire produit d'excellents résultats sur l'intervalle.

Je ne suis pas intéressé par la réponse "à quoi tu t'attendais, bien sûr que je perds sur OOS". Et quelle est la raison pour laquelle on perd sur les OOS même avec un millier de transactions ?

Et quel est l'intervalle d'apprentissage ? 1000 trades peuvent être sur une tendance globale où l'ouverture de positions sur son vecteur donnera un avantage en soi.

Par exemple, je forme Si futures sur l'historique de 5 ans pour avoir plus de situations différentes. De 2008 à 2016 j'ai optimisé des EAs pour le forex sur 15 min, ils sont suffisamment survivants pour le moyennage.

Et par essence, l'optimisation est la même méthode MO, donc tout ce qui a été dit auparavant est vrai.

fxsaber:

Mon raisonnement d'amateur est le suivant.

Il y a très peu de degrés de liberté dans la CT. La probabilité d'un ajustement diminue donc.

Des milliers de transactions uniformément réparties sur l'intervalle - cela signifie que le "modèle" à long terme sur cet intervalle a été détecté. D'autant plus que le graphique de l'équilibre est presque une ligne droite.

Pourquoi ne voulez-vous pas penser à évaluer la similitude des marchés - je vois par exemple que sur le Forex la volatilité a nettement diminué ces dernières années, même cette année - j'avais l'habitude de gagner 3-4 fois plus par mois, et maintenant juste aucun mouvement et aucune affaire sur mon TS sur le forex.

Et puis, il faut tout regarder objectivement, essayer de comprendre ce que fait le TS, si c'est vraiment simple et se demander si ses actions sont raisonnables ou si c'est le fruit du hasard.


fxsaber:

Qu'est-ce qui ne va vraiment pas dans ce raisonnement ?

Raisonnement erroné, car il suppose la stationnarité du marché, ce qui n'est pas la même chose...

fxsaber:

Je suppose qu'en fait les paramètres d'entrée ne sont pas six, mais conventionnellement un million. C'est le nombre de paramètres d'entrée de la machine universelle qui reproduisent l'algorithme TS. C'est-à-dire que l'algorithme lui-même est un certain ensemble de paramètres d'entrée.

Si nous parlons d'indicateurs, il y a beaucoup plus de paramètres, parce que nous devons considérer la logique de l'indicateur lui-même, presque chaque if dans le code de l'indicateur comme une condition séparée et cela, bien sûr, va générer un nombre incalculable de combinaisons. Cependant, je pense personnellement qu'au contraire, l'utilisation d'indicateurs est une approche judicieuse, car je suppose que de nombreux participants au marché les utilisent, ce qui signifie qu'il y a une probabilité d'attraper un peu de la logique de la TS d'un participant avec de l'argent.

 
fxsaber:

Question 01.

Les indicateurs suivants n'ont qu'un seul paramètre d'entrée externe

  • Lissage exponentiel - période/coefficient.
  • PriceChannel (prix le plus élevé et le plus bas par intervalle) - taille de l'intervalle.
  • ZigZag - taille du genou minimal.

J'ai choisi ces indicateurs précisément en raison du minimum de paramètres d'entrée externes.

Est-il possible de reproduire leurs algorithmes à l'aide de méthodes MO. C'est-à-dire qu'il est possible de prendre n'importe quel historique, d'exécuter les indicateurs avec n'importe quels paramètres et de les transmettre au MO. Est-il possible d'obtenir l'algorithme de l'indicateur correspondant dans la sortie ?

Le lissage de type EMA peut être exactement obtenu, j'espère que vous parlez du résultat et non de l'"algorithme" sous forme de code :)

Je ne suis pas si sûr de PriceChannel et de ZZ, je suis sûr qu'ils auront des défauts. En général, la tâche est intéressante, merci :)

fxsaber:

Question 02.

Supposons que le TS avec quatre paramètres d'entrée sur un certain intervalle effectue des milliers de transactions. Ajouter comme filtre deux paramètres d'entrée avec un faible nombre de variantes possibles. Le résultat sera un graphique en ligne droite avec environ mille transactions. Et tous sont répartis plus ou moins uniformément sur l'ensemble de la zone d'essai.


Quelle est la raison de la forte probabilité de perdre 5% de l'intervalle initial sur OOS ? Un intervalle énorme et seulement six entrées ont donné un résultat positif sur un très grand nombre de transactions. Et ce qui en est ressorti, c'est une crise à visage découvert.

Cela signifie-t-il qu'il y a plus de six paramètres ? Il s'agit en quelque sorte d'une référence à la première question: les algorithmes simples ne sont-ils pas compliqués par nature ?

Il s'agit davantage d'une question de type d'algorithme de stratégie et de MM que de prédiction. Si vous ne savez pas quel type d'erreur vous pouvez rencontrer dans votre estimation, vous pouvez calculer la probabilité d'erreur en utilisant l'un des paramètres, vous pouvez calculer la valeur maximale de la prédiction mathématique.

fxsaber:

Question 03.

J'ai été confronté à de telles situations à plusieurs reprises dans la pratique. Le TS indique le bénéfice sur l'intervalle de test. Lorsque vous ouvrez la porte pour plusieurs fois plus, le bénéfice reste le même. Pariez sur un compte réel et il affiche le même bénéfice pendant plusieurs mois.


Et à un moment donné, la systématique tombe. La réoptimisation du même TS ne donne aucun résultat positif. Dans le meilleur des cas, cela ralentit la dégringolade.

Au bout d'un moment, le programmeur comprend que tout est nul et quitte le compte réel. Vous observez pendant plusieurs mois comment le TS se perd dans le testeur.


Et tout à coup, deux semaines de profit, un mois de profit, un mois sans profit - profit. C'est le même TS. Vous le mettez sur le réel et obtenez tout comme décrit dans le premier paragraphe.

Il ne s'agit pas d'une situation hypothétique, mais d'un cas pratique. Dans ce cas, le TS n'a démontré sa graalité que sur un petit nombre de symboles. Pour d'autres, c'était une fuite à longueur d'année.


Et, bien sûr, le TS n'a pas besoin de trader vingt-quatre heures sur vingt-quatre. Il aurait pu y avoir un intervalle de négociation intraday.


En ce qui concerne les pratiques courantes d'application de la MO, a-t-il été possible d'obtenir un TS présentant ces caractéristiques ?

Je ne pense pas que quiconque puisse commenter de telles caractéristiques "la main sur le cœur". En général, vous ne devriez pas penser à utiliser le MoD comme une chose distincte, le MoD n'est qu'une extension des statistiques, un algorithme général est un MoD, même l'optimisation des mailles est un MoD, donc il y a toujours eu du MoD dans le trading algorithmique :)

Les paresseux ont tendance à espérer une automatisation complète de la recherche de CT et à laisser la RI faire tout à leur place, heureusement cela n'arrivera pas avant longtemps, et quand ce sera le cas cela n'aura pas de sens financier, mais en attendant la RI classique est mauvaise pour la recherche de signes sensibles et "profonde" est très fantaisiste à tous égards, travailler avec elle est pénible et les résultats sont nébuleux.

 
fxsaber:

Mon raisonnement d'amateur est le suivant.

Il y a très peu de degrés de liberté dans le CT. La probabilité de s'adapter diminue donc.

Des milliers de transactions uniformément réparties sur l'intervalle - cela signifie que le "modèle" à long terme sur cet intervalle est révélé. D'autant plus que le graphique de l'équilibre est presque une ligne droite.

Qu'est-ce qui ne va pas dans ce raisonnement ? Je suppose qu'en fait les paramètres d'entrée ne sont pas six, mais conventionnellement un million. C'est le nombre de paramètres d'entrée de la machine universelle qui reproduisent l'algorithme TC. C'est-à-dire que l'algorithme lui-même est un ensemble de paramètres d'entrée.

Ce qui ne va pas, c'est que lors de l'estimation d'une série temporelle (qu'il s'agisse d'un prix, d'une séquence de lancers de dés ou de chiffres de la "roue de la fortune"... ou même d'un graphique de températures)

Vous (et nous tous les participants de ce forum) supposez que les séries temporelles doivent se comporter à l'avenir de cette manière - nous avons essayé ! Malheureusement, l'ajustement est toujours présent, et plus nous utilisons les données d'entrée, plus l'ajustement et notre confiance augmentent.

lire la première partie de l'article sur le hubrahttps://habr.com/ru/company/ods/blog/322716/

avant le graphique

J'ai vraiment apprécié la présentation


bien et sur votre question avec MO, mon raisonnement dilettante :

problème pour préparer les données d'entrée pour l'entraînement, avec ZigZag en général un problème - la chose la plus simple est d'alimenter les prix de ZZ kinks - entraîné, testé - ne fonctionne pas, pourquoi ? - parce qu'elle est étroitement liée à des données spécifiques, il n'y a pas de tels prix dans le futur, NS est un polynôme régulier y = ax+bx+cx+dx+ex..... le nombre de polynômes est le nombre de neurones, plus il y a de neurones, meilleure est la qualité (erreur NS), mais plus rapide est le ré-entraînement se produit.... le sur-apprentissage est combattu en inventant de nouveaux types de NS, mais il y a aussi des cas où c'est mieux où c'est moins bien.....

mais avec les fonctions périodiques, NS fonctionnera, en fait, parfaitement - un graphique de sinus/cosinus à n'importe quelle échelle et avec un minimum de données pour l'apprentissage - parce que de telles fonctions peuvent être écrites en utilisant l'expansion des séries de Taylor ? (je ne me souviens pas déjà) - et cela ferait cinq polynômes y = ax+bx+cx+dx+ex

ZS : avec les séries de prix, personne n'a réussi à inventer une formule polynomiale - c'est pourquoi NS ne fonctionne pas parfaitement... Peut-être qu'une formule n'existe pas)))

 
Gianni:

C'est plus une question de type d'algorithme de stratégie et de MM que de prédiction. Je dirais que la plupart des grails des testeurs sont réversibles avec le calcul de la moyenne et parfois en restant trop longtemps assis, en utilisant de telles configurations il est très facile d'obtenir un "grail" avec un paramètre, vous devriez supprimer le calcul de la moyenne afin d'obtenir une image plus objective, bien que ce ne soit pas suffisant, IMHO l'attente des prévisions devrait être mesurée correctement (tendances / virages), parce que vous pouvez tromper beaucoup non seulement les autres mais vous-même aussi.

J'ai fait tourner quelque chose ce soir. En tant que réponse non citée, je pense qu'il sera intéressant pour les autres de la lire.

https://www.mql5.com/ru/blogs/post/728196

EURDKK vs swap
EURDKK vs swap
  • www.mql5.com
Тиковая ТС, без использования каких-либо индикаторов, включая бары. Более того, никак не обращается к истории цены. Внутри нет циклов. В общем быстрая однопроходная болванка. При этом еще и переворотная: сигнал на закрытие является сигналом на открытие противоположной позиции. Т.е. в рынке постоянно. Постоянный лот. Ну и для некоторой честности...
 
fxsaber:

1. Oui, avec une certaine précision (erreur d'approximation)

2. Prenez un polynôme du troisième degré (seulement 3 termes libres) et adaptez-le à un morceau de graphique d'un kilomètre de long. Cela signifie-t-il qu'il fonctionnera sur l'OOS ? Bien sûr que non. Les courbes vont commencer à diverger presque immédiatement, mais parfois vous pouvez avoir de la chance avec la direction. Si le modèle est inconnu (théoriquement, conceptuellement, fondamentalement - peu importe) et qu'il est exploité, alors la question peut être écartée, car il s'agit toujours d'un ajustement pour SB.

3. En ce qui concerne le ministère de la Défense, vous pouvez obtenir tout ce que vous voulez. Fondamentalement, ces parcelles seront avec certaines tendances, si elles sont similaires, alors cela fonctionnera. C'est-à-dire que dans ce cas, c'est la tendance globale qui change, très probablement, ou encore le marché devient semblable à ce qu'il était, à moyen terme. C'est pourquoi ça marche/ça ne marche pas.

Toutes ces questions sont résolues en économétrie au niveau conceptuel : la tendance linéaire est la composante principale, elle est prédite en premier. Puis des fluctuations non linéaires autour du bâton droit, à condition que la tendance persiste. La tendance la plus importante ne peut être prédite en raison du manque d'itération, c'est-à-dire que toute l'incertitude proviendra du plan à long terme. Quelques termes libres, généralement pas plus de 3, décrivent toute courbe de marché. Le MOS peut déjà être ajusté aux résidus de ce qui n'est pas prévu.