Où se situe la limite entre l'ajustement et les modèles réels ? - page 54

 
Vigor:
La grande majorité des traders perdent, est-ce une tendance ? Oui. Y a-t-il un modèle ? Non. Fringe, cependant. Vous pouvez gagner de l'argent avec ça ? Oui. Apprendre à être un chef.

Ha-ha-ha-.... Ce n'est pas drôle.
 

J'ai accidentellement fait une autre expérience thématique, dont je n'ai même pas encore trouvé comment évaluer les résultats).

J'ai optimisé mon conseiller expert et lui ai accidentellement donné un fichier avec des données complètement erronées pour l'analyse. C'est-à-dire que pendant l'optimisation, le conseiller expert négociait sur la base des données de novembre 2010, mais il analysait les données de quelque part en 2009 (il n'y a pratiquement aucune corrélation significative) et ouvrait des transactions sur cette base. Grâce à l'apprentissage, j'ai obtenu le résultat de 1000 anciens pips de profit avec un ajustement pur (j'ai analysé une chose, tradé l'autre). J'ai compris l'erreur, j'ai effectué l'optimisation avec les données correctes - le résultat était de 2000 pips. Maintenant je pense comment apprendre à séparer la composante d'ajustement des résultats de formation avec l'ajustement pur et l'ajustement + régularités.

Et en général, l'approche : analyser un, trader un autre, ne nous permettra pas de déterminer la "persistance" du conseiller expert ?

 
Figar0:
.........

Et en général, l'approche même : analyser une chose, en échanger une autre, ne permettrait pas de déterminer la " persistance " d'un expert ?

C'est ce que tout le monde fait toujours. Analyser l'histoire est une chose, négocier dans la vie réelle en est une autre.

Ou, ou plutôt, sans ou, je ne comprends rien.

 
joo:

C'est ce que tout le monde fait toujours. Analyser l'histoire est une chose, négocier dans la vie réelle en est une autre.

Ou, plus probablement, sans ou, je ne comprends rien.

Supposons que le Conseiller Expert utilise le cadre temporel de 1 à 200 et ouvre dans le sens de sa direction de la 2ème à la 1ère barre, MA[1]>MA[2] - achat, MA[1]<MA[2] - vente.

Les chiffres étaient erronés et les conditions sont les suivantes : MA[1000001]>MA[1000002] - achat, MA[1000001]<MA[1000002], c'est-à-dire que le comportement de la baguette sur des millions de barres ne décrit pas la situation actuelle lorsque l'EA ouvre la transaction. L'état du conseiller expert est "vide", un placebo. Cependant, il est presque certain que nous trouverons la période d'ondulation à laquelle nous réalisons des bénéfices sur la période d'apprentissage. Ce sera de la pure chasse à courre. C'est ce dont je parlais. Cependant, tordre ainsi un conseiller expert aussi primitif avec un petit nombre de degrés de liberté n'a probablement aucun sens. Mais à sa place, imaginez un SN dont les entrées n'ont également rien à voir avec la réalité pendant la période d'apprentissage (par exemple, une séquence binaire de bits provenant d'une copie numérique d'une vidéo sur la vie des pingouins) ? Faisons en sorte que le conseiller expert réalise un bénéfice dans la phase d'apprentissage à partir de rien, en l'ajustant délibérément et en essayant d'estimer son degré d'ajustement. D'une certaine manière... Ensuite, nous donnons les données correctes décrivant la situation au moment de la prise de décision par le conseiller expert à la même période d'apprentissage. Nous obtenons également le résultat. Nous mélangeons ces deux résultats, en essayant de comprendre l'adéquation du conseiller expert, la valeur informative des entrées, la capacité à détecter des modèles, etc.

Je ne sais pas si c'est devenu plus clair).

 
Figar0:

Supposons que mon Expert Advisor utilise une règle de swing avec des périodes de 1 à 200 et ouvre dans le sens de sa direction de la 2ème à la 1ère barre, MA[1]>MA[2] - achat, MA[1]<MA[2] - vente.

Les chiffres étaient erronés et les conditions sont les suivantes : MA[1000001]>MA[1000002] - achat, MA[1000001]<MA[1000002], c'est-à-dire que le comportement de la baguette sur des millions de barres ne décrit pas la situation actuelle lorsque l'EA ouvre la transaction. L'état du conseiller expert est "vide", un placebo. Cependant, il est presque certain que nous trouverons la période d'ondulation à laquelle nous réalisons des bénéfices sur la période d'apprentissage. Ce sera de la pure chasse à courre. C'est ce dont je parlais. Cependant, tordre ainsi un conseiller expert aussi primitif avec un petit nombre de degrés de liberté n'a probablement aucun sens. Mais à sa place, imaginez un SN dont les entrées n'ont également rien à voir avec la réalité pendant la période d'apprentissage (par exemple, une séquence binaire de bits provenant d'une copie numérique d'une vidéo sur la vie des pingouins) ? Faisons en sorte que le conseiller expert réalise un bénéfice dans la phase d'apprentissage à partir de rien, en l'ajustant délibérément et en essayant d'estimer son degré d'ajustement. D'une certaine façon... Ensuite, nous donnons les données correctes décrivant la situation au moment de la prise de décision par le conseiller expert à la même période d'apprentissage. Nous obtenons également le résultat. Nous essayons de déterminer la pertinence de l'expert et le caractère informatif des données, etc.

Je ne sais pas si c'est devenu plus clair).

Bref, le sujet est cool.

Il est évident qu'un ensemble suffisamment complexe de fonctions réglables peut permettre de faire correspondre n'importe quel ensemble aléatoire à n'importe quel autre ensemble (aléatoire ou non) en ajustant les paramètres de mise en correspondance. Théoriquement, avec un certain degré de précision... :)

Les traders de DC (et pas seulement) sont également formés pour trader de cette manière : ils apprennent à convertir un flux plutôt aléatoire d'indicateurs standards (lire - qui ne fonctionnent pas) en un flux d'opérations commerciales... :-) ... .. // ou :-( ... ?

Récemment, j'ai eu un incident : j'ai optimisé un conseiller expert en utilisant des indicateurs intelligents qui ont plusieurs modes de fonctionnement. Les modes sont paramétrables (chacun à sa manière). J'ai donc défini les paramètres d'un mauvais mode d'optimisation. C'est-à-dire que ces paramètres n'ont aucun effet sur les performances du Conseiller Expert dans le mode actuel des indicateurs.

// Je n'ai pas trouvé mon erreur à temps, car il y a quelques paramètres qui sont optimisés en plus de ceux qui ne fonctionnent pas. Par conséquent, l'optimisation est terminée.

Un résultat intéressant : ces paramètres (non fonctionnels) ont progressivement convergé vers leurs valeurs spécifiques et n'ont pas changé jusqu'à la fin de l'optimisation. C'est-à-dire qu'ils se sont comportés de manière pseudo-sensible, comme s'ils étaient réellement optimisés... ( !!!) Si je n'étais pas l'auteur de l'expert, j'aurais décidé que ce sont les valeurs Exact-Optimal-Graal-itp, qui devraient être soigneusement préservées (de préférence dans le secret du public) et youzu, youzu, youzu....... Et en aucun cas, ne le changez pas !

Quand j'ai vu et réalisé ce cas, j'ai tristement pensé - c'est le mécanisme exact de création de superstitions, avec lequel toute notre vie insondable, et le Forex en particulier, est remplie... ;-)

------------------

Quant à la suggestion d'étudier les systèmes pour leur "adaptabilité", elle n'en vaut pas la peine, à mon avis. Il est clair qu'un bon système est bien adaptable. Mais il est également doué pour l'abstraction. Un mauvais système peut être peu adaptable et bien adaptable. Mais il ne peut pas être abstrait. L'adaptabilité n'est donc guère un critère de qualité d'un système (sa généralisabilité).

Il est préférable d'utiliser une mesure bien connue avec l'ajout d'un signal aléatoire de faible amplitude au stade de l'apprentissage pour réduire les phénomènes d'ajustement. Ceci est d'une utilité plus pratique.

 
Figar0:

Supposons que mon Expert Advisor utilise une règle de swing avec des périodes de 1 à 200 et ouvre dans le sens de sa direction de la 2ème à la 1ère barre, MA[1]>MA[2] - achat, MA[1]<MA[2] - vente.

Les chiffres étaient erronés et les conditions sont les suivantes : MA[1000001]>MA[1000002] - achat, MA[1000001]<MA[1000002], c'est-à-dire que le comportement de la baguette sur des millions de barres ne décrit pas la situation actuelle lorsque l'EA ouvre la transaction. L'état du conseiller expert est "vide", un placebo. Cependant, nous trouverons presque certainement la période d'ondulation à laquelle nous faisons des bénéfices sur la période d'apprentissage. Ce sera de la pure chasse à courre. C'est ce dont je parlais. Cependant, tordre ainsi un conseiller expert aussi primitif avec un petit nombre de degrés de liberté n'a probablement aucun sens. Mais à sa place, imaginez un SN dont les entrées n'ont également rien à voir avec la réalité pendant la période d'apprentissage (par exemple, une séquence binaire de bits provenant d'une copie numérique d'une vidéo sur la vie des pingouins) ? Faisons en sorte que le conseiller expert fasse des bénéfices lors de la phase d'apprentissage à partir de rien, en l'ajustant délibérément et en essayant d'estimer son degré d'ajustement. D'une certaine façon... Ensuite, nous donnons les données correctes décrivant la situation au moment de la prise de décision par le conseiller expert à la même période d'apprentissage. Nous obtenons également le résultat. Nous mélangeons ces deux résultats, en essayant de comprendre l'adéquation du conseiller expert, la valeur informative des entrées, la capacité à détecter des modèles, etc.

Je ne sais pas si c'est devenu plus clair).

Non seulement il y a toujours une MA pour l'intervalle optimisé de l'histoire, à laquelle le TS sera rentable, mais attention... il peut y avoir plusieurs MA.

Ainsi, la situation pourrait bien être la même que la vôtre. C'est-à-dire que les paramètres du système, qui n'ont rien en commun avec les régularités du marché, sont rentables à différents intervalles de l'histoire, et peuvent même être rentables dans le futur. Et ils peuvent ne pas l'être.

C'est pourquoi les TS sont divisés en deux types. Le second type donnera ou non des bénéfices. Il est facile à vérifier. Mais le premier type - je ne sais pas, comment pouvons-nous le vérifier ?

À mon avis, il ne faut pas chercher une ligne entre ce qui convient et ce qui ne convient pas. Vous devriez vous concentrer sur le CT, où cette ligne n'existe pas du tout. C'est comme ça. Au moins, on aura le sentiment qu'il n'y a pas de frontière et qu'un modèle a été trouvé. Comment pourrait-il en être autrement ? Il n'y a pas de garanties et il n'y en aura jamais. Il y aura une condition éternelle d'incertitude et un droit éternel de choisir. :)

Je ne sais pas si c'est clair.

Je ne sais pas si je l'ai bien fait cette fois. :)

 
MetaDriver:

Quant à la suggestion d'étudier les systèmes pour être "en forme", elle n'en vaut pas la peine, à mon avis. C'est clair - un bon système est bien adaptable. Mais elle peut aussi être abstraite. Un mauvais système peut être peu adaptable et bien adaptable. Mais il ne peut pas être abstrait. L'adaptabilité peut donc difficilement être un critère de qualité d'un système (capacité de généralisation).




Eh bien, ce n'est pas une fin en soi, un test d'adéquation, c'est juste une pensée errante à la recherche d'une "frontière"). Les résultats pratiques sont plus proches de moi en quelque sorte. La pensée se forme approximativement comme suit : nous avons deux résultats d'apprentissage sur un morceau d'histoire, l'adéquation (P1) et l'adéquation+illégalité (P2).

P1 ~= P2 :

- Le TS a une capacité de généralisation excessive pour trouver les modèles pour lesquels il est conçu (par exemple, dans le NS - enlever 1 couche, faire moins de neurones cachés, prendre une fonction d'activation différente, etc.), sinon il serait très difficile d'isoler le résultat exploitant les modèles. Ou plus simplement, nos régularités ne sont pas des régularités du tout.

2*P1< P2 :

- ce qui est nécessaire, il est judicieux de jouer avec les CT, le meilleur résultat de formation étant susceptible de détecter des modèles.

Ce sont les types de chaînes d'application pratique que j'essaie de construire. Et je pense que pour certains de mes CTs, ça pourrait marcher.

joo:

Et est-ce que j'ai bien fait cette fois-ci. :)


Je dois être proche de quelque chose) J'avais peur de ma propre capacité à exprimer mes pensées.

 

1) S'adapter afin de profiter de l'effet d'aubaine (inertie des propriétés du marché) ?

2) Vous n'ajustez pas pour profiter de l'effet de non fausses optimisations ?

Une contradiction ?


Il y a d'autres options :)

 
-Aleksey-:

1) S'adapter afin de profiter des effets d'aubaine (inertie des propriétés du marché) ?

2) Vous n'ajustez pas pour profiter de l'effet de non fausses optimisations ?

Contradiction ?


Il y a d'autres options :)

L'effet de l'absence de fausse optimisation... J'ai failli me casser le cerveau.

1) Propriété d'inertie du marché. L'ensemble de l'AT est basé dessus. L'AT part du principe qu'un processus, une fois lancé (sans savoir quand), se poursuivra (sans savoir combien de temps). Un exemple typique : MA200, le prix a traversé une barre glissante vers le bas, nous entrons dans la position de vente en espérant qu'il continuera à descendre. Mais le prix ne va pas, il ne se soucie pas de МА200, il se retourne immédiatement et monte. Nous attendons. Le prix se déplace vers le haut et croise MA200 vers le haut - c'est un signal d'achat - la femme bousille le nouveau manteau).

Il en va de même pour les canaux, les niveaux, etc.

2) La propriété de la causalité. S'il existe une chaîne d'événements dont la séquence et la longueur sont prédéterminées, il existe donc une chaîne d'événements de retour, dont la séquence et la longueur sont connues à l'avance. La méthode d'optimisation révèle les régularités de l'influence des changements dans la chaîne d'événements causale sur la chaîne d'événements conséquente. Ici, tout est simple - on trouve des régularités ou pas, c'est facile à vérifier, facile à utiliser.

Suggérer ces autres options.

 

joo:

2) Propriété de causalité. S'il existe une chaîne d'événements d'une séquence et d'une longueur prédéterminées, alors il existe également une chaîne d'événements réciproques d'une séquence et d'une longueur prédéterminées. La méthode d'optimisation révèle les régularités de l'influence des changements dans la chaîne d'événements causale sur la chaîne d'événements conséquente. Il est simple - soit nous trouvons des régularités, soit nous n'en trouvons pas, il est facile à vérifier, facile à utiliser.

Poursuivre le cycle "l'esprit trompé par le hasard" ou "la folie créatrice des mécanismes génétiques de la Vie". ;-)

Extrait d'un livre sur l'apprentissage avec plus de renforcements. Karen Pryor "Ne grognez pas au chien".

// Le livre entier est dans la bande-annonce. Recommandé.

Superstition : renforcements aléatoires

Dans la vie réelle, les renforts se produisent à chaque tournant et ne sont souvent qu'une coïncidence accidentelle. Un biologiste qui a étudié les faucons a observé que si un faucon attrape une souris sous un certain buisson, il vérifiera ce buisson quotidiennement pendant une semaine, et parfois plus ; la probabilité qu'il survole cet endroit particulier est due à la force du renforcement. Essayez de passer devant une poubelle sans la regarder attentivement, si la veille - vous y avez trouvé cinq dollars. Le renforcement aléatoire est bon pour le faucon ; de manière générale, on peut dire que le comportement animal a évolué de telle sorte que chaque espèce a la capacité de bénéficier de tout renforcement. Cependant, de nombreux renforcements aléatoires ne sont pas accompagnés d'un résultat utile, mais peuvent néanmoins avoir une forte influence sur le comportement. Lorsqu'un comportement n'est pas lié à des événements ultérieurs mais qu'il y est associé dans le cerveau du sujet comme une condition nécessaire à leur survenue, on parle de comportement superstitieux. Un exemple de cela est la personne qui mâche un crayon. S'il vous arrive de mettre un crayon dans votre bouche pendant un examen et qu'immédiatement la bonne réponse ou une bonne pensée vous vient à l'esprit, ce renforcement pourrait modifier votre comportement : les bonnes pensées vous sont venues pendant que vous mâchiez le crayon, l'action est donc renforcée. Lorsque j'étais à l'université, je n'avais pas un seul crayon qui n'était pas couvert de marques de dents - lors d'examens particulièrement difficiles, il m'arrivait de mâcher le crayon en deux. J'étais sûr que ça m'aidait à réfléchir. En réalité, ce n'était qu'un comportement aléatoire et contingent. On pourrait dire la même chose du port de certains vêtements, ou de l'accomplissement d'un certain rituel avant d'entreprendre une tâche particulière. J'ai vu un joueur de baseball qui effectuait une chaîne d'actions en neuf parties chaque fois qu'il se préparait à lancer : toucher sa casquette, toucher son gant avec la balle, avancer sa casquette, se frotter l'oreille, reculer sa casquette, traîner le pied, etc. Dans les moments difficiles, il pouvait répéter deux fois les neuf actions sans jamais en perturber l'ordre : Cette séquence d'actions a été réalisée très rapidement, les commentateurs ne s'y attardent jamais - mais elle constitue néanmoins un comportement superstitieux complexe. Les "superstitions" apparaissent souvent dans le cadre du dressage des animaux. L'animal peut être guidé dans ses réponses par des critères que vous n'aviez pas l'intention d'introduire, mais qui coïncident souvent avec le renforcement et forment un lien conditionné. Par exemple, un animal peut croire que pour être renforcé, il doit se trouver à un certain endroit, se tourner dans une certaine direction ou s'asseoir d'une manière particulière. Lorsque vous voulez qu'il fonctionne dans un nouvel endroit ou avec une orientation différente, tout à coup, l'ensemble du comportement est mystérieusement rompu, et vous devez chercher à savoir pourquoi cela s'est produit. Il est donc préférable, dès que le comportement commence à se former, de commencer à diversifier les options pour les conditions qui ne vous semblent pas importantes, afin d'éviter un conditionnement accidentel qui vous gênera plus tard. Surtout, assurez-vous qu'aucune connexion temporelle aléatoire ne se forme. Les animaux comme les humains sont très doués pour détecter les intervalles de temps. Une fois, j'étais sûr d'avoir entraîné deux cochons d'Inde à sauter sur commande (au signal de ma main), jusqu'à ce qu'un des scientifiques en visite me prouve, chronomètre en main, qu'ils sautaient toutes les vingt-neuf secondes. C'est moi qui les avais conditionnés par inadvertance à donner l'ordre avec une très grande régularité, et ils en ont profité au lieu de l'information que je supposais qu'ils étaient censés utiliser. De nombreux dresseurs héréditaires sont tout simplement captifs d'une manière superstitieuse de penser et de se comporter. J'en ai rencontré parmi eux qui disent que les dauphins préfèrent les personnes habillées en blanc, que les mules doivent être battues, que les ours n'aiment pas les femmes, etc. Cela s'applique également à ceux qui travaillent avec des personnes et qui pensent, par exemple, que les élèves de CM2 doivent être engueulés et que les punitions sont nécessaires pour gagner le respect. Ces éducateurs sont à la merci de la tradition, ils sont obligés de travailler toujours de la même manière parce qu'ils ne peuvent pas séparer les méthodes efficaces de ce qui n'est que superstition. Cette faiblesse, ou confusion, se retrouve dans de nombreuses professions - dans l'éducation, l'ingénierie, l'armée, mais peut-être surtout en médecine. Il est consternant de voir combien de choses sont prescrites au patient, non pas parce qu'elles ont des propriétés médicinales, mais parce que cela s'est toujours fait ou se fait. Quiconque a déjà été hospitalisé peut penser à une demi-douzaine d'exemples d'actions inutiles qui ne constituent rien de plus qu'un comportement superstitieux. Il est intéressant de noter que les comportements superstitieux ne disparaissent pas si l'on se contente d'en souligner l'inefficacité ; étant donné qu'ils sont en grande partie acquis par cœur, ils sont en conséquence très protégés. Essayez de parler à un médecin de son habitude d'utiliser un traitement inefficace ou même nuisible, et vous serez rabroué en termes appropriés ; je suis sûr que même ce joueur de base-ball qui a une expression superstitieuse de nervosité en neuf étapes s'opposera avec véhémence à quiconque lui suggère de jouer au ballon sans, disons, une casquette qu'il touche quatre fois. La seule façon de se débarrasser d'un comportement superstitieux est de s'assurer qu'il n'est pas lié à un renforcement. Mon fils Ted adore l'escrime. Il s'entraîne deux ou trois fois par semaine et se rend souvent à des compétitions le week-end. Un jour, lors d'un duel avec un partenaire puissant, il se sent déprimé parce qu'il a laissé son épée préférée à la maison. Il a perdu le match. Il s'est ensuite rendu compte que le fait de se sentir déprimé avait manifestement beaucoup plus d'influence sur ses actions que l'épée qu'il utilisait, d'où l'idée d'avoir une épée "favorite" - une superstition. Ted a identifié et combattu tout comportement superstitieux qui pourrait être associé à l'escrime. Il en a trouvé beaucoup en lui-même, allant de l'attachement à certains articles vestimentaires à la croyance intérieure que son combat pourrait être affecté par un rêve, une dispute ou même l'absence de jus de fruits lors d'une compétition. En analysant systématiquement chacune de ces circonstances, il a brisé une à une sa dépendance à leur égard, car il a réalisé qu'il s'agissait de superstitions. En conséquence, il aborde désormais chaque combat avec calme et confiance, même s'il a fait un cauchemar : retard au train, perte de son équipement, batailles avec les chauffeurs de taxi, même s'il se bat avec une épée empruntée dans un survêtement et des chaussettes différentes.

Dossiers :