L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading

СанСаныч Фоменко 2023.04.26 09:50 #30481

Aleksey Nikolayev #:

Le concept de RL n'est-il pas redondant pour les tâches d'échange ? Nous avons l'influence de l'environnement sur l'agent, mais existe-t-il une influence de l'agent sur l'environnement ? Il est possible d'introduire artificiellement cette seconde influence, mais cela a-t-il un sens ?

Deux (ou trois) idées tirées de l'article ne sont pas du tout superflues pour nous : la fonction de perte doit refléter exactement ce dont nous avons besoin et doit être lisse (et monotone). Dans notre cas, il doit s'agir du profit et il doit dépendre de manière lisse et monotone des paramètres du modèle.

La régularité d'un analogue du bénéfice peut probablement être obtenue d'une manière ou d'une autre (par exemple, par quelque chose comme le lissage du noyau). Mais je doute beaucoup de la monotonicité.

La base du résultat financier du trading est le mouvement des prix - un processus aléatoire non stationnaire.

Essayons-nous de transformer un processus aléatoire non stationnaire en un processus lisse et monotone au moyen de quelques astuces ? Peut-être sommes-nous en train de marcher sur la tête ? Surtout si l'on tient compte du fait qu'il est extrêmement difficile d'obtenir une erreur de classification inférieure à 20 % ( !) en dehors de l'ensemble d'apprentissage. Peut-être devrions-nous commencer par travailler à la réduction de l'erreur de classification ?

La théorie des flux Sensation ! Une stratégie Qu'est-ce qui rend un

СанСаныч Фоменко 2023.04.26 10:08 #30482

Lire l'article.

À quoi nous sert cet article ?

Il est tout à fait douteux.

Et la raison en est la suivante.

Je ne me souviens d'aucune publication sur l'IA (MO) qui aurait prédit l'avenir. Ils apprennent à un modèle à écrire des lettres manuscrites. Ensuite, ils essaient de reconnaître ces lettres manuscrites. Mais le modèle n'apprend PRINCIPALEMENT pas à prédire quelle lettre sera écrite ensuite.

C'est le problème que nous rencontrons.

Nous essayons d'utiliser la MO (le même travail que nous avons fait avec les combinaisons de chandeliers) pour trouver des modèles dans les prédicteurs qui donneront la bonne prédiction. Mais il n'y a aucune garantie que les modèles trouvés donneront des prédictions correctes à l'avenir. Les "bons" modèles donneront une erreur et les "mauvais" modèles prédiront la bonne chose. La raison réside dans les algorithmes de classification eux-mêmes, qui donnent la VERABILITÉ d'une classe, et non sa valeur. Nous utilisons la régularisation la plus primitive de 0,5 pour diviser en classes. Et si, au cours de l'apprentissage, la probabilité d'un modèle "correct" = 0,5000001, pourquoi prenons-nous cette probabilité comme valeur de la classe ?

Pour sortir de cette situation, nous commençons à cultiver un potager, mais les valeurs des prédicteurs, parmi lesquels nous recherchons des modèles, ne sont PAS stationnaires ou pseudo-stationnaires et n'ont qu'un rapport lointain avec le prix !

Régression bayésienne - Est-ce Intéressant et Humour Première vache sacrée :

mytarmailS 2023.04.26 10:10 #30483

Aleksey Nikolayev #:

Nous avons l'influence de l'environnement sur l'agent, mais existe-t-il une influence de l'agent sur l'environnement ? Il est probablement possible d'introduire artificiellement cette seconde influence, mais cela a-t-il un sens ?

Tout dépend de la tâche à accomplir.

Si nous prévoyons une cible toute faite, comme le fait l'écrasante majorité, nous n'avons pas d'influence sur l'environnement et il n'y a pas besoin de RL.

Mais si, par exemple, la tâche de gestion des positions, des stops, des take-outs...

La gestion des actifs est l'environnement que nous (l'agent) gérons.

L'agent décide de passer un ordre ou de ne pas le faire.

à quel prix,

et quand le retirer ou le déplacer,

et que fera-t-il lorsque la perte actuelle sur la position actuelle dépasse n pips,

et que fera-t-il s'il a cinq pertes consécutives ?

Vous voyez, il s'agit d'un niveau complètement différent de la tâche, avec un grand nombre d'états (sorties), et non pas d'une classification primitive haut/bas.

Pour simplifier encore, nous ne pouvons pas gérer le marché, mais nous pouvons gérer la position et le risque, parce que nous le pouvons !

Aleksey Nikolayev #:

Le lissage d'un analogue du profit peut probablement être obtenu d'une manière ou d'une autre (par exemple, par quelque chose comme le lissage du noyau). Mais je doute beaucoup de la monotonicité.

Je ne comprends pas vraiment ce que l'on entend par "lissage" et pourquoi le "lissage" est nécessaire....

Peut-être pouvons-nous utiliser l'optimisation multicritère pour trouver la meilleure solution.

EA N7S_AO_772012 Erreurs, bugs, questions La NFA interdit le

Valeriy Yastremskiy 2023.04.26 14:16 #30484

mytarmailS #:

tout dépend de la tâche à accomplir.

Si nous prévoyons une cible toute faite, comme le fait la grande majorité des gens, nous n'avons aucune influence sur l'environnement et il n'est pas nécessaire d'avoir recours à la RL elle-même.....

Mais si, par exemple, la tâche de gestion de la position, des arrêts, des prises ...

La gestion des actifs est l'environnement, que nous (l'agent) gérons...

L'agent décide de passer un ordre ou de ne pas le faire.

à quel prix,

et quand le retirer ou le déplacer,

et que fera-t-il lorsque la perte actuelle sur la position actuelle dépassera n points,

et que fera-t-il lorsqu'il aura cinq pertes d'affilée...

Vous voyez, il s'agit d'un niveau complètement différent de la tâche, avec beaucoup d'états (sorties), pas une classification primitive haut/bas.

Pour le dire encore plus simplement, nous ne pouvons pas gérer le marché, mais nous pouvons gérer la position et le risque, nous le pouvons !

Je ne comprends pas vraiment ce qui entre en jeu dans la "fluidité" et pourquoi vous en avez besoin....

Peut-être pouvons-nous appliquer l'optimisation multicritère à la recherche.

Nous pourrions calculer la moyenne de l'agent.

Maxim Dmitrievsky 2023.04.26 14:19 #30485

Valeriy Yastremskiy #:
Il est possible pour un agent d'avoir une moyenne.

https://www.mql5.com/ru/code/22915

Aleksey Nikolayev 2023.04.26 17:56 #30486

СанСаныч Фоменко #:

La base du résultat financier du trading est le mouvement des prix - un processus aléatoire non stationnaire.

Essayons-nous de transformer un processus aléatoire non stationnaire en un processus lisse et monotone au moyen de quelques astuces ? Peut-être sommes-nous en train de marcher sur la tête ? Surtout si l'on tient compte du fait qu'il est extrêmement difficile d'obtenir une erreur de classification inférieure à 20 % ( !) en dehors de l'ensemble d'apprentissage. Peut-être devrions-nous commencer par travailler à la réduction de l'erreur de classification ?

Je parlais des propriétés de la fonction de perte minimisée par l'entraînement du modèle. Plus précisément, de sa forme idéale.

Aleksey Nikolayev 2023.04.26 17:58 #30487

mytarmailS #:

Je ne comprends pas vraiment ce qui entre en jeu dans la douceur et pourquoi la douceur est nécessaire.

C'est la base de l'optimisation. Le lissage permet d'optimiser au moyen d'un gradient. Sinon, il ne reste que des algorithmes de force brute.

mytarmailS 2023.04.26 18:11 #30488

Aleksey Nikolayev #:

C'est la base de l'optimisation

Oui, je le sais, mais récemment, ils ont parlé de la douceur de la courbe du capital elle-même, donc je ne suis pas vraiment entré dans ces discussions, c'est pourquoi je vous demande ce que vous voulez dire.

FOREX - Tendances, prévisions Comment se fait-il que Un courtier supporte-t-il les

mytarmailS 2023.04.27 08:38 #30489

Hors sujet.

L'une des meilleures affaires jamais réalisées.

or

risque/récompense 1 sur 24

spiderman8811 2023.04.27 11:15 #30490

mytarmailS #:

Hors sujet...

L'une des meilleures affaires de tous les temps.

or

risque/récompense 1 sur 24

"Water body" est un excellent exemple)

L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3049