L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1393

 
Maxim Dmitrievsky:

La version classique ne fonctionnera pas, malheureusement... tout dépend des caractéristiques/cibles, aussi.

Ne soyez pas dramatique. Classic NS fonctionne depuis plus d'un an. Il y a aussi des progrès en matière de régression NS. Je ne sais pas pour RL, mais je n'ai pas du tout de problèmes avec les classiques. Vous devriez formuler la tâche correctement, pas comme je veux un oiseau rôti, et vous n'aurez aucun problème. Ne prédisez pas le prix de la bougie de sentier).
 
Yuriy Asaulenko:
Ne soyez pas dramatique. Le NS classique fonctionne depuis plus d'un an. Je ne sais pas pour RL, mais les classiques n'ont pas de problèmes du tout. Je ne sais pas pour RL, mais je n'ai aucun problème avec les classiques. Vous devriez formuler la tâche correctement, pas comme je veux un oiseau rôti, et vous n'aurez aucun problème. Ne prédisez pas le prix de la bougie de sentier).

Je parle de mon expérience

 
Maxim Dmitrievsky:

Je parle de mon expérience

Eh bien, RL sur le marché est très vague pour moi. Même avec des articles. Mais le sujet est très intéressant. Je ne ferai aucun progrès pendant une semaine ou deux, et j'arrêterai. C'est tout.
Ce qui est intéressant avec RL, c'est la possibilité de rendre le CT entièrement autonome, y compris pour l'assistance et la conclusion de l'affaire. Si cela échoue, cela n'a pas beaucoup de sens de passer des MLP et RF ordinaires aux RL. Comment faire ? - Je n'en ai aucune idée.
 
Yuriy Asaulenko:
Eh bien, je ne suis pas sûr de RL sur le marché. Je ne sais pas pour RL sur le marché. Mais le sujet est très intéressant. J'abandonnerai dans une semaine ou deux. Et seulement.
Ce qui est intéressant dans RL, c'est la possibilité de rendre le TC totalement autonome, y compris pour l'assistance et la conclusion de l'affaire. Si cela échoue, alors passer des MLP ordinaires et des RF aux RL n'a pas beaucoup de sens. Comment faire ? - Je n'en ai aucune idée.

comprenez-vous la différence entre l'entraînement avec un professeur et l'entraînement avec renforcement ? ce sont des approches totalement différentes, absolument. Ils n'ont en commun que le fait que NS est utilisé comme une approximation.

 
Maxim Dmitrievsky:

Comprenez-vous la différence entre l'apprentissage avec un professeur et l'apprentissage par renforcement ? Ce sont des approches complètement différentes. La seule chose qu'ils ont en commun, c'est que NS est utilisé comme une approximation.

Définitivement, je comprends.) Qu'est-ce que ça a à voir avec ça ? En général, je parle du résultat final, pas des principes. Si le résultat est le même, il est inutile de chercher une solution plus compliquée. Et leurs principes ne font aucune différence. Jusqu'à présent, je constate que RL, appliqué à l'ouverture d'un marché, ne donne pas une nouvelle qualité.
 
Yuriy Asaulenko:
Je comprends parfaitement). Mais qu'est-ce que cela a à voir ? Je parle en fait du résultat final, pas des principes. Si le résultat est le même, il est inutile de chercher une solution plus compliquée. Et cela ne fait aucune différence pour leurs principes.

trop abstrait... principe différent - approche différente de la résolution des problèmes, résultats différents

En général, les gens y ont consacré leur vie, par exemple Sutton, et il n'est donc pas question d'apprentissage/application "rapide". Il y a des choses très délicates là-dedans, qui sont de ce dernier type.
 
Maxim Dmitrievsky:

trop abstrait... principe différent - approche différente de la résolution des problèmes, résultats différents

Vos résultats avec RL ne sont ni meilleurs ni pires que ceux des autres. Qu'est-ce que l'approche a à voir avec cela ? L'important, c'est le résultat. Les résultats sont à peu près les mêmes pour une MLP sermentiste avec un enseignant sur la donne d'ouverture. Même si vous avez quelques... mieux. Cela ne change pas grand-chose. Il faut un saut qualitatif de l'application de RL.
Ne vous méprenez pas, ce n'est pas du tout une critique de vos approches. Vous faites tout bien.
 
Maxim Dmitrievsky:

trop abstrait... un principe différent signifie une approche différente pour résoudre un problème, des résultats différents

En général, les gens y ont consacré leur vie, comme Sutton, donc il est hors de question de la maîtriser "rapidement". Il y a des choses très compliquées là-dedans qui viennent du dernier.

A en juger par votre article, ce n'est pas une chose très compliquée à maîtriser pendant longtemps.

Avant le premier entraînement, un objectif est fixé de manière aléatoire, puis après chaque cycle d'entraînement, s'il a fait un bénéfice, il est laissé, s'il a fait une perte, il est modifié.

 
Yuriy Asaulenko:
Vos résultats avec RL ne sont ni meilleurs ni pires que ceux des autres. Qu'est-ce que l'approche a à voir avec cela ? L'important, c'est le résultat. Les résultats sont presque les mêmes pour le MLP sermene avec l'enseignant sur la donne d'ouverture. Même si vous avez quelques... mieux. Cela ne change pas grand-chose. Il faut un saut qualitatif de l'application de RL.
Ne vous méprenez pas, ce n'est pas du tout une critique de vos approches. Vous vous débrouillez bien.

En ce qui concerne les résultats, je n'ai rien vu de semblable au mien dans le fil de discussion, même pas de près.

les seuls résultats que j'ai vus sont ceux de fxsaber, et pas ceux du mo dans le plein sens du terme.

Je n'ai pas besoin de vous rappeler les backtests sur la serviette.

Je ne le prends pas comme une critique, je dis simplement qu'il s'agit d'une approche très complexe et je suis amusé par des déclarations du type "Je vais le faire pendant quelques semaines et tout ira bien".

 
elibrarius:

À en juger par votre article, ce n'est pas une chose particulièrement difficile à apprendre.

Avant le premier entraînement - un objectif aléatoire est fixé, puis après chaque cycle d'entraînement - s'il a apporté un bénéfice, il est laissé, s'il a entraîné une perte, il est modifié.

même une chose aussi simple en apparence, personne ici n'a écrit à ce sujet, ni sur Rl, ni sur l'échafaudage alglib, etc. jusqu'à ce que j'en parle.

alors de quoi parlons-nous... donc vous ne voyez que cette "cible aléatoire", et comment attacher à elle quelque chose de plus compliqué que vous ne pouvez pas penser, parce que pour voir prêt et dire que c'est facile - toujours facile, mais pour améliorer ...

ils se contentent de dire que tout le monde est si intelligent, et en fait, ils ne discutent que des paramètres évidents des réseaux neuronaux, mais pas des approches complexes.

Asaulenko a soumis 20 retours sur la grille et est heureux... n'est-ce pas drôle