L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1145

 
Graal:

Enseigner sur l'avenir et tester sur le passé ne se trouve que sur ce forum))).

Il n'y a pas de différence, cela a été discuté. Pas de coup d'œil dans l'histoire

Montrez-moi un forum où l'on discute normalement du MO sur le marché.
 
Aleksey Nikolayev:

Je dirais que cela dépend du conseiller expert. S'il génère une séquence claire de transactions, c'est-à-dire lorsqu'une position est ouverte et fermée et que son volume ne change pas entre l'ouverture et la fermeture - il est préférable de compter par transactions. Si le volume de la position évolue de façon régulière dans le temps, l'identification des moments d'une transaction est moins significative et peut être calculée à l'aide de votre propre méthode.

La méthode panturale est meilleure pour vendre les TS et trouver des investisseurs). Donc, avec le temps, je suppose qu'ils y passeront)

Je pense que c'est un trop grand honneur de réécrire l'algorithme de calcul du ratio de Sharpe annuel d'un débutant du forum ;))

Et sérieusement, "annuel" et les transactions n'ont aucun sens comme métrique, il est impossible de l'optimiser, parce que les stratégies seront différentes à chaque fois par le nombre de transactions, donc par exemple la stratégie qui génère 1000 transactions aura trois fois moins de Sharpe que la stratégie avec 100 transactions, avec le même profit et le même drawdown maximum.

 
FxTrader562:

Peut être l'équation des profits et des pertes des transactions individuelles en utilisant l'apprentissage "Q" et "l'équation de Bellman".

Cela signifie qu'elle doit être prise dans le futur en tenant compte des bénéfices de chaque transaction.

Je ne sais pas :)

 
FxTrader562:

Apprentissage "Q" et "équation de Bellman".

Cela signifie qu'il ne faut pas prendre en compte les profits et les pertes individuels de chaque transaction.

q-learning c'est une méthode de table, donc des bénéfices individuels corrigés avec Bellman

Je me rapproche de la politique directement, même chose mais plus rapide.

 
Maxim Dmitrievsky:

il n'y a pas de différence, cela a été discuté.

il y a une différence, on en a parlé. quelqu'un l'a juste laissé filer entre ses doigts.
 
Maxim Dmitrievsky:

il n'y a pas de différence, cela a été discuté. Pas de coup d'œil dans l'histoire

Je ne sais pas comment faire, mais je ne suis pas sûr de savoir comment faire.

Il ne s'agit pas de regarder, bien que cela puisse l'être dans certaines conditions, mais l'OOS doit être aussi proche que possible du réel, car vous voulez que le résultat de l'OOS se répète + - sur le réel, mais si vous le testez sur le passé plus lointain, il sera proche du passé, et le marché pendant cette période peut changer plus ou moins. Votre méthode peut mener complètement à l'absurde, par exemple si vous séparez les OOS et les réels pendant des années))).

Les forums sont peu nombreux : wilmot, quantnet, elite et... je ne vois rien d'autre, mql5 est le plus liquide, mais je ne vois aucune "preuve" de trading "rentable" avec martin ou sb sur les forums occidentaux, peut-être parce que seuls les investisseurs qualifiés y tradent, qui n'ont jamais "fait de dépôt", des idiots stupides....

 
LeXpert:
il y a une différence, on en a parlé. quelqu'un l'a juste laissé filer entre ses doigts.

il n'y a absolument aucune différence

J'ai récemment essayé de lui expliquer, mais j'ai oublié pourquoi il pense ainsi ;))

 
Maxim Dmitrievsky:

Si la politique est approximée par un modèle (disons un modèle linéaire), il suffit d'obtenir une solution sur les nouvelles données et c'est tout, en les intégrant dans le modèle.

Ce que vous décrivez est un processus qui consiste à trouver le plus grand profit.

Le principal problème de la non-stationnarité est qu'elle ne fonctionne plus sur les nouvelles données. Il existe des bandits non stationnaires décrits, mais je ne les ai pas encore abordés. Il est vrai qu'il n'y a rien que je ne sache déjà, en fin de compte :) Mais j'ai besoin d'idées/solutions sur la façon de donner des récompenses correctement.

Vous me surestimez. Je n'ai pas encore dépassé l'introduction.)

Comme ils l'écrivent eux-mêmes, il s'agit d'une sorte de sous-classe des jeux de nature (environnement). Je suis sûr que presque tous nos modèles se situent dans le jeu de la nature, mais je ne sais pas si ces "bandits" sont adaptés.

Je préfère les processus de Markov latents. Dans ce cas, la non-stationnarité peut être une conséquence du fait que nous n'observons pas toutes les variables. En gros, un processus qui n'est pas stationnaire pour nous sera dérivé d'un processus stationnaire mais connu seulement du teneur de marché.

 
Graal:

Il ne s'agit pas de faire du voyeurisme, bien que cela puisse aussi être le cas dans certaines conditions, mais l'OOS doit être aussi proche du réel que possible, car vous voulez que le résultat de l'OOS se répète + ou - sur le réel, mais si vous le testez sur un passé plus lointain, il sera proche du passé, et le marché pendant cette période peut changer plus ou moins. Votre méthode peut mener complètement à l'absurde, par exemple si vous séparez les OOS et les réels pendant des années))).

Les forums sont peu nombreux : wilmot, quantnet, elite et... je ne peux pas penser à autre chose, le mql5 est le plus liquide, mais vous ne pouvez pas trouver de "preuve" de "bon" trading avec martin ou sb sur les forums occidentaux, peut-être parce que seuls les investisseurs qualifiés y tradent qui n'ont jamais "fait de dépôt", des jeunes stupides....

ouais c'est des conneries, je teste juste ce que j'ai fait (généralisabilité), je ne l'échange pas.

 
Maxim Dmitrievsky:

c'est des conneries, je teste juste ce que j'ai fait (généralisabilité), je n'en fais pas le commerce

J'ai compris, les conneries sont des conneries))