L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 155

 
J.B :

Il s'agit d'une estimation empirique du gain de qualité de la classification avec - sans ce facteur, tout est simple, l'information mutuelle et la détermination dans les systèmes multifactoriels non linéaires ne fonctionnent pas de manière fiable. Et les chiffres 4-5% ne sont pas un dogme, il faut juste comprendre qu'en utilisant "tous les marchés" et les flux d'informations sans la dynamique du prix d'un instrument donné, on peut prédire son avenir pour un horizon <5% plus mauvais, c'est tout. C'est-à-dire que si vous avez une probabilité d'une minute de prédire la hausse future de l'actif, par exemple 70%, alors en excluant le prix de la série prédite des données pour l'analyse vous obtenez 70 - (70-50)*0,5 = 69% presque dans les limites du bruit de la différence. Bien sûr, si vous disposez de données en temps réel de tous les marchés mondiaux et pas seulement des marchés, mais sans informations privilégiées, et si le prix d'un seul instrument... hélas, quelle que soit l'IA que vous avez créée, il est plus facile de créer un terminator que de battre un marché avec de telles données.

Bien, ok.

Disons que je ne classifie pas le gain en hausse ou en baisse, mais que je construis un modèle de régression. Donc R^2 ou une autre métrique déterministe (par exemple, une métrique d'écart absolu robuste) est bien.

En ce qui concerne l'information mutuelle - est-elle sans fondement ou existe-t-il des preuves solides que la métrique ne fonctionne pas de manière fiable ? J'ai des doutes.

Mise à jour : J'ai fait beaucoup de recherches sur les données synthétiques et réelles en utilisant l'information mutuelle. Si la dépendance est stationnaire, la métrique fonctionne bien partout. Si la dépendance est à la limite du bruit, la métrique peut montrer une dépendance nulle. Mais dans l'ensemble, je ne vois aucune raison pour laquelle il est moins performant dans les systèmes non linéaires multivariés que, par exemple, le F1. Vous pouvez le lire ici: https://habrahabr.ru/company/aligntechnology/blog/303750/

Mais lorsque j'ai classé un mouvement de prix incrémental, j'ai obtenu approximativement l'image suivante (pour 5 paires de devises ensemble, c'est-à-dire un modèle pour toutes) :


Il s'agit au moins de valeurs médianes de précision sur 50 échantillons en attente, de l'ordre de 57% au maximum. Pour les paires de devises individuelles, j'obtiens une précision médiane supérieure à 60 %. Cela ne concerne que les données de séries chronologiques.

 
Alexey Burnakov:

1) Il ne s'agit pas d'un point de vue naïf. C'est la direction de la recherche. Et pas nécessairement un réseau neuronal. La thèse est la suivante : à partir des valeurs passées d'une série chronologique de prix, vous pouvez extraire des informations suffisantes pour réaliser des transactions rentables (en surmontant les coûts), quel que soit l'horizon temporel du test à terme réel.

Je vais également publier quelques graphiques sur ce sujet. Je suis en train de préparer du matériel pour un article.

2) PS : Personnellement, en tenant compte de tous les facteurs conduisant au surentraînement, et en essayant de prendre la condition de modèle la plus conservatrice et la plus fiable, il s'avère que plus de 30-40% par an (avec un drawdown maximum de 25%) ne peut pas s'en sortir. Mais il dépasse déjà le rendement médian des fonds spéculatifs. Tous les autres intérêts cosmiques prétendument obtenus à long terme par la seule analyse technique des séries chronologiques - c'est un mensonge.

1) Bien sûr qu'il faut chercher partout, j'ai juste suggéré d'utiliser plus d'informations et seulement cela, et d'ailleurs un trader établi ne peut pas être détourné, nous pouvons seulement ajouter des informations à son modèle existant.

2) les rendements médians, même pour les hedge funds américains, sont tristement inférieurs aux indices, les plus difficiles donnent à peine 15-20% en moyenne en 10 ans, bien que les modèles ne soient pas autorisés à trader avec des sharp* inférieurs à 2-3 et bien sûr la capacité est de $10^6-9, selon les calculs tout le monde devrait avoir au moins 20-30% mais.....

 
J.B :

1) Bien sûr, vous devez chercher partout, j'ai juste suggéré d'utiliser plus d'informations et seulement, et d'ailleurs un trader établi ne peut pas être détourné de son propre chemin, vous pouvez seulement ajouter des informations à son modèle existant.

2) les rendements médians, même les hedge funds américains sont tristement inférieurs aux indices, le plus raide à peine 15-20% donner une moyenne de 10 ans, bien que le modèle n'est pas autorisé à négocier avec un Sharpe* en dessous de 2-3 et bien sûr la capacité là 10^6-9, les calculs devraient être au moins 20-30% mais....

1) c'est oui

2) bien oui... mais ce Sharp 2-3 comment est-il calculé ? Comment les fonds calculent-ils, ou plutôt COMMENT déterminent-ils qu'il s'agit d'une véritable estimation Sharpe sur une véritable transaction ?

 
Alexey Burnakov:

PS : Personnellement, en me débattant avec tous les facteurs conduisant au sur-apprentissage et en essayant de prendre la condition de modèle la plus conservatrice et la plus fiable, il s'avère qu'il est impossible d'extraire plus de 30-40% par an (avec un drawdown maximum de 25%). Mais il dépasse déjà le rendement médian des fonds spéculatifs. Tout autre intérêt cosmique prétendument obtenu à long terme sur la base d'une analyse technique fondée sur des séries chronologiques est un mensonge.

))) Hilarant !

Quel effet de levier avez-vous sur ces 30-40% par an ?

 
Dmitry:

))) Hilarant !

Quel est l'effet de levier de ces 30-40% par an ?

Charge maximale de dépôt de 10% (1:10).

Eh bien, je dois mentionner que j'ai parfois vu des exemples de personnes qui gagnent encore plus pendant des années. Mais c'était soit à la main, soit avec des tirages au sort au bord de la faute.

 
Alexey Burnakov:

Charge maximale de dépôt de 10% (1:10).

Eh bien, je dois préciser que j'ai parfois vu des exemples d'années où l'on faisait plus que cela. Mais c'était soit à la main, soit avec des tirages au sort au bord de la faute.

Je ne parle pas de la charge du dépôt, mais de l'effet de levier - avec quel effet de levier gagnez-vous ces 30-40% par an ?
 
mytarmailS:

Les gars, il y a une idée qui vaut la peine d'être vérifiée, je l'ai eue il y a longtemps, je voulais vérifier mais je n'arrivais pas à trouver le paquet et en quelque sorte j'ai oublié et abandonné, mais ici j'ai lu la branchede J.B et je me suis souvenu, il s'avère qu'il a aussi fait quelque chose de similaire :)

Nous parlons de corrélation croisée - nous pouvons calculer de combien une BP est en retard par rapport à l'autre BP et s'il existe un lien entre elles ...

L'essence de mon idée était de surveiller simultanément un grand nombre de paires et de construire quelque chose comme une matrice de corrélation croisée pour comparer chaque paire et trouver les paires qui se suivent mais dont l'une est en retard et trader ce retard, puisque le marché n'a rien de plus constant que le temps, je pense que les calculs devraient être faits constamment à chaque nouvelle barre, pour remarquer immédiatement quand une nouvelle relation apparaît et aussi pour remarquer immédiatement quand cette relation disparaît ....

Vous pouvez prendre n'importe quoi, n'importe quel prédicteur, mais je pense que la meilleure approche est celle des paires, parce que les teneurs de marché, lorsque le prix de leur instrument est presque toujours guidé par un ou un tas d'autres instruments, et les indicateurs classiques ont peu de chances de convenir.

je peux essayer d'entraîner un neurone en utilisant des prédicteurs changeant dynamiquement, c'est-à-dire que tout n'est limité que par l'imagination ...

J'essaierais bien de le mettre en œuvre moi-même, mais je suis occupé par un autre projet et je ne veux pas m'épancher.

La fonction standard ccf() de corrélation croisée dans P

est un paquet avancé avec une division pré-spectrale en niveaux et ensuite une vérification du crossover "wavemulcor". et vous pouvez comparer plusieurs BP en même temps

Malheureusement, c'est un échec, les paires marchent toutes seules, l'entropie est une autre affaire, c'est plus intéressant.
 
Dimitri:
Je ne parle pas du chargement des dépôts, mais de l'effet de levier - avec quel type d'effet de levier gagnez-vous ces 30-40% par an ?
Oooh, je vois que tu ne comprends pas ce qu'est un effet de levier. Entre parenthèses, j'ai spécifié un effet de levier de 1:10 au maximum (si plusieurs transactions s'avèrent être sur le marché).
 
Et au fait, oui, j'ai déjà commencé à écrire un article, je ne manquerai pas de le poster dans ce fil dès qu'il sera prêt. Ce sera mon traité .... :-)
 
Alexey Burnakov:
Oh, je vois que vous ne comprenez pas ce qu'est un effet de levier. Entre parenthèses, j'ai spécifié un effet de levier de 1:10 tout au plus (si plusieurs transactions s'avèrent être sur le marché).

10% est la charge de dépôt.

Si vous avez un dépôt de 1 000 $, vous le chargez de 10 % - vous ouvrez une transaction pour 100 $.

Maintenant, ATTENTION, selon l'effet de levier fourni par votre courtier/coach, vous pouvez acheter différents lots - 10 000 $ (1:100), 5 000 $ (1:50), 20 000 $ (1:200).

P.S. fuckerbaby........