L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3248

 
fxsaber #:

Il est alors nécessaire de ramener les indicateurs à des perroquets uniformes. Même si l'incrément à différents intervalles sert d'indicateur, sinon la corrélation sera étrange.

Pour ma part, je déplacerais une fenêtre dans un tableau à 1d et je regarderais le nombre d'échantillons à travers tout signe de "similarité". Plus précisément, ce n'est même pas le nombre, mais le "profit" total de ces places (entrée par motif, sortie - en n heures).


Seul le nombre d'échantillons trouvés sur l'animation est déroutant : plusieurs centaines. En quatre ans, il n'y a que 365*5/7*24~6000 échantillons. Sur 6000, trouver 500 échantillons est soit un modèle très approximatif (ou un signe de similarité), soit un modèle hors échelle.

Dans la boucle, pour chaque échantillon, la corrélation avec les autres est complétée à l'aide de la matrice déjà calculée, ce qui représente beaucoup de travail.

 
Maxim Dmitrievsky #:

dans la boucle, pour chaque exemple, la corrélation avec les autres est complétée par la matrice déjà calculée, de sorte qu'il y a beaucoup d'erreurs de calcul.

25K corrélations pour chaque exemple. Il serait intéressant de voir la distribution des corrélations de -1 à +1.

 
Maxim Dmitrievsky #:

Je vais essayer de l'accélérer un peu plus.

Je pense que nous pouvons appliquer le principe du tamis.

  1. Nous avons calculé 25 000 corrélations pour un modèle. Par exemple, MathAbs(corr) > 0,9 pour 500. Nous les avons prises en compte et rejetées.
  2. Le nombre de motifs a diminué de 500 et le nombre de calculs de corrélation nécessaires a diminué de 500.
En d'autres termes, à chaque étape, nous supprimons les endroits similaires.
 
fxsaber #:

Je suppose que l'on peut appliquer le principe du tamis.

  1. Nous avons calculé 25 000 corrélations pour un modèle. Par exemple, MathAbs(corr) > 0,9 pour 500. Nous les avons prises en compte et rejetées.
  2. Le nombre de motifs a diminué de 500 et le nombre de calculs de corrélation nécessaires a diminué de 500.
En d'autres termes, à chaque étape, nous éliminons les endroits similaires.

Il existe déjà une simple sélection par indices connus de la matrice de corrélation à partir de l'ensemble de données original, pour chaque motif, ce qui rend le processus rapide. La ligne la plus à droite de l'écran indique simplement le nombre d'exemples de chaque modèle. D'autres données telles que les prix futurs sont complétées et les statistiques sont prises en compte. Il est possible de procéder autrement, oui.

 
fxsaber #:

modèle d'entrée, sortie en n heures.

Sortir comme ceci ?
 
fxsaber #:
La sortie est ?

sur un TP fixe

 
Maxim Dmitrievsky #:

fixe

Pendant l'exploitation minière ?

 
fxsaber #:

Pendant l'exploitation minière ?

Je peux voir à partir des statistiques, disons les 10 barres futures, je sors toutes les courbes de chaque instance trouvée du modèle dans le futur (comme une prévision).

Puis la moyenne de toutes les courbes.

Comme ce pattern à vendre, en moyenne, et combien de pips peuvent être vus.

 
Maxim Dmitrievsky #:

La référence du modèle est sauvegardée, dans le testeur, nous recherchons la corrélation des valeurs actuelles avec la référence, nous ouvrons les transactions selon la logique sélectionnée.

J'ai compris pourquoi il y a beaucoup d'échantillons. Si vous tracez la corrélation sur un tableau de 1d, vous obtiendrez quelque chose de très similaire à ceci.


Au-dessus de la ligne bleue supérieure, la corrélation est très élevée. Vous pouvez voir qu'elle change doucement aux sommets.


Cela signifie que nous avons vu 0,9 dans le testeur - bon, nous ouvrons. Sur la barre suivante, 0,91, puis 0,92, ...., 0,95, 0,94, ...., 0,9. La durée de ces valeurs consécutives très élevées est d'autant plus longue que le modèle lui-même est long. C'est purement mathématique.


C'est peut-être la raison pour laquelle il y a eu une superposition d'un grand nombre de transactions.


Par conséquent, il est probablement judicieux, lors de l'exploitation minière, de ne prendre en compte dans une série d'échantillons consécutifs que le premier.

 
fxsaber #:

J'ai compris pourquoi il y a tant d'échantillons. Si vous tracez la corrélation sur un réseau 1d, vous obtiendrez quelque chose de très similaire à ceci.


Au-dessus de la ligne bleue supérieure, la corrélation est très élevée. Vous pouvez voir qu'elle change doucement aux sommets.


Cela signifie que nous avons vu 0,9 dans le testeur - bien, nous ouvrons. Sur la barre suivante, 0,91, puis 0,92, ...., 0,95, 0,94, ...., 0,9. La durée de ces valeurs consécutives très élevées est d'autant plus longue que le modèle lui-même est long. Purement mathématique.


C'est peut-être la raison pour laquelle il y a eu une superposition d'un grand nombre de transactions.


C'est pourquoi il est probablement judicieux de ne prendre en compte que le premier d'une série d'échantillons consécutifs lors de l'extraction.

Oui, c'est vrai