L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3226

 
fxsaber #:

Peut-être devrions-nous essayer de résoudre le problème de la génération de nouvelles données par l'approximation ?

Prenez une fenêtre et essayez d'y décrire une série numérique avec une précision différente, alors que cette approche permettra de sauvegarder la dynamique du mouvement des prix dans son ensemble, y compris les fluctuations quotidiennes.

Et il suffira de sauvegarder l'historique sous la forme de coefficients d'approximation.

 
Maxim Dmitrievsky #:

Votre CT ne recherche pas tous les modèles qui peuvent exister. C'est pourquoi vous devez le faire correspondre

Nous sommes alors confrontés au problème de la "poule et de l'œuf" :

  • Le MO conservera les motifs s'il reçoit des données d'un CT qui fonctionne.
  • Sur le tsvr d'origine, le MO doit trouver un CT qui fonctionne.

Sinon, il faut adopter une autre approche, mais elle sera longue sur les ticks et plus tard).

Tous ces développeurs sont loin du trading. Au lieu de Moyenne, on devrait parler de Médiane.

 
Aleksey Vyazmikin #:

Peut-être devrions-nous essayer de résoudre le problème de la génération de nouvelles données par l'approximation ?

Prenons une fenêtre et essayons d'y décrire une série numérique avec une précision différente. Cette approche permettra de préserver globalement la dynamique de l'évolution des prix, y compris en tenant compte des fluctuations quotidiennes.

Et il suffira de sauvegarder l'historique sous la forme de coefficients d'approximation.

C'est une bonne idée. Lorsque je consulte les articles sur le thème de la recherche IDC, je commence presque immédiatement à douter de leurs approches, s'il y a une recherche de régularités sous l'hypothèse qu'elles sont permanentes.

 
Maxim Dmitrievsky #:

dépendance avec une longueur de 1000 ticks

et 5 000 ticks, en plus.

Avec les ticks, un tel choix de fenêtre est étrange. Il est logique de se lier à des horodatages, pas à des indices de tic-tac.

Forum sur le trading, les systèmes de trading automatisés et les tests de stratégies de trading

Machine Learning in Trading : Theory, Models, Practice and Algorithm Trading (Apprentissage automatique en trading : théorie, modèles, pratique et algorithme de trading)

fxsaber, 2023.09.09 04:40 pm

Il y a une erreur à cet endroit : ce devrait être time_msc. Mais cela n'a aucun effet sur les résultats après le post.

Veuillez redémarrer pour que les horodatages soient affichés correctement pour les prochaines générations.
Ceci au cas où vous décideriez de vous lier.
 
Maxim Dmitrievsky #:

dépendance avec une longueur de 1000 ticks

https://disk.yandex.ru/d/6F8FdUGthpnk3A

.

 
mytarmailS #:
Vous n'essayez pas de trouver un seul ensemble de paramètres, mais une sorte de groupe de paramètres proches.

Regardez à quel point les courbes sont différentes dans l'intervalle d'échantillonnage (entre les lignes bleues).

Cela suggère que vous obtenez des ensembles de paramètres éloignés plutôt que proches. Si l'on utilise une fonction cible bruyante, on obtient des résultats proches de différentes collines.

Il est clair que si l'on n'interrompt pas l'AG, mais que l'on attend qu'elle soit terminée, un pic sera trouvé. Et les 20 meilleurs passages se feront à partir de là - les courbes d'échantillonnage seront presque les mêmes. Cela ne sert à rien.

 
fxsaber #:

Si vous n'interrompez pas l'AG, mais attendez qu'elle soit terminée, un pic sera trouvé. Et les 20 meilleures passes partiront de là - les courbes d'échantillonnage seront presque les mêmes.

J'ai vérifié cette affirmation sur le même VDC sans interrompre l'AG.

On voit bien qu'il y a des ensembles différents parmi ces 20. Cela suggère plutôt que l'AG normal n'a pas fait son travail. Plus précisément, il s'est interrompu lui-même en plaçant les résultats de différents pics dans le top 20.

 
fxsaber #:

C'est une bonne chose. Lorsque je consulte des articles sur la recherche en matière de tsvr, je commence presque immédiatement à douter de leurs approches si l'on recherche des modèles en supposant qu'ils sont disponibles 24 heures sur 24.

Je peux vous dire que pour tous les prédicteurs, une répartition dans le temps ne donne pas un biais de probabilité significatif, du moins pour moi. J'ai donc tendance à penser que le temps est un facteur important, mais que d'autres facteurs plus significatifs peuvent affecter le résultat s'ils sont en phase active.

Je pense également que dans la fenêtre, vous pouvez simplement prendre une grille de quantification différente pour le prix, avec un grand nombre d'intervalles (pour une préservation plus précise de la structure), et tester sur un tel "signal compressé" - il aura déjà des déviations. Vous pouvez également utiliser un petit nombre d'intervalles plus un bruit aléatoire dans la plage de référence entre deux intervalles.

Vous pouvez même fixer la grille et ne stocker que le décalage pour la première référence. Dans ce cas, il n'y aura que peu d'espace et la transformation sera rapide.
 
Maxim Dmitrievsky #:

Et avec une longueur de 5 km, pour couronner le tout

https://disk.yandex.ru/d/1ypCrzYKk82XdA


Il semble qu'un graphique d'optimisation puisse montrer à quel point le processus de recherche est difficile. Nous y voilà donc.


 
Aleksey Vyazmikin #:

Je peux dire que pour tous les prédicteurs, une répartition dans le temps ne donne pas un biais significatif dans la probabilité, du moins en ce qui me concerne. J'ai donc tendance à penser que le temps est un facteur important, mais que d'autres facteurs plus significatifs peuvent affecter le résultat s'ils sont dans la phase active.

Je pense également que dans la fenêtre, vous pouvez simplement prendre une grille de quantification différente pour le prix, avec un grand nombre d'intervalles (pour une préservation plus précise de la structure), et tester sur un tel "signal compressé" - il aura déjà des déviations. Vous pouvez également utiliser un petit nombre d'intervalles plus un bruit aléatoire dans la plage de référence entre deux intervalles.

Vous pouvez même fixer la grille et ne stocker que le décalage pour la première référence. Dans ce cas, il n'y aura que peu d'espace et la transformation sera rapide.

Malheureusement, il s'agit là d'hypothèses qui doivent être mises en œuvre et testées.

@Maxim Dmitrievsky essaie ses variantes, j'essaie les miennes.