L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3011

 
Maxim Dmitrievsky #:
Eh bien, c'est exactement la même chose dans la fiction. Ils ont beaucoup d'idées, n'ont pas le temps de les écrire :) et ensuite le comité éditorial en la personne d'Aleksey Nikolayev coupe tout.

Un bon éditeur, c'est bien.

L'essentiel est qu'il n'interdise pas de publier ce qui fonctionne déjà, mais il ne comprend pas comment.

 
mytarmailS #:

Il faut d'abord se rendre compte que le modèle est plein de déchets à l'intérieur...

Si vous décomposez un modèle en bois formé en règles à l'intérieur et en statistiques sur ces règles.

comme.. :


et analyser la dépendance de l'erreur d' une règle par rapport à la fréquence de son apparition dans l'échantillon.


nous obtenons


Nous nous intéressons alors à cette région


où les règles fonctionnent très bien, mais où les observations sont si rares qu'il est logique de douter de l'authenticité des statistiques les concernant, car 10 à 30 observations ne sont pas des statistiques.

Enfin, ce que je dis depuis des années commence à atteindre les masses ! :)

 
Forester #:

Quelqu'un a-t-il essayé d'ajouter des volumes à l'entraînement ? Les résultats sont-ils les mêmes ? Ou est-ce qu'ils vous apportent des améliorations ?

J'ai remarqué que les modèles tels que les volumes sous le graphique sont exécutés à travers les indicateurs.

Je n'ai pas approfondi cette question, je n'ai fait que des observations.

 
СанСаныч Фоменко #:

Vous n'avez absolument pas compris mon message : l'"espoir" n'existe pas, soit il y a une estimation numérique de l'adéquation d'une caractéristique, soit il n'y en a pas. Et il existe une évaluation numérique de l'adéquation de la caractéristique à l'avenir.

Intéressant, justement à propos de l'avenir, allez-vous nous révéler les secrets ?

 
mytarmailS #:

Train 5k

validid 60k


entraînement du modèle - 1-3 secondes

extraction des règles - 5-10 secondes

vérification de la validité de chaque règle (20-30k règles) 60k 1-2 minutes


Bien sûr, tout cela est approximatif et dépend du nombre d'attributs et de données.

De quel type de modèle s'agit-il ?

L'algorithme d'estimation des règles fonctionne-t-il sur un seul cœur ?

 
Aleksey Vyazmikin #:

De quel type de modèle s'agit-il ?

L'algorithme d'estimation des règles fonctionne-t-il sur un seul cœur ?

Forêt

sur un seul

 
Aleksey Vyazmikin #:

C'est enfin arrivé, ce que je dis depuis des années commence à atteindre les masses ! :)

Je crois que personne ne comprend encore ce que tu dis).

Il est clair et simple, comme le rasoir d'Occam.

 
Forester #:

Ce test était avec des volumes réels du CME pour l'EURUSD : volume cumulé, delta, divergence et convergence par 100 barres. Total 400 colonnes + 5 colonnes supplémentaires.
Sans modifier les paramètres du modèle, j'ai supprimé 405 colonnes contenant des données du CME (les deltas et les zigzags sont restés) pour un total de 115 colonnes et j'ai obtenu des résultats légèrement meilleurs. Il s'avère que les volumes sont parfois sélectionnés dans les splits, mais qu'ils s'avèrent être du bruit sur les OOS. Et l'entraînement est 3,5 fois plus lent.

Pour la comparaison, j'ai laissé les graphiques avec les volumes en haut et sans les volumes en bas.

J'espérais que les volumes avec CME apporteraient des informations/régularités supplémentaires qui amélioreraient l'apprentissage. Mais comme vous pouvez le voir, les modèles sans volumes sont un peu meilleurs, même si les graphiques sont très similaires.
C'était ma deuxième approche de l'EMC (je l'ai essayée il y a trois ans) et elle s'est soldée à nouveau par un échec.
Il s'avère que tout est pris en compte dans le prix.

Quelqu'un d'autre a-t-il essayé d'ajouter des volumes à l'entraînement ? Les résultats sont-ils les mêmes ? Ou est-ce qu'ils donnent des améliorations ?

J'ai fait 3 tests supplémentaires sans les volumes et je les ai comparés à ceux que j'ai faits avec les volumes. J'ai déjà modifié les hyperparamètres du modèle.
Total de 4 tests : dans 3 tests sans volumes, les OOS sont meilleurs et dans 1 test, ils sont pires. C'est à dire que parfois les volumes ajoutent un peu. En général, tout est au niveau de l'erreur. On peut obtenir plus de résultats par la force brute des hyperparamètres qu'en ajoutant des volumes. Ils ne donnent ni améliorations significatives ni détériorations significatives.

J'attendais davantage des volumes.

 
Aleksey Vyazmikin #:

Je me demande, à propos de l'avenir en particulier, si vous pouvez m'en révéler les secrets.

J'ai écrit plusieurs fois.

 
mytarmailS #:

forêt

sur un

Quel pourcentage échantillonnez-vous ?

Il me semble qu'il y a très peu d'utilité à forrest s'il utilise la moitié d'un prédicteur chacun.