L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2878

 
Maxim Dmitrievsky #:

C'est clair, on peut essayer d'utiliser des fonctions de hachage. Mais je me demande sur quel principe choisir des vecteurs de longueur arbitraire, ou plutôt la longueur de ces vecteurs:) et à partir de quelles données.

il peut y avoir beaucoup de variantes

la première option est plus agréable, mais il faut mettre quelque chose dans la logique

C'est une question très importante, j'y réfléchis toujours) Parlons simplement de la longueur de l'historique utilisé. Il faut un compromis raisonnable entre pertinence et longueur pour les calculs. Plus c'est court, plus c'est pertinent, mais plus c'est long, plus les calculs sont précis. Parfois, un bon compromis n'est pas réalisable en principe.

 
Maxim Dmitrievsky #:

Bien joué, j'ai même trouvé quelque chose d'intéressant pour moi dans le contexte de la modification de la longueur des fenêtres.

Si vous avez d'autres questions, n'hésitez pas à les esquisser, je vous les poserai après le Nouvel An.

D'accord, bonne année à tous).

 
Aleksey Nikolayev #:

Ok, bonne année à tous :)

De même :)

 

Je ne comprends pas très bien ce que vous avez retiré de la conversation sur les TPG.

Il répond parfois à la mauvaise question. En voici un exemple

В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.

*Oui, idéalement, l'algorithme devrait être capable de traiter n'importe quel nombre de caractéristiques.

Vous avez posé une question sur la variation de la longueur des lignes, et il a répondu sur la variation de la longueur des colonnes.

En pratique, la longueur de l'historique peut être modifiée en entraînant à nouveau le modèle. Par exemple, entraînez le modèle sur 1 jour, 3, 7, mois, 2, ... sur 1 an, 2, 3 ... quelle que soit la longueur de l'historique qui permet de bien prédire, utilisez-la.
 
Aleksey Nikolayev #:

C'est une question très importante, j'y pense toujours) Parlons simplement de la longueur de l'historique utilisé. Il devrait y avoir un compromis raisonnable entre la pertinence et la longueur des calculs. Plus c'est court, plus c'est pertinent, mais plus c'est long, plus les calculs sont précis. Parfois, un bon compromis n'est pas réalisable en principe.

Je me suis également posé cette question il y a longtemps, et je pense que c'est l'un des moments les plus importants pour construire une TS qui fonctionne. Pour ma part, j'utilise l'approche suivante : j'analyse grossièrement certaines caractéristiques d'un actif financier sur un grand historique connu, je trouve les coordonnées des tendances changeantes (tendance, volatilité, etc.) et je travaille ensuite à partir du dernier point de changement, en supposant que cette caractéristique globale restera inchangée pendant un certain temps.

 
elibrarius longueur des lignes et il a répondu sur la variation de la longueur des colonnes.
En pratique, la longueur de l'historique peut être modifiée en entraînant à nouveau le modèle. Par exemple, entraînez le modèle sur 1 jour, 3, 7, mois, 2, ... sur 1 an, 2, 3 ... quelle que soit la longueur de l'historique qui permet de bien prédire, utilisez cette longueur.

Les colonnes n'ont pas encore été abordées - on en est encore loin. La confusion est due au fait que l'on ne dit pas que les signes sont des prix (barres, renko, etc.). En d'autres termes, nous parlons d'une longueur arbitraire d'un vecteur d'attributs homogènes. Si, en plus de la longueur arbitraire du vecteur d'attributs, nous voulons avoir des types d'attributs arbitraires, c'est déjà clairement exagéré.

 
Aleksey Nikolayev #:

Le problème est que le SB est très doué pour faire croire qu'il y a des règles - le seul problème est qu'elles sont différentes d'un site à l'autre.

Si l'on y réfléchit bien, il ne s'agit pas d'un problème de nombre arbitraire de caractéristiques, mais bien d'un problème d'invariance des caractéristiques en premier lieu.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf
 
Aleksey Nikolayev #:

C'est une question très importante, j'y pense toujours) Parlons simplement de la longueur de l'historique utilisé. Il devrait y avoir un compromis raisonnable entre la pertinence et la longueur des calculs. Plus c'est court, plus c'est pertinent, mais plus c'est long, plus les calculs sont précis. Parfois, un bon compromis n'est pas réalisable en principe.

Il faut un critère, et le seul critère est l'erreur d'ajustement du modèle.

Voici une image


Il s'agit d'un échantillon de 2000 barres, 43 variables. On voit qu'il est inutile d'augmenter le nombre d'arbres au-delà de 100. J'ai changé la taille de l'échantillon. Le résultat est que l'image ne change pas au-delà de 1500 barres. Cela signifie que le nombre de modèles dans mes prédicteurs pour mon professeur est d'environ 100 pièces et qu'ils peuvent tous être trouvés dans 1500 mesures de l'histoire. De plus, ces modèles se répètent.

 
mytarmailS #:

Si l'on y réfléchit bien, il ne s'agit pas d'un problème de nombre arbitraire de caractéristiques, mais d'un problème d'invariance des caractéristiques en premier lieu.

https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf

Si vous comparez cela à la reconnaissance d'images, il s'agit en gros de trouver, pour chaque point, la limite de l'objet (blob) dans lequel ce point est situé.

Le problème est que l'image est de très mauvaise qualité et que l'on ne sait pas très bien ce qu'elle représente.

Il est tout simplement irréaliste de sélectionner un petit objet dans de telles conditions, et un grand objet sera sélectionné de manière ambiguë.

 
СанСаныч Фоменко #:

Il faut un critère, et le seul critère est l'erreur d'ajustement du modèle.

Voici une image


Il s'agit d'un échantillon de 2000 barres, 43 variables. On voit qu'il est inutile d'augmenter le nombre d'arbres au-delà de 100. J'ai changé la taille de l'échantillon. Le résultat est que l'image ne change pas au-delà de 1500 barres. Cela signifie que le nombre de modèles dans mes prédicteurs pour mon professeur est d'environ 100 pièces et qu'ils peuvent tous être trouvés dans 1500 mesures de l'histoire. De plus, ces modèles se répètent.

1500 bars, c'est la température moyenne de l'hôpital. Il y aura des points de rupture, lorsque les moitiés de l'historique seront très différentes et qu'il sera préférable de ne pas compter et de ne rien négocier.