L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2651

 
mytarmailS #:



Est-ce mieux ?


=====================

vous pouvez compliquer davantage les expressions

Oui, la liste est une bonne idée.

Pour faire un vrai double, il faut des types de données algébriques. Je n'ai pas encore vu leur implémentation pour R, et l'optimisation génétique ne fonctionnera pas avec eux( il n'est pas clair quel type d'optimisation fonctionnera avec eux du tout).

 

Je ne sais pas ce qu'il en est pour vous, mais je suis fasciné par cet algorithme... Comment de simples variables en bas de l'échelle s'ajoutent à de grandes expressions complexes en haut de l'échelle, une hiérarchie, comme dans la nature....

 
Aleksey Nikolayev #:

Oui, la liste est une bonne idée.

Pour faire un vrai double, il faut des types de données algébriques. Je n'ai pas encore vu leur implémentation pour R, et l'optimisation génétique ne fonctionnera pas avec eux( il n'est pas clair quel type d'optimisation fonctionnera avec eux du tout).

Eh bien, oui, il y a des limitations, parce que chaque chiffre pour GP est un élément distinct dans la liste, donc s'il y en a beaucoup, il y a des problèmes(( , mais vous pouvez sortir de cette situation comme je l'ai montré.

 
mytarmailS #:

Je ne sais pas ce qu'il en est pour vous, mais je suis fasciné par cet algorithme... Comment de simples variables en bas de l'échelle s'ajoutent à de grandes expressions complexes en haut de l'échelle, une hiérarchie, comme dans la nature....

En quoi est-il meilleur que MSUA ? On peut être fasciné par n'importe quoi, du moment que c'est utile).
 
Maxim Dmitrievsky #:
En quoi est-elle meilleure que la MSUA ? On peut être fasciné par n'importe quoi, du moment que c'est bon pour la santé).
Eh bien, c'est différent.
La régression symbolique est un cadre dans lequel vous pouvez implémenter n'importe quelle logique, c'est juste pratique parce que vous n'avez pas à l'écrire vous-même....

Et cette mise en œuvre des règles, oui, est très similaire à mgua - ingénierie des caractéristiques + sélection des caractéristiques + création d'un modèle.
Tout en un, comme mgua.
Eh bien, si vous comparez cette implémentation particulière avec mgua, vous verrez que MGUA ne peut pas gérer une grande quantité de données :
MGUA ne peut pas gérer un grand nombre de caractéristiques, car il est complètement exagéré.
C'est une mauvaise chose, mais mgua trouve la meilleure solution garantie, ce qui est une bonne chose.

Dans cette implémentation, c'est exactement le contraire
 
mytarmailS #:
Eh bien, c'est différent.
La régression symbolique est un cadre dans lequel vous pouvez implémenter n'importe quelle logique, c'est juste pratique parce que vous n'avez pas à l'écrire vous-même....

Et cette mise en œuvre des règles, oui, est très similaire à mgua - ingénierie des caractéristiques + sélection des caractéristiques + création d'un modèle.
Tout en un, comme mgua.
Eh bien, si vous comparez cette implémentation particulière avec mgua, vous verrez que MGUA ne peut pas gérer une grande quantité de données :
MGUA ne peut pas gérer un grand nombre de caractéristiques, car c'est complètement exagéré.
C'est une mauvaise chose, mais mgua trouve la meilleure solution garantie, ce qui est une bonne chose.

Dans cette implémentation, c'est exactement le contraire
Oh oui, c'est une surcharge génétique et il existe probablement des schémas standard pour combiner les traits.
 

Un peu d' invariance par rapport aux événements

Supposons que nous voulions décrire un modèle de tête et d'épaules (supposons qu'un tel modèle existe) , notre algorithme examine les derniers points H, disons 7 comme dans l'exemple.

Le rectangle vert montre la portée de l'algorithme. Les derniers points H, dans cet exemple 7 pièces.

Les données sous cette forme sont traitées, introduites dans l'AMO, etc., la fenêtre coulissante, etc.

Si nous décrivons la régularité par des règles, ce sera quelque chose comme x[1] < x[2] & x[2] > x[3] etc.....

Mais dans la réalité, le marché change, s'étire/rétrécit, les amplitudes changent, etc....


Voici la réalité du marché, et nous regardons tous les 7 derniers points en espérant que notre règle x[1] < x[2] & x[2] > x[3]... fonctionnera )).

Comme vous pouvez le voir, il y a un modèle, il n'a pas disparu, mais notre GPT-5 à 10 couches ne verra rien ).


Conclusions : tous les algorithmes AMO "out of the box" fonctionnent avec des données tabulaires, c'est-à-dire que tous les algorithmes recherchent des modèles avec une liaison rigide aux indices, cela ne fonctionne pas....

1) Il est nécessaire de se tourner vers des algorithmes tels que les règles associatives, qui sont liées à des événements, à des séquences d'événements, mais qui ne sont pas liées à des indices.

2) Soit concevoir nous-mêmes les bonnes règles et en faire des modèles.

3) Soit utiliser pour l'AMO la représentation des données qui est utilisée pour les algorithmes de règles associatives/séquences, mais le nombre de caractéristiques sera alors de plusieurs milliards.

 
Aleksey Nikolayev #:

Il n'est pas évident de savoir quel type d'optimisation fonctionnera avec eux

Que voulez-vous dire par là ? Il y a l'optimisation continue qui est double et l'optimisation discrète qui est entière. Ou ai-je mal compris ?

Le GP est discret, c'est pourquoi il y a des problèmes avec le double.
 

Le pouvoir de la diversification

Supposons que nous ayons une UC qui ne rapporte pas beaucoup d'argent, voire pas du tout.

Voici sa courbe de rendement.

En fait, il s'agit d'un bruit aléatoire auquel s'ajoute une très faible tendance, si petite qu'elle n'est pas visible à l'œil nu dans le bruit.

Voici la tendance.

Il s'agit d'une stratégie que nous ne laisserons pas commercialiser).

Mais que se passe-t-il si nous avons 100 stratégies non corrélées de ce type qui sont négociées simultanément sur un compte ?

Ce n'est pas très bon, mais qu'en est-il si nous avons 1000 stratégies ?

Et 100 000 stratégies ?

C'est vraiment génial.

Est-il possible de générer autant de stratégies avec MO ? ....

 
mytarmailS #:
Qu'entendez-vous par là ? Il y a l'optimisation continue qui est double et l'optimisation discrète qui est entière. Ou est-ce que je n'ai pas compris ?

Le GP est discret, c'est pourquoi il y a des problèmes avec le double.

J'y ai parlé des types de données algébriques. Ils généralisent les types de données complexes comme les listes et les arbres. Ils combinent une structure discrète complexe et un ensemble de nombres réels stockés dans cette structure (qui s'avère être de taille non fixe). Par conséquent, nous devons d'une manière ou d'une autre combiner l'optimisation discrète sur la structure et l'optimisation continue sur les nombres stockés dans cette structure. Je n'ai absolument aucune idée de la manière de procéder, du moins en théorie.