L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2031

 
mytarmailS:

nous pouvons essayer d'exprimer la cible d'une manière plus complexe sous la forme de 4 paramètres à la fois


Disons que nous décidons d'acheter...

et la grille ne nous dit pas seulement d'acheter ou de vendre

il nous dit

à quel prix acheter, à quel prix fermer, après combien de temps acheter et après combien de temps fermer

vous pouvez également ajouter un stop loss

Des prévisions aussi précises et lointaines me semblent lourdes à apprendre...

Pour les takeoffs, je pense que nous devrions faire une classification avec différentes variantes de prise de bénéfices et le modèle devrait choisir la plus rentable. C'est similaire à ZZ, mais le modèle devrait travailler sur chaque barre à partir d'un certain point, mais ce point n'apparaîtra pas sur chaque mouvement de prix à partir de la position ouverte.

Un bon endroit pour entrer est l'endroit où la perte minimale peut être obtenue, c'est-à-dire qu'il est important de connaître immédiatement le point de sortie approprié pour fixer le SL, si le SL est lié à un indicateur de niveau, alors les points d'entrée sont assez faciles à trouver et à trier, ils sont similaires, et donc la formation devrait être meilleure.

La question est donc de savoir comment trouver ces points...

 
Aleksey Vyazmikin:

Un souhait de réussite est là :)

Tu as besoin d'une régression, alors ? Je n'ai pas beaucoup d'expérience dans ce genre de modèles.

Je connais ce concept - il y a des gens qui le font - la question est de savoir comment créer des stratégies - dans le moteur lui-même...

Alors pour la classification, la cible fait-elle ? Je laisserai la première partie du tableau, qui concerne l'entrée, le SL, le TP et la dernière colonne +-1 comme résultat de la transaction. Je n'ai pas besoin d'alimenter l'info sur la sortie, car elle peut être un indice.

De quel moteur s'agit-il ? En force brute ou en génétique, pour commencer.

 
Rorschach:

Alors pour classer la cible faire ? Je vais laisser la première partie du tableau, qui concerne l'entrée, le SL, le TP et la dernière colonne +-1 comme résultat de la transaction. Je ne pense pas que je doive donner des informations sur la sortie, car il est possible de l'espionner.

De quel moteur s'agit-il ? En force brute ou en génétique, pour commencer.

On peut faire de la régression, on peut faire un modèle, tant qu'il ne s'agit que de recherche, comme je le comprends. Mais pour évaluer la qualité, il est plus compliqué - il faudra évaluer l'écart par rapport au plan, je ne sais pas si vous pouvez évaluer immédiatement le vecteur de l'écart ou là modulo - pas engagé.

À propos d'un moteur qui prendra judicieusement les bonnes données, afin de ne pas générer des conditions commerciales manifestement insensées - le processus de génération de la stratégie elle-même, et après cela, nous pouvons penser à la génétique ou à une autre façon d'améliorer le modèle.

 
Aleksey Vyazmikin:

On peut aussi faire de la régression, établir un modèle, tant qu'il ne s'agit que de recherche, comme je le comprends. Mais c'est plus compliqué avec l'estimation de la qualité - nous devrons estimer la déviation par rapport au plan, je ne sais pas s'il est possible d'estimer le vecteur de déviation ou le modulo - je ne l'ai pas fait.

À propos du moteur qui prendra judicieusement les données nécessaires, afin de ne pas générer sciemment des conditions de trading dénuées de sens - le processus de génération de stratégie lui-même, et après cela, nous pouvons penser à la génétique ou à autre chose pour entraîner le modèle.

En fait, il est intéressant de voir le regroupement, comment il sera regroupé, y aura-t-il une logique.

On peut commencer par Martin, Anti-Martin et Overturn. Et ensuite, si la transaction s'est terminée dans le sens négatif, la suivante s'ouvre avec un lot double ou dans la direction opposée ou les deux. Il est difficile de penser à quelque chose de plus compliqué en partant de zéro.

 
Rorschach:

Il est en fait intéressant de voir le regroupement, comment il se fera, s'il y aura une logique.

Pour commencer, nous pouvons prendre un martin, un anti-martin et un reversal. Et ensuite, si une transaction s'est conclue par une perte, alors la suivante s'ouvre avec un double lot ou juste dans la direction opposée ou les deux. Il est difficile de penser à quelque chose de plus compliqué en partant de zéro.

Je peux fournir des ressources, je ne peux pas faire plus pour le moment.

 
Aleksey Vyazmikin:

Je peux fournir des ressources, mais je ne peux pas faire plus pour le moment.

Catbust a des fonctionnalités_importantes, la possibilité de regarder les clusters, comme dans les forêts ?

Votre machine va-t-elle digérer la table 14 pour 180.000.000 ?

 
Rorschach:

Est-ce que catbust dispose de feature_importances, la possibilité de regarder les clusters, comme dans un échafaudage ?

Votre machine va-t-elle digérer la table 14 pour 180.000.000 ?

"Feature_importances" est l'importance des caractéristiques, qu'est-ce que cela a à voir avec les clusters ? Ou bien j'ai raté quelque chose. Il existe une telle fonctionnalité, mais je ne l'utilise pas beaucoup, car cette importance est essentiellement comptée par la cime des arbres, ce qui ne correspond pas à mon concept.

J'ai entraîné des modèles sur des tables de 6 gigaoctets. Et il ne consommait pas plus de 2 gigaoctets de mémoire, comme je m'en souviens maintenant.

 
Aleksey Vyazmikin:

"feature_importances" est l'importance des fonctionnalités, qu'est-ce que cela a à voir avec les clusters ? Ou est-ce que je rate quelque chose ? Il existe une telle fonctionnalité, mais je ne l'utilise pas beaucoup, car cette importance est essentiellement comptée par la cime des arbres, ce qui ne correspond pas à mon concept.

J'ai entraîné des modèles sur des tables de 6 gigaoctets. Et il ne consommait pas plus de 2 gigaoctets de mémoire, comme je m'en souviens maintenant.

Pour la forêt, il est possible de voir l'importance et les clusters. Dans catbust, il s'agit probablement de plot_tree.

Les données seront préparées et seront affichées.

J'ai fait une version de test pour 6 colonnes, elle a pris 11GB. Notepad++ n'a pas pu l'ouvrir, il dit que le fichier est trop gros. BD Browser for SQLite est suspendu depuis environ 20 minutes.
 
Rorschach:

Pour une forêt, il y a une option pour regarder l'importance et les clusters. Dans catbust, il s'agit probablement de plot_tree.

Je vais préparer les données et les poster.

J'ai fait une version de test pour 6 colonnes, elle a pris 11GB. Notepad++ n'a pas pu l'ouvrir, il dit que le fichier est trop gros. BD Browser for SQLite est suspendu depuis environ 20 minutes.
Total command viewer prend des fichiers volumineux, ce qui provoque le blocage de Notepad++.
 
Aleksey Vyazmikin:

"feature_importances" est l'importance des fonctionnalités, qu'est-ce que cela a à voir avec les clusters ? Ou est-ce que je rate quelque chose ? Il existe une telle fonctionnalité, mais je ne l'utilise pas beaucoup, car cette importance est essentiellement comptée par la cime des arbres, ce qui ne correspond pas à mon concept.

J'ai entraîné des modèles sur des tables de 6 gigaoctets. Et il ne consommait pas plus de 2 gigaoctets de mémoire, comme je m'en souviens maintenant.

Je me demande comment ils forment des arbres sans prendre toutes les données en mémoire. Si nous avions une table de 6 gigaoctets, nous devions aussi utiliser environ 6 gigaoctets de mémoire. Un arbre doit trier chaque colonne dans son ensemble. Si on ne met pas tout en mémoire, mais qu'on lit à chaque fois les données sur le disque, ce sera trop lent.
La seule variante consiste à conserver les données en mémoire dans le type float au lieu de double, mais cela réduira la précision. Pour nous, avec une précision à 5 chiffres, ce n'est peut-être pas si mal, mais catbust est un logiciel universel, je pense que les problèmes physiques et mathématiques devraient être résolus en double précision.