L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2388

 

une amélioration de 1 à 2 % peut être obtenue en réentraînant le même modèle plusieurs fois ;)

mais pas 512 fois ;)

 
Maxim Dmitrievsky:

ça ne fonctionne pas comme ça

retirer les caractéristiques de faible importance du modèle et le casser, puis comparer votre cul avec votre doigt (autres caractéristiques), et ainsi de suite

Suppression par 1 également essayée. Supprime. Quand il y a beaucoup de déchets, le modèle ne remarque presque pas la perte d'un combattant).
 
Cependant, dans le passé, je n'ai travaillé qu'avec des barres. Naturellement, les voisins remplacent celui qui s'est désisté.
Maintenant, je vais devoir m'occuper d'un grand nombre de fonctionnalités avec les MAs et ainsi de suite.
 
elibrarius:
La suppression par 1 a également été essayée. C'est le cas. Lorsqu'il y a beaucoup de débris, le modèle remarque à peine la perte d'un chasseur).

Il s'agit d'un réglage, pas d'un moyen de trouver une sorte de modèle, donc la queue ne doit pas remuer le chien.

 
elibrarius:
Après avoir sélectionné la première meilleure fonction, la deuxième sera celle qui a la meilleure interaction avec la première, et ainsi de suite. Une fois que vous aurez atteint 10, la prochaine sera celle qui a la meilleure interaction avec l'une des 10 fonctions sélectionnées précédemment, mais très probablement avec toutes.

Je ne suis pas partisan d'écarter toutes les possibilités d'un seul coup, peut-être cette approche pourrait-elle aussi donner lieu à une variante intéressante.

Le problème, c'est que je ne peux pas faire plusieurs cycles d'arrêt/départ automatiquement, en tenant compte de l'élimination de certaines fonctionnalités à chaque itération.

Je peux préparer les données pour une itération, puis je dois les préparer à nouveau - c'est pourquoi j'ai besoin de Python.

A propos, je ne vois pas d'inconvénient à essayer mes prédicteurs avec votre méthode également, s'il existe un automate prêt à l'emploi à cette fin.

 
Aleksey Vyazmikin:

Je ne suis pas un fan de l'élimination immédiate de toutes les options possibles, peut-être que cette approche pourrait fournir une option intéressante.

Le problème, c'est que je ne peux pas faire automatiquement de nombreux cycles d'arrêt/départ, en tenant compte de l'élimination de toute fonctionnalité à chaque itération.

Je peux préparer les données pour une itération, puis je dois les préparer à nouveau - c'est pourquoi j'ai besoin de Python.

D'ailleurs, cela ne me dérange pas d'essayer mes prédicteurs par votre méthode également, s'il existe un automate prêt à l'emploi à cette fin.

Si vous allez jusqu'au bout, il y aura presque 1000000 modèles formés pour 1000 caractéristiques.
L'automate est simple - 2 cycles imbriqués. Vous avez un problème avec le démarrage automatique de la formation. Résolvez-le, tout le reste sera une bagatelle.

 
elibrarius:

Si vous allez jusqu'au bout, il y aura presque 1000000 modèles formés pour 1000 caractéristiques.

C'est beaucoup - actuellement, il faut environ une journée pour former 1000 modèles.

Il pourrait être plus rapide sur une forêt aléatoire si vous le parallélisez.

elibrarius:

L'automate est simple - 2 cycles imbriqués. Vous avez un problème avec l'apprentissage automatique. Résolvez-le, tout le reste sera trivial.

C'est le problème, je ne peux pas automatiser le processus.

 
Maxim Dmitrievsky:

Il s'agit d'un réglage, pas d'une façon de trouver un modèle, donc la queue ne doit pas remuer le chien.

Vous n'avez simplement pas compris ce que j'essayais de dire - le meilleur modèle en termes de statistiques de classification ne signifie pas le meilleur en termes de rentabilité. Il ne le fait que dans le cas de SL et TP fixes.

Je cherche une méthode pour influencer les courbes de revenus et de dépenses - courbe verte et courbe rouge.

Voici à quoi ressemble la distribution de probabilité de la réponse du modèle à l'échantillon lorsqu'il est formé :

Voici comment cela se présente lorsque l'échantillon indépendant est alimenté :

Comme on peut le voir, les courbes ont presque fusionné, tandis que les motifs ne se sont pas autant détériorés - la courbe aqua est composée de zéros et la courbe magnétique de uns - leur espacement est tout à fait acceptable, et les motifs sont en quelque sorte globalement préservés, mais le coût de ces motifs n'a pas été en quelque sorte pondéré en termes de revenus/dépenses.

 
Aleksey Vyazmikin:

C'est le problème, je ne peux pas automatiser le processus.

2-3 jours d'étude de Python et quelque chose de simple, comme lancer catbust, peut être fait. D'autant plus qu'il y a des exemples dans les articles de Maxim's.
 
Maxim Dmitrievsky

dans le prochain article, veuillez ajouter lestop et le take profit au code python.