L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 570

 
Maxim Dmitrievsky:
  • Random Forest : importance de Gini ou diminution moyenne de l'impureté (MDI)[2].
  • Random Forest : Importance de la permutation ou diminution moyenne de l'exactitude (MDA)[2].
  • Random Forest : Boruta [3].

https://medium.com/@ceshine/feature-importance-mesures-pour-les-modèles-arbres-part-i-47f187c1a2c3

vous devriez essayer d'ajouter au moins 1 méthode aux forêts algibes et alors tout peut être fait automatiquement dans МТ5 sans R, par exemple la récupération des données.


La sélection de prédicteurs la plus impressionnante dans caret : gafs - sélection génétique de prédicteurs ; rfe - sélection inverse de prédicteurs (la plus rapide) ; safs - robustesse simulée de la sélection de prédicteurs (recuit) - la plus efficace.


Si nous parlons d'apprentissage automatique, nous devons faire attention - il s'agit d'une coquille qui comprend l'ensemble du cycle : collecte de données, modélisation, estimation.



PS.

Tout ce à quoi vous vous accrochez, c'est le "voilà comment finir...".

 
SanSanych Fomenko:



Non, je veux dire exactement la méthode de sélection en RF, pas d'autres façons. Ou est-ce pour RF ? Je crois savoir que Gini est le plus populaire.

Oui, R MDI est utilisé

 

A propos de la sélection des prédicteurs...
Ajouté initialement au modèle - jour de la semaine. J'ai observé le trading de la meilleure variante - il s'est avéré que sur 40 jours (8 semaines) elle avait appris à acheter le jeudi et dans le test de 10 jours (2 semaines) elle achetait presque chaque barre du jeudi et gagnait. Et d'autres jours, elle n'a pas fait de transactions ou n'a fait que des transactions isolées.
Conclusion : je dois supprimer les jours de la semaine pour que mon trading soit équilibré. Je fais maintenant des tests sans elle et nous verrons ce qui se passe.
Mais j'ai été éliminé par pur bon sens, l'automatisation considérant ce prédicteur comme très important.

C'est donc un peu exagéré de compter sur l'automatisation... Bien qu'il soit possible que le jour de la semaine soit la seule chose que vous puissiez voir et comprendre manuellement, quelque chose de plus fin pourrait ne pas être perceptible...

 
elibrarius:

A propos de la sélection des prédicteurs...
Ajouté initialement au modèle - jour de la semaine. J'ai regardé le trading de la meilleure variante et il s'est avéré que j'avais appris pendant 40 jours (8 semaines) à acheter le jeudi et dans le test de 10 jours (2 semaines), j'achetais presque chaque barre du jeudi et je gagnais. Et d'autres jours, elle n'a pas négocié ou n'a conclu que des transactions isolées.
Conclusion : je dois supprimer les jours de la semaine pour que mon trading soit équilibré. Je fais maintenant des tests sans elle et nous verrons ce qui se passe.
Mais cette élimination est purement basée sur le bon sens, l'automatisation a considéré ce prédicteur comme très important.

Il est donc un peu risqué de compter sur l'automatisation...


Je suis juste curieux de comprendre comment cela fonctionne, afin de ne pas avoir à faire quoi que ce soit :) si une variable n'est pas importante, il suffit de la supprimer, afin de ne pas générer de dimensionnalité supplémentaire.

L'important n'est pas de savoir si le modèle fonctionnera à l'avenir, mais de savoir si les caractéristiques actuelles décrivent bien la cible.

D'autre part, pour NS ou Deep NS, la sélection des caractéristiques n'est pas du tout importante, elle donne simplement moins de poids et les caractéristiques supplémentaires n'ont presque aucun effet. Le tuning additionnel est une bonne chose bien sûr, mais c'est du satanisme de données pour les stats et n'est pas adapté aux handicaps et donnera 5-7% d'augmentation de la qualité, ce qui n'est rien.

En soi, la sélection des prédicteurs dans le forex est presque une perte de temps, l'importance variera d'un ensemble à l'autre. IALA

 
Maxim Dmitrievsky:

En revanche, pour les NS ou les NS profonds, la sélection des caractères n'est pas du tout importante, elle ne fait que lancer des poids plus faibles et les caractères supplémentaires n'ont pratiquement aucun effet. Un réglage supplémentaire est certainement une bonne chose, mais il s'agit d'un satanisme de données pour les statistiques, qui ne convient pas pour les handicaps.

Dans mon exemple, le jeudi s'est avéré très propice à l'achat (dans l'intervalle de 50 jours) et NS a apparemment attribué à ce jour de la semaine le poids le plus élevé. Ça a marché, mais je pense qu'acheter sur tous les bars le jeudi est une erreur. Après tout, les choses peuvent changer, nous devons chercher des modèles plus profonds.

Peut-être une année d'apprentissage... Mais cela prendra 6 ou 7 fois plus de temps. Alors peut-être que le jour de la semaine perdra de son importance.

 
elibrarius:

Dans mon exemple, le jeudi s'est avéré être un très bon jour pour faire des achats (à l'intervalle de 50 jours) et, apparemment, le SN a accordé le plus grand poids à ce jour de la semaine. NS gagné, mais je pense qu'acheter sur tous les bars le jeudi est une erreur. Après tout, les choses peuvent changer, nous devons chercher des modèles plus profonds.


Cela peut changer, oui :) il faut soit un plus grand échantillon, soit se recycler et s'évaluer soi-même... Je fais le deuxième cas. La dernière course, pour ainsi dire :)

 

Il faut aussi étudier la fréquence des gaps, je me souviens du graphique du JPY comme si une hache avait été utilisée pour hacher la hausse des cotations. Alors comment échanger. Ces amplitudes supérieures à 1000 pips doivent être structurées (par les niveaux de volatilité des gaps) et la probabilité de leur répétition doit être calculée. La probabilité est élevée - le conseiller expert dort sur ce graphique. Ou vous pouvez attraper l'augmentation de la probabilité du gap et, sachant dans quelle direction il va aller, utiliser des ordres en attente pour essayer de le suivre. Il est également important d'étudier ce qui se passe avant le gap - parce qu'il est clairement créé par l'homme, donc ils trichent avant le gap afin de concentrer les ordres dans la direction opposée à celle du gap à venir. Ajouté.


Et je suis d'accord pour le décor. Mais le jeu est différent pour chaque période. Pour les minutes, c'est un jour, pour une heure, un mois, etc. Ou, voulez-vous dire le modèle rentable de comportement de citation, qui se produit plus souvent ? Alors oui - un ensemble sera mesuré par le moment de la création de ce "modèle".

Et les valeurs de l'historique des cotations ou de vos prédicteurs (je comprends qu'il s'agit de modèles répétitifs de comportement des cotations sur le graphique), qui sont plus proches de la date actuelle, devraient avoir un poids plus important, c'est-à-dire que l'historique sur 1 an n'est intéressant que pour la recherche de ces prédicteurs - les modèles répétitifs de "profit" du comportement des cotations pour le tableau des prédicteurs et leur donner un poids en fonction de leur fréquence de détection sur l'historique des cotations. Le deuxième poids devrait augmenter le statut du prédicteur en fonction de sa proximité avec les derniers événements du graphique.

C'est comme si Mendeleïev se réveillait et racontait tout depuis son sommeil. Je n'y comprends rien moi-même)))) Bonne chance, nous attendons les résultats.

100% p.a. et stabilité dans le commerce. Je n'ai besoin de rien d'autre. N'en faites pas trop.


prédicteur

11.1.5. ЛИНЕЙНЫЙ ПРЕДИКТОР И ФУНКЦИЯ СВЯЗИ
  • lib.alnam.ru
линейный предиктор изменяется на единиц. (Это может быть как реалистичной интерпретацией, так и нереалистичной. В примере с объемом древесины, если радиус ствола дерева увеличивается, то, вероятно, возрастает и его высота.) Ожидаемое значение У связано с линейным предиктором посредством функции связи . В некоторых случаях известны естественные...
 
geratdc:

100% p.a. n'est pas suffisant, il faut un mois :)

 
elibrarius:

A propos de la sélection des prédicteurs...
Ajouté initialement au modèle - jour de la semaine. J'ai observé le trading de la meilleure variante - il s'est avéré que sur 40 jours (8 semaines) elle avait appris à acheter le jeudi et dans le test de 10 jours (2 semaines) elle achetait presque chaque barre du jeudi et gagnait. Et d'autres jours, elle n'a pas négocié ou n'a conclu que des transactions isolées.
Conclusion : je dois supprimer les jours de la semaine pour que mon trading soit équilibré. Je fais maintenant des tests sans elle et nous verrons ce qui se passe.
Mais cette élimination est purement basée sur le bon sens, l'automatisation a considéré ce prédicteur comme très important.

C'est donc un peu exagéré de compter sur l'automatisation... Bien qu'il soit possible que le jour de la semaine soit la seule chose que vous puissiez voir et comprendre manuellement, quelque chose de plus fin pourrait ne pas être perceptible...

mais non... après avoir retiré le jour de la semaine, tout reste identique. Il y a 5 barres quotidiennes comme contexte, peut-être que ça vient de là... Je dois essayer sans eux.
 
elibrarius:
non... après avoir supprimé le jour de la semaine, c'est toujours la même chose. Il y a 5 barres quotidiennes comme contexte, c'est peut-être de là que ça vient... Je dois essayer sans eux.

cela signifie qu'il a peu d'effet... comment puis-je comprendre sans lui? ) Seulement si vous changez les valeurs de chacun des prédicteurs à tour de rôle, que vous reformez et que vous observez comment l'erreur totale change.

seulement, il pourrait être surprenant que des données mélangées au hasard s'avèrent soudainement très importantes :) + long s'il y a beaucoup de fonctionnalités. Donc, sans caractéristiques, c'est une tâche sysyphéenne.