L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 110

 
Yury Reshetov:

Le problème de l'"explosion" combinatoire dans jPrediction a été résolu non pas en passant en revue toutes les combinaisons possibles, mais par la méthode de recherche séquentielle. L'essence de la méthode est la suivante :

Supposons que nous ayons trouvé une combinaison contenant N prédicteurs avec une généralisation maximale en essayant toutes les combinaisons possibles de N prédicteurs et moins. Nous devons y ajouter le prédicteur N+1. Pour cela, nous ajoutons un par un tous les prédicteurs de l'échantillon qui n'ont pas été inclus dans la combinaison et nous mesurons leur capacité de généralisation. Si, au cours de cette recherche, nous trouvons une combinaison avec N+1 prédicteurs dont la capacité de généralisation est supérieure à la meilleure combinaison de N prédicteurs, nous pouvons trouver une combinaison avec N+2 prédicteurs de la même manière. Et s'ils ne l'ont pas trouvé, alors il est clair qu'il est inutile de chercher plus loin et que l'algorithme d'essai des combinaisons s'arrête à la meilleure combinaison de N prédicteurs. Par conséquent, l'algorithme de recherche de combinaisons de prédicteurs pour le modèle s'arrête beaucoup plus tôt que si l'on essayait toutes les combinaisons possibles. Une économie supplémentaire de ressources informatiques est due au fait que la recherche commence à partir d'un petit nombre de prédicteurs dans le but d'augmenter ce nombre. Et moins nous avons besoin de prédicteurs pour la formation, moins nous avons besoin de temps et de puissance de calcul pour construire des modèles.

Salut Yuri !

Il y a des questions )) sur la recherche séquentielle ...

Disons que nous avons 10 prédicteurs

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

le groupevert est le groupe de prédicteurs qui a montré la meilleure capacité de généralisation ; exactement à ce groupe seront ajoutés d'autres prédicteurs N+1

le grouperouge, c'est le groupe qui est légèrement plus mauvais que le groupe vert etil ne participera pas aux tests, tous les tests sont déjà concentrés sur le groupe vert.

Question : et si après tous les essais avec d'autres prédicteurs N+1 un par un, il s'avère que dans le résultat final le groupe rouge a une plus grande capacité de généralisation, est-ce aussi tout à fait réaliste, ou est-ce que je comprends mal quelque chose ? ???. veuillez expliquer

 
SanSanych Fomenko:

Tout est bon sauf une broutille : il n'y a pas de comparaison avec d'autres modèles.

Comparaison.

Je soutiens... Prenez les citations comme des données et non comme des iris.
 
SanSanych Fomenko:

Tout est bon sauf une broutille : il n'y a pas de comparaison avec d'autres modèles.

Je propose mes services à titre de comparaison

1. Vous préparez un fichier Excel d'entrée contenant les prédicteurs et la variable cible.

2. Vous faites le calcul

3. Vous m'envoyez le fichier d'entrée.

4. Je fais les calculs en utilisant randomforest, ada, SVM

Nous comparons.

Pas besoin d'aller loin, voici le fichier avec les cotations du marché forex, la capacité de généralisation moyenne lorsqu'elle est entraînée par le prédicteur de reshetov est de 70% à 80%. Nusssss...... J'attends votre résultat.

P.s. Renommez le fichier en csv

Dossiers :
 
Mihail Marchukajtes:

Pas besoin d'aller loin, voici un fichier avec les cours du forex, la capacité moyenne de généralisation lors de l'entraînement avec le prédicteur de Reshetov est de 70% à 80%. Wellsssss...... J'attends votre résultat.

P.s. Renomme le fichier en ksv

Ne pourrait-on pas l'emballer ?

Et n'est-il pas possible de voir le résultat ? En fait, la généralisation de la formation ne sert à rien.

 
mytarmailS:
Appuyé par... Prenez les citations comme des données et non comme des iris.
Ce sont les deux fichiers Reshetov contenant les résultats de l'algorithme qui nous intéressent.
 
SanSanych Fomenko:

On ne peut pas l'emballer ?

Ne pouvons-nous pas voir le résultat ? En fait, la généralisation de l'apprentissage ne représente rien.

Je ne pourrais pas être plus d'accord.

 
Mihail Marchukajtes:

Pas besoin d'aller loin, voici un fichier avec les cours du forex, la capacité moyenne de généralisation lors de l'entraînement avec le prédicteur de Reshetov est de 70% à 80%. Wellsssss...... J'attends votre résultat.

P.s. Renommez le fichier en csv

Qu'est-ce que c'est ? 71 observations ?

comment avez-vous vérifié la capacité totale ?

 
mytarmailS:

C'est quoi ça ? 71 observations ?

comment avez-vous vérifié la capacité totale ?

Et vous continuez à essayer de limiter le marché des minutes dans 5 ans ?????? Ces 71 observations, deux semaines de trading sur 5 minutes si quoi que ce soit...... Et seulement acheter. Alors allez-y..... Ou êtes-vous dégonflé ?
 
Mihail Marchukajtes:
Et vous continuez à essayer de freiner le marché des minutes pendant 5 ans ??????. Ces 71 observations, deux semaines de trading sur 5 minutes si quoi que ce soit....... Et seulement acheter. Alors allez-y..... Ou êtes-vous dégonflé ?

En parlant sans la politesse européenne, vous écrivez une absurdité totale...

Donnez deux fichiers normaux, d'au moins 500 observations chacun, ainsi que les résultats du programme.

 
Mihail Marchukajtes:

La capacité moyenne de généralisation de l'apprentissage avec le prédicteur de Reshetov est de 70% à 80%.

Comme je l'ai déjà dit, cette métrique est inutile.

Les données sont divisées de manière aléatoire en deux parties à peu près égales, puis le modèle est entraîné sur la première partie uniquement, et testé sur les deux parties à la fois. Une généralisation de ~75% signifie que le modèle final prédit correctement 75% de tous les exemples du fichier.
Il existe plusieurs variantes de la manière dont le modèle peut atteindre 75% :
1) Le modèle est entraîné à une précision de 100% sur les données utilisées pour l'entraînement, et échoue totalement sur les nouvelles données de la deuxième partie du fichier, où il obtient 50% (comme à pile ou face). La moyenne serait exactement de 75%. Il s'agit d'une très mauvaise évolution et elle sera mauvaise dans le commerce.
2) Le modèle a été entraîné à une précision de 75 % sur les données d'entraînement et il a affiché la même précision de 75 % sur les données de test, ce qui représente à nouveau 75 % en moyenne. Dans cette situation, c'est le meilleur scénario, il y a une chance de gagner quelque chose.
3) Toute option intermédiaire entre les deux.

Votre version est probablement plus proche de la première. Il faut beaucoup compter sur la chance pour trader avec de tels résultats, je suppose que vous n'avez pas encore perdu votre dépôt uniquement grâce à l'indicateur qui vous sert de signal principal (séquenceur, ou autre). Je pense qu'un conseiller expert basé sur ce seul indicateur vous donnera le même résultat que l'indicateur + jPrediction.