L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 185

 
Yury Reshetov:
Ne dis pas de bêtises. Dans jPrediction, nous utilisons un algorithme de réduction de la dimensionnalité de l'entrée pour éviter d'obtenir un modèle dans la sortie qui a été formé sur des prédicteurs bruyants ou sans importance. C'est-à-dire qu'un choix est fait parmi une variété de modèles avec différentes combinaisons de prédicteurs, parmi lesquels il ne reste que celui qui a la meilleure généralisation.

situation hypothétique....

Nous avons 100 prédicteurs potentiels, soit des indicateurs pour simplifier.

Supposons que nous sachions initialement que tous ces prédicteurs n'ont qu'une seule situation profitable, c'est lorsque RCI a franchi 90 et que la stochastique vient de passer sous zéro (situation naturelle du plafond), une telle situation donne la baisse du prix avec une probabilité de 90%, tous les autres prédicteurs sont du bruit total, toutes les autres situations dans les prédicteurs RSI et stochastiques sont aussi du bruit total, et il y a des centaines et des centaines de situations différentes....

c'est-à-dire que nous avons environ 0,01% de signal utile pour 99,9% de bruit

Supposons que, par miracle, votre MO rejette les 98 prédicteurs et n'en laisse que deux - RSI et stochastique.

il existe des centaines de situations de RSI>0, RSI>13, RSI<85, RSI=0, RSI<145, ............. Puisque vous entraînez le MO à reconnaître tous les mouvements de prix, le MO va construire des modèles prenant en compte toutes les situations possibles qui sont disponibles dans le RSI et les stochastiques, et la probabilité dans ces situations qu'ils fonctionnent est presque nulle, mais le MO doit les prendre en compte et construire des modèles avec eux, malgré le fait que c'est le vrai bruit, et qu'une situation qui fonctionne sera perdue parmi des centaines d'autres solutions, c'est le recyclage .....

Comment avez-vous fini par l'obtenir ?

 

Vous avez tout mélangé.

Il s'agit de questions différentes et indépendantes. MAIS ILS SONT COMME LES BRIQUES D'UNE MAISON : CE N'EST QU'EN LES RÉUNISSANT QUE L'ON OBTIENT UN SYSTÈME COMMERCIAL.

1. Préparation des prédicteurs. Cette étape comporte un nombre assez important d'objectifs et d'outils correspondants. J'ai délibérément orienté l'ensemble du problème de cette étape vers l'élimination du bruit, c'est-à-dire la recherche de prédicteurs ayant une capacité de prédiction pour cette variable cible particulière. Laissez-moi vous décrire l'idéal. Tiré d'un article sur la génétique. Mais en utilisant mon propre exemple.

Prenons la variable cible "musulmans" (pour plus de clarté). Le prédicteur "vêtements", qui a deux valeurs "pantalon" et "jupe". Une partie des valeurs du prédicteur "vêtements" avec la valeur "pantalon" prédit sans ambiguïté la classe "homme" et l'autre partie prédit "femme". Nous avons également des prédicteurs tels que le RSI pour la variable cible "achat/vente". Nous savons tous que l'indicateur ment souvent, mais une partie de celui-ci prédit une classe, et une autre partie en prédit une autre. Nous devons donc rechercher des prédicteurs, dont certains prédisent une classe et d'autres une autre. Et moins le chevauchement (faux positifs) est important, plus la qualité du prédicteur est élevée. L'idéal est "pantalon/jupes" lorsqu'un prédicteur peut être divisé en deux parties sans intersection. Mais cela ne fonctionne que pour les musulmans, et pour les Européens.....

Il existe des méthodes algorithmiques (l'ACP, par exemple, non pas classique, mais avec un raffinement), mais il faut commencer par le contenu des prédicteurs. En fonction du contenu, il faut d'abord jeter les anneaux de Saturne, le marc de café et autres trucs..... Ce qui compte, ce n'est PAS la corrélation de ces prédicteurs. Par exemple, nous prenons certains produits dérivés de kotir - ils sont tous de kotir, mais nous prenons l'intérêt ouvert, les volumes... Alors pour une raison quelconque, d'autres paires de devises, la macroéconomie ne sont pas conditionnées...

2. Modèle adapté. Il s'agit d'un problème distinct, et le premier ne peut être résolu avec le modèle utilisé. La confusion ici est causée par le fait que beaucoup d'algorithmes de modèles ont un algorithme de sélection de prédicteurs intégré. Personnellement, je n'ai pas connaissance d'un algorithme intégré qui résout le premier problème.

Reshetov prétend avoir un tel algorithme intégré. Mais il n'a jamais cité de preuve de l'absence de recyclage à l'aide de son algorithme.

La première étape est obligatoire. Mais il n'exclut pas, et peut-être même suggère-t-il, d'utiliser des algorithmes de sélection de prédicteurs intégrés. Mais ces algorithmes doivent être épargnés par le "marc de café" dans un premier temps.

3. classificateur binaire-alternatif. Reshetov, comme d'habitude, a confondu la question avec sa compréhension du classificateur ternaire. On parle de ternaire lorsque la variable cible a trois valeurs et, d'une manière générale, un nombre quelconque de valeurs qualitatives (nominales, catégories). Reshetov a deux binaires à partir desquels il obtient un signal de travail, ce qui sur le forex est TRES souhaitable - avoir un signal ternaire d'achat/flet/vente. J'utilise une variable cible binaire pour la classification, et pour le trading, à partir des résultats des deux classifications binaires, j'obtiens trois signaux - exactement comme Reshetov.

4. Lacombinaison des résultats de plusieurs modèles en un signal de négociation est un problème distinct. Il existe une solution proposée par Reshetov. Mais d'autres solutions ont été suggérées plus haut dans ce fil. Dik a suggéré ci-dessus de prendre en compte les valeurs dont la classe est issue. Ce problème peut également se poser, surtout si l'on se rappelle que les algorithmes de classification donnent la valeur de CHAQUE classe dont la classe est dérivée. Lorsque nous regroupons les résultats de plusieurs modèles en un seul résultat, la prise en compte de ces probabilités est inévitable. Il existe des algorithmes qui divisent ces probabilités non pas par moitié, mais autrement, ce qui réduit l'erreur de classification.

5. Évaluation finale du modèle. C'est un point sur lequel je n'ai pas réussi à m'entendre avec Burnakov. Nous prenons le modèle et l'exécutons "hors échantillon", "hors" étant compris comme hors de l'intervalle de temps, où la formation, le test, la validation croisée ont été effectués... Cette étape n'est pas constructive car elle ne nous dit pas ce qu'il faut faire. Cette étape est un verdict : à garder ou à jeter. La raison du "rejet" n'est pas une erreur trop importante, mais son CHANGEMENT par rapport aux étapes précédentes. Rejeter car le modèle est surentraîné, il est sans espoir et dangereux. Si cette étape est franchie, passez ensuite au testeur, en obtenant de lui le même résultat "garder - jeter".

 
mytarmailS:

situation hypothétique....

...

puis le MO construira des modèles en tenant compte de toutes les situations possibles...

Lorsque vous entraînez le MO à reconnaître tous les mouvements de prix, le MO ...

...

mais le MO doit les prendre en compte et construire des modèles basés sur eux, malgré le fait qu'il s'agit du bruit réel, et qu'une situation de travail sera simplement perdue parmi des centaines d'autres solutions, c'est à cela que sert le surentraînement.....

jLa prédiction ne doit pas tenir compte de toutes les situations possibles. Ça fonctionne beaucoup plus simplement que ce que vous avez inventé.

Le principe de la sélection séquentielle des prédicteurs (et non une énumération complète des combinaisons comme vous essayez de l'inventer) est disponible dans mon post sur pg. 109

Si vous êtes amnésique, laissez-moi vous rappeler que vous avez déjà clarifié l'ordre de sélection des prédicteurs sur p. 110

 

SanSanych Fomenko:

Reshetov, comme toujours, a confondu la question avec sa compréhension du classificateur ternaire.

...

J'utilise une variable cible binaire pour classifier, et pour trader à partir des résultats de deux classifications binaires, j'obtiens trois signaux - exactement comme Reshetov.


Reshetov n'est-il pas un vaurien ?

Il a tellement embrouillé la question que maintenant, même Fomenko doit faire exactement comme Reshetov.

Chourik Chourikovitch, prenez une tarte sur l'étagère. Après tout, vous l'avez honnêtement gagné dans le domaine de la critique radis et mauvais homme - Reshetov.

 
Yury Reshetov:

jLa prédiction ne doit pas prendre en compte toutes les situations possibles. Ça fonctionne beaucoup plus simplement que ce que vous avez inventé.

Le principe d'une sélection cohérente des prédicteurs (et non une énumération complète des combinaisons comme vous essayez de l'inventer) se trouve dans mon post sur la pg. 109

Si vous êtes amnésique, laissez-moi vous rappeler que vous avez déjà clarifié l'ordre de sélection des prédicteurs sur p. 110

Je parle de la raison pour laquelle l'OI (tout) ne peut pas sélectionner les caractéristiques correctement, et vous parlez de l'écologie...

 
mytarmailS:

Je parle de la raison pour laquelle le MO (n'importe lequel) ne peut pas échantillonner correctement les caractéristiques, et vous parlez de l'écologie...

jPrediction est excellent pour éliminer les prédicteurs. Ce n'est probablement pas la méthode la plus idéale, mais elle convient pour les tâches appliquées. Il est fort probable que la limite de la perfection n'a pas encore été atteinte et qu'il existe un potentiel pour de nouvelles recherches ? Le plus important est qu'il y ait un résultat positif et que vous puissiez commencer à danser à partir de celui-ci.

Le fait est que vous ne devez pas projeter vos propres préjugés sur les méthodes d'apprentissage automatique (et pas seulement dans le domaine de l'OM).

Si quelque chose ne fonctionne pas pour vous et que la même chose fonctionne pour d'autres, cela ne signifie pas qu'il n'existe pas de méthodes normales. Cela signifie seulement que vous n'utilisez pas ces méthodes normales, ou que vous les utilisez incorrectement, en raison de certains préjugés personnels.

 
Yury Reshetov:

Ce Reshetov n'est-il pas une canaille ?

Il a tellement embrouillé la question que maintenant même Fomenko doit faire exactement comme Reshetov.

Chourik Chourikovitch, prends une tarte sur l'étagère. Vous l'avez honnêtement mérité dans votre domaine de la critique d'un radis et pas un homme bon - Reshetov.

Calmez-vous.

Je n'ai JAMAIS pensé à vous offenser personnellement, car vous et moi sommes du même sang.

Mais votre "on the fence" est d'un intérêt indéniable pour moi.

Voilà le truc. Sur l'exemple d'un binaire.

Supposons que la probabilité d'une classe soit de 0,49 et que la probabilité de la seconde soit de 0,51. S'agit-il de deux classes ou d'une classe "en attente" ?

 
Yury Reshetov:

La bicyclette ternaire la plus stupide et la moins prometteuse, bien que la plus primitive dans sa mise en œuvre : il s'agit d'un ANN à trois sorties. Si chacune de ces sorties a son propre seuil de classification, il n'y a pas trois mais huit états potentiellement possibles, dont trois seulement sont sans ambiguïté (une valeur supérieure au seuil sur une seule des trois sorties), et cinq dont l'interprétation n'est pas claire (valeurs supérieures au seuil sur plus d'une des sorties, ou inférieures au seuil sur les trois sorties).

Pour tout classer, c'est beaucoup plus simple, il est courant de prendre la sortie ayant la valeur la plus élevée. Si les résultats sur trois sorties sont (0,1;0,3;0,2), alors la plus grande valeur = 0,4 et la sortie numéro 2 est active.
Le modèle commercial peut avoir cette logique :
La valeur la plus élevée sur la première sortie -> position longue,
La valeur la plus élevée dans la deuxième sortie -> sortir de toutes les transactions et ne pas faire de transactions,
La valeur la plus élevée dans la troisième sortie -> position courte.
C'est tout, pas de seuils, pas d'états, etc.

Il ne s'agit pas du tout d'un vélo, mais d'une méthode souvent utilisée en neuronique pour la classification lorsque plus de deux classes sont nécessaires. Il peut donc y avoir au moins des dizaines de classes lors de la classification d'images, par exemple.
Une sortie avec un seuil au milieu est suffisante pour deux classes.
 

Dr. Trader:

Le modèle commercial pourrait avoir cette logique :


  • Valeur la plus élevée à la première sortie -> position longue,
  • La valeur la plus élevée sur la deuxième sortie -> sortir de toutes les transactions et ne pas trader,
  • La valeur la plus élevée sur la troisième sortie -> position courte.


C'est tout, pas de seuils, pas d'états, etc.

C'est aussi une option. Bien qu'il ne soit pas certain qu'une approche aussi triviale permette une généralisation normale. Parfois, la simplicité est pire que le vol. C'est-à-dire qu'il est nécessaire de vérifier empiriquement - l'autopsie le montrera.
 
SanSanych Fomenko:

Supposons que la probabilité d'une classe soit de 0,49 et que la probabilité de la deuxième classe soit de 0,51. Est-ce qu'il y a deux classes ou est-ce qu'on est "sur la corde raide" ?

Parce que la crème glacée.

Désolé, mais comme la question est, la réponse l'est aussi.

C'est-à-dire que je ne comprends pas l'humour car pour prendre une décision, il faut comparer la valeur de sortie du classificateur avec quelque chose, par exemple avec une valeur seuil. Et puisque dans votre formulation du problème, les valeurs comparables, pour une raison ou une autre, sont inconnues, et que seules sont connues celles qui ne sont pas nécessaires à la classification, il serait bon d'apporter des précisions.