L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 59

 
En ce qui concerne les méthodes, je suggère de lire l'article . L'industrie a un point de vue établi empiriquement sur les meilleures méthodes. Cet article traite du problème de la classification : http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml06.pdf

Et il n'y a pas besoin d'inventer quoi que ce soit.

Mais il y a des exceptions, bien sûr. Tout dépend des données.
 
Dr. Trader:

En d'autres termes, "Regardez le premier lien google qui mène à mon site web" :)

Personne ne vous empêche de regarder les autres liens. Je n'ai pas mis un lien vers mon site en haut de google, si ? Par conséquent, toutes les plaintes sur le fait que google indexe le site n'est pas comme vous le souhaitez, ne pas s'adresser à moi, et à l'équipe de soutien du moteur de recherche.

Dr. Trader:

J'ai trouvé, vous avez un comité de deux modèles, ce n'est pas comme ça que j'ai compris et écrit ci-dessus.

Désolé, mais je n'ai pas suivi de cours de télépathie pour lire à distance ce que vous vouliez dire. Soit vous adressez vos doléances au ministère de l'éducation pour savoir pourquoi la formation télépathique ne fait pas partie du programme obligatoire de toutes les institutions éducatives. Ou soyez plus précis dans vos réflexions sur ce formulaire.
 
Mihail Marchukajtes:
J'ai rarement eu des modèles dépassant 40-50% de généralisation, mais après avoir réfléchi à ce qu'il fallait faire avec les données. Quelle est l'essence du modèle obtenu après la classification. Sur les mêmes données, j'obtiens maintenant des modèles d'au moins 70 %, en moyenne 80-90 %, et à l'avenir, sur des données inconnues, les erreurs sont d'environ 1 à 2 sur 10-12. C'est bien assez pour gagner.)
Vous pouvez peut-être me dire quel genre de transformation miracle vous devez faire pour augmenter la qualité de la reconnaissance.
 
Dr. Trader:
Oui, moi aussi j'essaie de classer strictement achat/vente. Mais comment avez-vous obtenu les 6 entrées originales, les avez-vous simplement prises dans une stratégie connue ? Des entrées adéquates sont l'une des choses les plus importantes. Au contraire, j'ai des milliers d'entrées (prix et indicateurs sur une centaine de barres) et j'ai besoin de les trier pour n'en garder que quelques douzaines, car avec autant d'entrées, n'importe quel modèle est surentraîné.

Ma stratégie est simple. C'est le sequent de Thomas Demark, qui donne des signaux d'achat et de vente. Les signaux dont la rentabilité est supérieure à 100 pips sont marqués d'un 1, les autres sont des zéros. Je sauvegarde les valeurs des indicateurs au moment du signal et j'obtiens un modèle de généralisation de 90%. C'est tout.

Je peux également utiliser le croisement de la baguette magique comme base du système. Je pense aussi qu'il sera assez bon. Donc ça se passe comme ça. L'essentiel est de préparer correctement les données...

Les deux derniers sont des modèles de zetoscore et de coefficient de Kelly, donc rien d'extravagant.....

  double PONT1=iBullsPower(NULL,0,PONT,PRICE_CLOSE,i)+iBearsPower(NULL,0,PONT,PRICE_CLOSE,i);
  double MOM=iMomentum(NULL,0,PONT,PRICE_CLOSE,i);
  double Dstoh=iStochastic(NULL,0,PONT,PONT+9,PONT+9,MODE_EMA,0,MODE_MAIN,i);
  double STD=iStdDev(NULL,0,PONT,0,MODE_EMA,PRICE_CLOSE,i);
  double Force=iForce(NULL,0,PONT,MODE_EMA,PRICE_CLOSE,i);
  double VolM=iCustom(NULL, 0, "BetterVolume 1.4.1",9,i);
  double EMA=Close[i]-iCustom(NULL, 0, "9MAMA_NK",0.5,0.05,1,i);
  double Zscore=iCustom(NULL, 0, "TDSEQUENTA v2015",5,8,12,9,i);
  double Nstep=iCustom(NULL, 0, "TDSEQUENTA v2015",5,8,12,10,i);
 
Après la ligne rouge, hors de l'échantillonneur ou hors de l'échantillon pour les débutants. Ça me semble plutôt viable. Mais il y a eu quelques erreurs aujourd'hui, mais c'est OK...... L'erreur n'existe pas ....
 
Mihail Marchukajtes:

Ma stratégie est simple. C'est le sequent de Thomas Demark, qui donne des signaux d'achat et de vente. Les signaux dont la rentabilité est supérieure à 100 pips sont marqués d'un 1, les autres sont des zéros. Je sauvegarde les valeurs des indicateurs au moment du signal et j'obtiens un modèle de généralisation de 90%. C'est tout.

C'est-à-dire une classification selon la rentabilité future (1 - au moins 100 pips, 0 - moins de 100 pips), mais pas selon la direction du signal ? Et comment déterminez-vous la direction, par le séquenceur Demark?

 
Yury Reshetov:
C'est-à-dire par classification de rentabilité (1 - au moins 100 pips, 0 - moins de 100 pips), mais pas par direction du signal ? Et comment définissez-vous la direction, par le séquenceur Demark ?

Le système lui-même donne un signal d'achat ou de vente, c'est la direction, et le classificateur dit si le signal est d'achat et le NS dit oui c'est un signal correct, alors achetez, s'il dit non ce n'est pas un signal correct, alors vendez. C'est la même chose avec la vente.... Vrai ou faux vendre, d'où la conclusion ...

 
Mihail Marchukajtes:

Le système lui-même donne un signal d'achat ou de vente, c'est la direction, et le classificateur dit si le signal est d'achat et le NS dit oui c'est un signal correct, alors achetez, s'il dit non ce n'est pas un signal correct, alors vendez. C'est la même chose avec la vente.... Si le signal est vrai ou faux, alors tirons des conclusions...

Pouvez-vous télécharger sur le forum un exemple d'échantillon pour la classification dans CVS ?
 

Et n'importe quelle donnée d'entrée peut être convertie en donnée de sortie et le système fonctionnera pendant un certain temps, de sorte que celui qui cherche le trouvera toujours :-)

Donc, en réalité, une petite manipulation des données et nous avons un niveau de généralisation s'élevant à un chiffre acceptable de 90%......

 
Mihail Marchukajtes:

Et n'importe quelle donnée d'entrée peut être convertie en donnée de sortie et le système fonctionnera pendant un certain temps, de sorte que celui qui cherche le trouvera toujours :-)

Il suffit donc de manipuler les données pour que notre niveau de généralisation atteigne des chiffres admissibles dans 90 % des cas : ......

Quelle est la durée de la formation et de la validation des données ? On dirait que ça fait deux jours ? Ça ne dit rien du tout, pour être honnête.