L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1780

 
Aleksey Vyazmikin:

Des rapports indiquant qu'ils n'ont pas été impliqués dans la formation.

Alors le résultat est plus que bon.

 
mytarmailS:

une grande précision n'est pas 70%

Je suis d'accord, j'ai pris une décision pour moi-même, pas moins de 95%.

 
Farkhat Guzairov:

Stratégie... Donc après le MO, vous avez toujours besoin d'une stratégie complète ? Je pensais que le but du MO était de vous donner des conseils de sortie pour trader (long/short) ou non.

Eh bien, la cible n'est pas la mienne, et elle est juste intéressante pour moi car elle me permet d'examiner l'efficacité des prédicteurs sur une autre cible.

Farkhat Guzairov:

D'accord, j'ai pris une décision pour moi-même d'au moins 95%.

Cela dépend beaucoup de la cible, pour ma cible principale ce serait un très bon résultat, car il fonctionne en tendance.

 
mytarmailS:

déposez-le, voyons voir .... mais je ne le regarderai pas aujourd'hui, désolé, je suis au milieu de quelque chose d'autre.

Ok, je le ferai, plus tard.

 
Aleksey Vyazmikin:

D'accord, je le posterai plus tard.

Oui, tu peux, je viens de dire que je ne peux pas voir en même temps.

 
mytarmailS:

une grande précision n'est pas 70%

Tu te moques de moi. 70% est une précision d'entrée très élevée. Si les transactions sont effectuées sans attendre que les pertes se résorbent, il est difficile d'obtenir un résultat beaucoup plus élevé. Et 95% est quelque chose qui sort du domaine de la fantaisie. J'ai juste compté mes affaires de dépôt d'over-clocking pour l'intérêt. Ainsi, lors de mon premier essai, j'ai effectué 42 transactions, dont 6 étaient perdantes. Lors de ma deuxième tentative, 67 transactions ont été clôturées, dont 10 étaient perdantes. Ainsi, même avec une précision d'entrée aussi modeste, à votre avis, les comptes ont été décuplés. J'ai oublié de dire que les situations dans lesquelles on prend +1 point, et on perd -200 points, je ne les ai pas envisagées. Bien sûr, vous pouvez atteindre une précision de saisie de 95 %.

 
MrBobr1:

où vous prenez +1 pip et perdez -200 pips, je n'ai pas envisagé. Il est certainement possible d'atteindre une précision de saisie de 95%.

Pour commencer, prendre 1 et donner 200 pips n'est pas initialement acceptable pour moi, principalement parce qu'aucun courtier ne se permettra de rester dans un tel mode pendant une longue période, et le ratio des gains continus devrait être comme vous l'avez"67 d'entre eux 10", personnellement je n'ai jamais atteint de tels résultats. Si vous ne savez pas quoi en faire, vous en tirerez un profit et vous saurez quoi en faire. Toutes les transactions ont été réalisées lorsque le système prévoyait une précision supérieure à 95 %.

Je voudrais dire tout de suite que votre MO peut prédire une probabilité de 100% d'entrer sur le marché, mais ce qui va réellement se passer et comment cela va se passer, je pense que ce n'est pas la tâche du MO, mais de l'IA qui prendra en compte les facteurs de l'environnement verbal en plus des statistiques mathématiques.



 
mytarmailS:

Oui, vas-y, je dis juste que ça ne va pas être possible de le voir tout de suite.

Ok. Il y a deux fichiers dans l'archive - un échantillon pour la formation et un échantillon pour tester le modèle formé, pour les deux nous avons besoin de prédicteurs.

Une telle particularité est que chaque nouvelle ligne est une nouvelle barre - les lectures sont prises au moment de l'ouverture de la barre, les lectures elles-mêmes sont pour la barre précédente, donc si le prédicteur utilise les données d'ouverture de la barre zéro, alors prenez cette lecture de la barre suivante.

Dossiers :
CB_ZZ_M1.zip  2957 kb
 
Aleksey Vyazmikin:

OK. Il y a deux fichiers dans l'archive - un échantillon pour la formation et un échantillon pour tester le modèle formé, pour les deux nous avons besoin de prédicteurs.

Une telle particularité est que chaque nouvelle ligne est une nouvelle barre - les lectures sont prises au moment de l'ouverture de la barre, les lectures elles-mêmes sont pour la barre précédente, donc si le prédicteur utilise les données d'ouverture de la barre zéro, alors prenez cet indicateur de la barre suivante.

Vous auriez pu joindre la cible aussi, sinon comment pouvez-vous la comparer ?

Et pourquoi avez-vous enlevé la date ?

400 000 mille rangs dans le train ? êtes-vous sérieux ? avez-vous entraîné le modèle pour 400 000 mille rangs ?



UPD=====

Désolé, mais mon vieil ordinateur portable m'emmerde... quand j'essaie simplement de manipuler des données, si je ne fais que 100 attributs, il s'avère que c'est une matrice de 100*400 000 et en gardant une telle matrice en RAM je dois entraîner le modèle en même temps, l'ordinateur portable meurt juste en essayant...


je ne peux pas l'utiliser comme un ensemble de données de 50 000 ou plus, je n'ai pas besoin d'une minute pour créer ces grands ensembles de données, 5 minutes ou même une heure suffisent. ne déformez pas les données, utilisez le format date-heure OHLCV et ajoutez une cible sur laquelle vous avez entraîné votre modèle afin de pouvoir comparer les erreurs ultérieurement.

 
mytarmailS:

Ils auraient pu attacher leur cible aussi, sinon comment pourraient-ils se comparer ?

Et pourquoi avez-vous supprimé la date ?

400 000 000 de lignes dans le train ? Êtes-vous sérieux ? Avez-vous entraîné le modèle pour 400 000 lignes ?

Je n'ai pas supprimé la date, je ne l'ai simplement pas enregistrée pour gagner de la place dans le fichier.

Oui, je me suis entraîné sur des minutes pendant 2 ans.


mytarmailS:


UPD=====

Désolé, mais mon vieil ordinateur portable me gâte ... quand j'essaie simplement de manipuler les données, si je ne fais que 100 attributs, il s'avère que la matrice 100 * 400 000 et garder une telle matrice dans la mémoire devrait également former un modèle en même temps, l'ordinateur portable meurt juste en essayant ...

Ne pouvez-vous pas enregistrer les prédicteurs séquentiellement au début dans un fichier, puis les charger simplement pour la formation ?

J'ai un échantillon de moins d'un gigaoctet pour l'entraînement - CatBoost s'en sort facilement, mais je ne me risquerais pas à construire un arbre génétique en R maintenant...

mytarmailS:

votre premier essai consiste à construire un ensemble de données de 50 000 ou plus, ne prenez pas une minute, 5 minutes ou même une heure suffiront. ne déformez pas les données, donnez-les dans le même format qu'elles devraient être date heure OHLCV , ajoutez votre cible, sur laquelle vous avez entraîné votre modèle afin de pouvoir comparer les erreurs plus tard.

50 000 est un nombre trop faible d'observations pour des observations solides de ce type, il ne s'agira que d'environ 300 segments ZZ. J'ai les principaux prédicteurs aiguisés sur les minutes, il y a des prédicteurs du TF supérieur, mais ils ne sont peut-être pas suffisants.

Vous utilisez le volume ou c'est juste pratique avec le volume ?

Vous n'avez pas besoin des paramètres ZZ pour ajuster les prédicteurs ?

Je ne comprends pas la distorsion des données - devez-vous décaler les données pour connaître toutes les données de la barre zéro ? Si oui, n'avez-vous pas un coup d'œil à la barre de zéro ?