L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 33

 
mytarmailS:

sur ce "merveilleux" forum, je ne peux ni insérer une image ni joindre un fichier. Quelqu'un sait-il quel est le problème ?

J'ai joint une photo aujourd'hui. Voir le post de la page précédente. Pour ce faire, pendant la composition d'un message, vous devez appuyer sur la combinaison de touches Ctrl+Alt+I.
 
Yury Reshetov:

Malheureusement, mon archive RAR ne se décompose pas. A mon avis, il est préférable de tout emballer dans le ZIP. Il existe des décompresseurs pour les formats ZIP sur toutes les plateformes. En outre, de nombreux utilisateurs n'utilisent pas RAR.



Je vais y jeter un coup d'œil. Mais je ne connais pas assez bien R.

Avez-vous extrait vos fichiers manuellement ou en utilisant un outil automatique ?

J'ai besoin d'une nouvelle version de winrar, depuis la cinquième version le format des fichiers a changé. Je n'ai pas pu le faire zipper tout de suite, il est trop gros. Voici à nouveau les mêmes fichiers, mais compressés avec une ancienne version de winrar.

J'ai fait le portage manuellement, en prenant les fichiers de https://sourceforge.net/projects/libvmr/ et en les copiant avec les corrections. La syntaxe est en grande partie similaire, le principal problème est qu'en R les indices des tableaux commencent par 1 et non par 0. J'ai délibérément laissé de côté la classe Separator ; R possède déjà des fonctions intégrées (sample) pour diviser les fichiers en échantillons de formation et de test.

Dossiers :
 

Merci Yuri !

Ainsi, au cours de la recherche, il s'est avéré que les cibles les plus inappropriées qui prédisent la direction du prix comme la prédiction de la prochaine bougie ou zigzag dans l'application classique, de telles cibles ne sont pas sans ambiguïté et souvent confondre le réseau ou un autre algorithme, parce que pas toujours avec la croissance de zigzag prix augmente et si le réseau est formé sur ces données, il sera très difficile de reconnaître quelque chose dans les nouvelles données. La conclusion est donc la suivante : la cible doit être décrite de manière aussi claire et cohérente que possible...

Ce que j'entends par incohérence, je l'ai écrit plusieurs pages auparavant) comme les indicateurs et les divers "lisseurs" où fondamentalement on peut mettre le "PCA" (Principal Component Analysis), tout doit être très précis, clair et sans ambiguïté et informatif au lieu d'être mou, lisse et flou.

en bref, le modèle

La cible - le fait même de l'inversion du zigzag (pas la direction)

Prédicteurs - chandeliers, niveaux - environ 110 unités au total (pas de données contradictoires)

Données de 5 minutes

J'ai formé deux modèles sur RF, séparément pour l'achat et séparément pour la vente, bien que je puisse utiliser un seul modèle.

travailler avec de nouvelles données

modèle sur les nouvelles données

je tiens à préciser qu'il s'agit de l'une des meilleures photos, en fait, elle est bien pire, mais c'est la meilleure que j'ai réalisée jusqu'à présent.....

Je tiens également à noter que si vous ajoutez des indicateurs ou réduisez la dimensionnalité des signes en utilisant la même ACP, la précision des entrées n'est pas seulement faible, mais elle disparaît totalement, c'est-à-dire que tout semble flotter et c'est ce que j'appelle l'incohérence des signes.


p.s.

Je pense avoir maîtrisé l'approche classique de la négociation en réseau, mais je ne suis pas satisfait des résultats. J'espère que ces règles pourront aider quelqu'un. Mais même ces règles ne conduiront pas à un résultat acceptable, nous devons changer le concept même de recherche de prédicteurs, nous devons regarder beaucoup plus profondément, j'ai un tel concept mais malheureusement seulement au niveau du concept, s'il y a des gens qui sont intéressés par ce concept et qui ont de bonnes compétences en programmation, je serai heureux de communiquer mais pas dans le mode de communication mais dans le mode de mise en œuvre, car mes compétences en programmation sont au niveau initial pour le moment....

 
Yury Reshetov:

J'y jetterai un coup d'œil, c'est sûr. Je ne connais pas assez bien R, cependant.

L'avez-vous porté manuellement ou par le biais d'un portage automatique ?

Prenez le hochet - très utile pour un débutant. Vous pouvez l'apprendre en une heure - GUI.

Immédiatement, tout le cycle de modélisation : exploration des données, ajustement des modèles (6 types de modèles, dont un similaire au vôtre - SVM), évaluation. En outre, le journal de bord dans R donne la possibilité à un débutant de voir le code prêt. Il pourra être utilisé à l'avenir. Accepte les fichiers Excel. Donc, il est possible de cuisiner dans excel, il est possible de sortir de μl dans excel.... En général, il n'y a aucun problème avec les données sources.


Il est également utile aux utilisateurs expérimentés : pour estimer quelque chose, pour essayer.

Vous devriez écrire en R si vous avez réussi à capter des prédicteurs. Ensuite, changez les modes des modèles utilisés dans le hochet et prenez d'autres modèles... et utiliser généralement le signe d'insertion au moins. Mais d'abord les prédicteurs qui ont une capacité prédictive pour une variable cible particulière.

PS.

Le post ci-dessus recommande d'utiliser l'échantillon.

Je ne le recommande pas.

Le hochet lui-même divise le fichier de manière assez complexe, mais si nous voulons créer des ensembles pour l'entraînement, le test, la validation - cela sera fait par le hochet lui-même et l'échantillon n'est pas nécessaire - et aussi pour la vérification en dehors de ces ensembles, ce qui est très important pour modéliser les futures transactions, alors le fichier initial doit être divisé mécaniquement par index, la première partie est mise dans le hochet et la seconde est utilisée pour comparer les résultats avec le hochet. Cela peut être fait dans le même râtelier. Si les quatre erreurs correspondent, et avec une erreur inférieure à 20%, c'est un graal pour les années à venir.

PPSS.

Exemple d'utilisation du hochet dans mon article, il y a aussi un fichier joint, vous pouvez l'utiliser directement, ou comme échantillon.

 
mytarmailS:

cible - le fait même que le zigzag se soit inversé (pas la direction)

Nous prenons toujours le zigzag pour obtenir les valeurs du professeur. L'effet de levier vers le haut est de 1, l'effet de levier vers le bas est de 0.

Dans votre terminologie : s'agit-il ou non du "fait même de l'inversion" ? Si non, que voulez-vous dire ?

 
SanSanych Fomenko:


rattle divise le fichier lui-même de manière assez complexe, mais si vous voulez créer des ensembles pour la formation, le test et la validation, rattle le fera,

Si je me souviens bien, il s'agit d'une fonctioncomplexe appelée "échantillon" ;)
 
SanSanych Fomenko:

Pour obtenir les valeurs du professeur, vous prenez toujours un zigzag. Le levier haut est à 1, le levier bas à 0.

Dans votre terminologie : s'agit-il du "fait de l'inversion elle-même" ou non ? Si non, que voulez-vous dire ?

Je suis désolé, j'ai dû mal comprendre... Je veux dire que le chandelier cible est celui qui a reçu le renversement.
 
mytarmailS:
Je suis désolé, j'ai dû mal comprendre... Ce que je veux dire, c'est que la bougie cible est seulement celle avec le renversement, tout le reste est une classe différente, la classe "non-turn".
Très intéressant, j'ai essayé mais je l'ai rejeté pour une raison quelconque... Je ne me souviens pas.
 
mytarmailS:
Si je me souviens bien, celas 'appelle la fonction "échantillon" ;)
Exactement, c'est juste le hochet lui-même qui le fait et vous pouvez ne pas en être conscient du tout. Voici la deuxième partie qui est cruciale pour évaluer le surentraînement et qui ne doit PAS être dérivée de l'échantillon.
 
SanSanych Fomenko:
Très intéressant, je l'ai essayé, mais pour une raison quelconque, je l'ai jeté... Je ne me souviens pas.

Quels sont les prédicteurs que vous avez utilisés ?

Je comprends que les prédicteurs et la cible sont une seule et même chose, tout doit être interconnecté, c'est stupide de vouloir attraper des rebonds précis en alimentant une moyenne mobile de 200 comme prédicteurs. C'est comme deux univers différents qui ne se croisent pas.