L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1908

 
Rorschach:

Mes résultats sont détaillés ici. Pour la validation, je multiplie les lignes originales par -1.

Les gars, allez, puisque le sujet a commencé, ayez un peu de respect les uns pour les autres. Ici vous m'avez envoyé un fichier avec des entrées et un autre avec une cible, je vous demande pardon, comment il faut le coller aux données directement ou en arrière ? Et prendre pour faire remonter la première ligne pour signer les données d'entrée, la dernière colonne la cible, la première peut être le numéro de ligne ou non. J'ai passé plus de temps à mettre le fichier dans la bonne forme.

Honnêtement, c'est la première fois que je vois un tel résultat. VTRIT a 0 entrée utile, je pense que cela a à voir avec la macro elle-même car votre cible n'est pas mélangée. Mais le fait est qu'il n'y a pas de données utiles pour la cible.

Je l'ai lancé dans l'optimiseur depuis le bas. Il était capable de passer de 4 à 8 entrées, mais la qualité de la courbe d'apprentissage était médiocre.

C'est le maximum auquel il a pu aller et obtenir le modèle à cette qualité n'est pas possible. Si le modèle commence avec plus de 85% de généralisabilité, vous avez comme vous le voyez 63.51 et je ne pense pas que cela ira plus loin. Essayez d'assembler le fichier comme je l'ai mentionné ci-dessus, mais assurez-vous de mélanger les lignes pour que la fonction cible alterne, peut-être que VTRIT sera capable de le gérer.

 
Mihail Marchukajtes:

Les gars, allez, puisque c'est le sujet, ayez un peu de respect les uns pour les autres. Ici vous m'avez envoyé un fichier avec les entrées et un autre avec la cible, excusez-moi, comment dois-je le coller aux données directement ou à l'envers ? Et prendre pour faire remonter la première ligne pour signer les données d'entrée, la dernière colonne la cible, la première peut être le numéro de ligne ou non. J'ai passé plus de temps à mettre le fichier dans la bonne forme.

Honnêtement, c'est la première fois que je vois un tel résultat. VTRIT a 0 entrée utile, je pense que cela a à voir avec la macro elle-même car votre cible n'est pas mélangée. Mais le fait est qu'il n'y a pas de données utiles pour la cible.

Je l'ai lancé dans l'optimiseur depuis le bas. Il était capable de passer de 4 à 8 entrées, mais la qualité de la courbe d'apprentissage était médiocre.

C'est le maximum auquel il a pu aller et obtenir le modèle à cette qualité n'est pas possible. Si le modèle commence avec plus de 85% de généralisabilité, vous avez comme vous le voyez 63,51 et je ne pense pas que cela ira plus loin. Essayez d'assembler le fichier comme je l'ai indiqué ci-dessus, mais veillez à mélanger les lignes pour que la fonction cible alterne, peut-être que VTRIT sera capable de le gérer.

Ok, je vais savoir.

En général, toutes les entrées devraient être utiles, mais si je réduis le nombre d'entrées à 80, le résultat est bien pire. Il s'agit d'un système réel, qui utilise probablement des ondulations, des zigzags, je ne sais pas quelle est leur période. Le réseau le récupère tout seul. Si vous avez google drive je peux télécharger ma variante pour jouer avec.

Y a-t-il un intérêt ? Pour mélanger les exemples, il faudra bricoler.

 
Rorschach:

OK, je vais garder ça en tête.

En général, toutes les entrées devraient être utiles. Je constate que lorsque je réduis le nombre d'entrées à 80, le résultat est bien pire. C'est un vrai système, peut-être utilise-t-il des ondulations, des zigzags, je ne sais pas ce que leur période n'est pas non plus connue. Le réseau le récupère tout seul. Si vous avez google drive je peux télécharger ma variante pour jouer avec.

Y a-t-il un intérêt ? Pour mélanger les exemples, il faudra bricoler.

Eh bien, tout d'abord, il y a beaucoup de décalages qui peuvent être vus à l'œil nu. Préparez le fichier, je vais l'exécuter. ....
 
Aleksey Nikolayev:

Il semble que ce soit les mêmes forexprostools que les vôtres, pris dans le widget investingcom.

Oui, c'est faux) Apparemment, ce sont tous des problèmes d'analyse syntaxique ou de données lues.

Il est peu probable que la normalisation soit pratique. La bonne chose est que nous avons besoin de données d'archives de nouvelles dans le terminal, la possibilité régulière de les télécharger et un service pour travailler avec eux. Je ne pense pas qu'il n'y ait pas d'archives) Mais à en juger par l'opinion des créateurs, il ne commencera pas à fonctionner tant que les utilisateurs ne diront pas qu'ils le veulent, et même s'il commence à fonctionner, ce sera d'abord dans la version payante).

 
Mihail Marchukajtes:
Tout d'abord, il y a beaucoup de décalages, vous pouvez le voir à l'œil nu. Préparez le fichier, je vais l'exécuter. ....

les grilles n'ont pas de mémoire, il faut donc alimenter les lags

Dossiers :
data.csv  262 kb
 
Rorschach:

les grilles n'ont pas de mémoire, il faut donc alimenter le décalage

Selon le VTRIT, aucune des entrées n'est pertinente pour la cible, hélas. La question est close.
 
Mihail Marchukajtes:
Selon le VTRIT, aucune des entrées n'est pertinente pour la cible hélas. La question est close.

Il peut utiliser toutes les entrées, moins de 100 entrées est inacceptable.

Avec 50 entrées, la meilleure erreur est de 0.5


 
Rorschach:

Et il peut utiliser toutes les entrées, il n'y a pas moyen d'avoir moins de 100 entrées.

Avec 50 entrées, le meilleur résultat est de 50%.


D'après ce que j'ai compris, pendant son fonctionnement, il examine chaque barre individuellement pour la formation de niveaux par rapport à l'objectif, un coefficient est attribué à chaque barre. En substance, il compare les barres les unes par rapport aux autres par rapport à la cible ; dans votre cas, aucune des barres n'a pu franchir le seuil au-dessus de l'unité ; toutes les barres étaient fausses. Je suis en train d'écrire un article sur le prétraitement de celui-ci et il y a beaucoup de choses intéressantes dedans. L'une des règles stipule qu'une colonne doit être en corrélation avec la cible et NON en corrélation avec d'autres colonnes et dans votre cas, elles semblent avoir une corrélation très élevée entre elles, devenant ainsi prsoto inutile. Attends que je vérifie autre chose....
 
Mihail Marchukajtes:
D'après ce que je comprends, lors de son fonctionnement, il examine chaque barre individuellement pour la formation de niveaux par rapport à l'objectif, un coefficient est attribué à chaque barre. En substance, il compare les barres les unes par rapport aux autres par rapport à la cible ; dans votre cas, aucune des barres n'a pu franchir le seuil au-dessus de l'unité ; toutes les barres affichent faux. Je suis en train d'écrire un article sur le prétraitement de celui-ci et il y a beaucoup de choses intéressantes dedans. L'une des règles stipule qu'une colonne doit être en corrélation avec la cible et NON en corrélation avec d'autres colonnes et dans votre cas, elles semblent avoir une corrélation très élevée entre elles, devenant ainsi prsoto inutile. Attends que je vérifie autre chose....

Ce n'est pas exactement la norme. En général, on prend une sorte d'oscillateur et on l'envoie dans le réseau. Ces indicateurs utilisent un certain nombre de barres passées pour le calcul en fonction de leurs périodes. Dans mon cas, le réseau lit d'abord ces indicateurs et les utilise ensuite pour donner la réponse, il a donc besoin de connaître les valeurs de prix passées.

 
Rorschach:

Ce n'est pas tout à fait la norme ici. En général, ils prennent une sorte d'oscillateur et l'injectent dans le réseau. Ces indicateurs utilisent un certain nombre de barres passées pour le calcul, en fonction de leurs périodes. Dans mon cas, le réseau lit d'abord ces indicateurs et les utilise ensuite pour me donner une réponse, il a donc besoin de connaître les valeurs de prix passées.

J'ai un fichier désordonné de 7700 barres où je prends 24 ligues, alors ne continuez pas, mais regardez plutôt ici. Voici votre fichier

Et voici le mien.

Quelle est la différence ? ? ??? Je ne vais pas vous tenir en haleine. Dans l'analyse en composantes principales, lorsque chaque colonne a son propre système de coordonnées, il est important qu'elles puissent être regroupées afin que les points de différentes colonnes puissent être reportés sur le même système de coordonnées. L'interprétation est simple. Plus il y a de vecteurs verticaux et horizontaux, plus c'est cool. Dans votre cas, il s'agit d'une tache uniforme.