L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 388

 
Maxim Dmitrievsky:


J'ai déjà des prédicteurs, aussi étrange que cela puisse paraître. J'ai un robot prêt à l'emploi, que j'ai construit en moins d'un mois. La chose la plus importante est les prédicteurs, c'est hors de question, oui. Eh bien, c'est qui a l'expérience de quoi... Par exemple, avec mon imagination enflammée, les prédicteurs peuvent être ramassés en un rien de temps, je travaille comme analyste depuis 5 ans :) À mon avis, la sélection des prédicteurs n'est pas une tâche aussi difficile que l'étude des architectures NS, l'essentiel est de s'asseoir et de sélectionner, ce qui prend 2-3 semaines :)



Et en nombre ?

Sur l'échantillon de formation, l'échantillon de test et l'échantillon de validation.

Le plus important : sur un nouveau fichier qui était à l'origine séparé des trois précédents.

Ces quatre valeurs ne doivent pas être trop différentes les unes des autres. S'ils diffèrent de plus de 10% d'erreur (30% d'écart et 35% d'écart, par exemple), il faut les abandonner.


Et ce que j'ai sur le compte réel n'a aucune importance - les signaux meurent après un an ou même après deux ans.

 
SanSanych Fomenko:

Qu'en est-il du fait que les incréments n'indiquent en aucune façon les tendances ?

Oui, ils le font.

Le modèle prédit soit l'augmentation, soit la direction - c'est à cela que servent les modèles de classification.

Je n'ai pas connaissance de modèles de classification qui reconnaissent les mouvements dans les journaux télévisés. Et pour GARCH, c'est l'objectif du modèle : déterminer le mouvement survenu. Queues de pie - il s'agit du mouvement sur les nouvelles lorsque les tendances se brisent et que de brusques revirements se produisent.


Vous pouvez observer l'augmentation sur différentes périodes.

Il existe des modèles GARCH intéressants pour plusieurs horizons temporels. La signification est la suivante.

Supposons que nous prédisions l'incrément sur H1. Le modèle nécessite des données d'entrée caractérisant la distribution. Pour ces données d'entrée (généralement la volatilité), nous ne prenons pas l'heure précédente, mais les minutes de l'heure en cours.

À mon avis, il est important de diviser l'ensemble de l'historique en intervalles ayant le même comportement. Par exemple, voici une image du cours de clôture de l'EURUSD sur 5 ans, vous pouvez voir qu'il y a eu une tendance jusqu'au 2Q14 environ, puis une autre pendant le reste de l'année 14 et le début de l'année 15, et enfin une troisième qui a commencé et se poursuit encore. Essayer d'obtenir la température moyenne dans l'hôpital et l'utiliser pour diagnostiquer l'état d'un seul patient est une erreur, selon moi.


Si nous prenons, par exemple, la tendance actuelle quelque part entre le début du 15ème siècle et aujourd'hui, et si nous isolons/extrapolons au moins les tendances, la périodicité, nous obtenons un résultat tout à fait crédible, je pense. Voici l'image, en vert, la prévision du prix de clôture pour les deux prochaines semaines.


 
SanSanych Fomenko:


Et en nombre ?

Sur l'échantillon de formation, l'échantillon de test et l'échantillon de validation.

Le plus important : sur un nouveau fichier qui était à l'origine séparé des trois précédents.

Ces quatre valeurs ne doivent pas être trop différentes les unes des autres. S'ils diffèrent de plus de 10% d'erreur (30% d'écart et 35% d'écart, par exemple), passez votre chemin.


S'ils diffèrent de plus de 10 % (écart de 30 % et 25 %, par exemple, alors qu'ils aillent se faire voir.) Ce qui vaut l'argent réel - n'est rien, les signaux meurent après un an ou même deux ans.


Je n'ai pas besoin d'autant d'échantillons inutiles, il y a suffisamment de formation et de tests, je choisis les paramètres via l'AG, puis je choisis les résultats qui sont les plus similaires à l'arrière et à l'avant. Vous ne formerez jamais un modèle pour l'ensemble de l'historique des cotations, de plus vous proposez 3 périodes indépendantes, et trader sur la 4ème est un non-sens en cas de trading sur le marché, car le marché change pendant cette période. Donc, il suffit de s'assurer que le modèle n'est pas surajusté, sur la section en dehors de l'échantillon de formation, et c'est tout.

Je me ré-entraîne chaque semaine, jusqu'à présent la deuxième semaine est à +35%. Ce dont il s'agit, c'est de l'argent réel ;)

 
SanSanych Fomenko:

Et ce qui vaut l'argent réel n'est rien, il y a des signaux qui meurent dans un an ou même deux ...

Voulez-vous sérieusement créer un modèle de marché pour les années à venir... ?
 
Maxim Dmitrievsky:


J'ai déjà les prédicteurs, bizarrement. Il existe déjà un bot prêt à l'emploi, qui se tient sur le réel, écrit en moins d'un mois. Le plus important, ce sont les prédicteurs, ce qui est hors de question, oui. Par exemple, avec mon imagination enflammée, les prédicteurs peuvent être repérés sur place, je travaille comme analyste depuis 5 ans :) À mon avis, la sélection des prédicteurs n'est pas une tâche aussi difficile que l'étude des architectures NS, l'essentiel est de s'asseoir et de sélectionner, ce qui prend 2-3 semaines :)

S'il vous plaît, quels prédicteurs utilisez-vous ?
 
Maxim Dmitrievsky:


Dans les nombres allenorm, il n'y a pas besoin de tant d'échantillons inutiles, la formation et le test cela suffit, par GA je choisis les paramètres, puis je choisis les résultats qui sont aussi similaires que possible à l'arrière et à l'avant. Vous ne formerez jamais un modèle pour l'ensemble de l'historique des cotations, de plus vous proposez 3 périodes indépendantes, et trader sur la 4ème n'a aucun sens lorsque vous traitez sur le marché, car le marché change pendant cette période. Donc, il suffit de s'assurer que le modèle n'est pas surajusté, sur une section en dehors de l'échantillon de formation, et c'est tout.

Je me ré-entraîne chaque semaine, jusqu'à présent la deuxième semaine est à +35%. Je sais de quoi il s'agit, c'est de l'argent réel).

C'est vous qui connaissez le mieux les échantillons.
 
pantural:
Veuillez me dire quels prédicteurs vous utilisez ?
J'ai déjà décrit ici la valeur de la pente de la ligne de régression et même un exemple de robot, les autres sont un secret :)
 
Ivan Negreshniy:
Voulez-vous sérieusement créer un modèle de marché pour les années à venir... ?

Non, bien sûr que non.

Je suis occupé à obtenir des garanties pour un futur quelconque.

 
Maxim Dmitrievsky:


Dans les nombres allenorm, il n'y a pas besoin de tant d'échantillons inutiles, la formation et le test cela suffit, par GA je sélectionne les paramètres, puis je choisis les résultats qui sont aussi similaires que possible à l'arrière et à l'avant. Vous ne formerez jamais un modèle pour l'ensemble de l'historique des cotations, de plus vous proposez 3 périodes indépendantes, et trader sur la 4ème n'a aucun sens lorsque vous traitez sur le marché, car le marché change pendant cette période. Donc, il suffit de s'assurer que le modèle n'est pas surajusté, sur la section en dehors de l'échantillon de formation, et c'est tout.

Je me ré-entraîne chaque semaine, jusqu'à présent la deuxième semaine est à +35%. Qu'est-ce qu'il y a sur le réel, c'est de l'argent réel).

J'ai aussi deux parcelles.

La première parcelle : trois échantillons sont pris au hasard dans celle-ci et appris-contrôlés-contrôlés. La dernière section, qui suit la première, est un parcours séquentiel, de préférence avec un testeur.

Complètement oublié, bien que j'aie déjà écrit de nombreuses fois auparavant.

L'étape décrite ci-dessus est la deuxième étape.

La première étape consiste à sélectionner des prédicteurs "pertinents" pour la variable cible. Je peux prouver que de très bons résultats sont obtenus par ces ensembles de prédicteurs dans lesquels prédicteurs qui n'ont rien à voir avec la variable cible - le bruit - prédominent. Les résultats de la formation sont très bons sur le bruit. Et j'ai réussi à obtenir une erreur de moins de 10% sur les trois parties mentionnées ci-dessus, jusqu'à 3% ! Et puis j'ai eu une erreur complètement aléatoire sur la deuxième partie.

Si vous commencez à éliminer les prédicteurs de bruit, l'erreur augmente pendant la formation, mais diminue dans la deuxième section. Si vous vous débarrassez des prédicteurs de bruit, vous obtenez à peu près la même valeur d'erreur. Sur mon ensemble de prédicteurs, c'est un peu moins de 30%.

 
Il n'est pas nécessaire de former des machines, il faut d'abord avoir des nerfs d'acier et des relations dans les hautes sphères du pouvoir pour faire du commerce de manière rentable.