L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1248

 

Je pense que si le surentraînement est une conséquence de la mémorisation du marché en raison du bruit, alors la mémorisation du marché nécessite une certaine quantité de mémoire sous la forme d'une forêt d'arbres de décision et de boosting, et les modèles comme l'arbre unique et le réseau neuronal avec un petit nombre de neurones devraient être moins surentraînés. Il s'avère alors qu'il existe une quantité critique de données qui ne peut être décrite par, disons, une feuille - quelle est cette quantité de 1% ou 10% - de l'ensemble de l'échantillon (formation, test, contrôle) est la question. Alors peut-être devrions-nous évaluer les données en termes de quantité de mémoire nécessaire pour se souvenir de ces données et essayer de rendre le modèle un ordre de grandeur plus petit de ce volume critique ? Comment le faire - je ne sais pas, peut-être qu'il devrait y avoir quelque chose de similaire avec l'archivage - si l'archiveur compresse un échantillon de 10mb en 1mb, le modèle ne doit pas être plus de 102.4 kb. Ensuite, sachant que le modèle n'a pas simplement mémorisé l'échantillon, mais qu'il y a trouvé des régularités, nous pouvons être moins critiques à l'égard du test sur un échantillon indépendant et conclure non pas à un surentraînement, mais à un manque de données sur l'échantillon pour l'entraînement, car il n'y avait pas de situations décrivant l'état actuel du marché, et donc il n'y avait tout simplement aucune possibilité de trouver un tel modèle en utilisant les prédicteurs disponibles.

 
Maintenant, je fais un modèle manuel basé sur les feuilles reçues, et il s'avère qu'environ 20 feuilles à acheter et 5 feuilles comme filtre peuvent générer chaque année de 2014 à 2018, et là je me dis, ça ne peut pas être du surentraînement et il n'y a pas assez de feuilles pour l'adaptation en quelque sorte.... s'agit-il donc d'un modèle qui perdra sa validité en 2019 ?
 
Maxim Dmitrievsky:

un modèle doit avoir des conditions préalables fondamentales, par exemple, certains cycles du marché sont fondamentaux, ou la réaction aux nouvelles, la volatilité intrajournalière... des choses comme ça.

Et si les régularités ne sont pas claires d'où elles viennent, alors on ne sait pas ce qui va se passer ensuite.

Les modèles sur les arbres et traitent de la question de l'identification des modèles, un prédicteur parle d'un événement et un ensemble de certains événements donne un modèle. Il s'agit simplement d'une régularité qui ne relève pas du domaine des phénomènes physiques et qui ne peut être constante car elle peut être affectée par des facteurs inconnus (phénomènes non décrits par les prédicteurs disponibles).

En général, le point est que les événements statistiquement récurrents sont détectés par les méthodes de classification MO, et c'est un peu mieux que de simplement adapter le marché avec des indicateurs optimisateurs, ou pas ?
 
Maxim Dmitrievsky:

La corrélation entre le nombre de jupes courtes en été et le bien-être financier des citoyens peut être de 90 %, mais cela ne signifie pas qu'il s'agit d'une corrélation, et encore moins d'un modèle...

OK, remplaçons le mot "modèle" par "présage" comme une corrélation inconnue à l'événement.

Maxim Dmitrievsky:

L'optimiseur est également un MO.

Vous mettez donc les deux méthodes sur un pied d'égalité ?

 
Maxim Dmitrievsky:

ce n'est pas moi, c'est comme ça... l'optimiseur minimise n'importe quelle fonction f, l'optimiseur du réseau neuronal optimise la fonction f des poids.

Si nous ne parlons que de l'optimisation des filtres TC, alors nous pouvons être en partie d'accord sur les mêmes actions, mais si le point d'entrée/sortie est également optimisé, alors la situation est légèrement différente du mode opératoire habituel.

 
Maxim Dmitrievsky:

À cet égard, il est nécessaire d'étudier le data-mining et son application aux marchés, si tant est que cela soit possible, car la courbe 1 du data-mining est aussi une sorte de sommet des plus stupides, mais certaines informations peuvent être extraites ;).

Étudier en vue de postuler dans un autre domaine ?

 
Maxim Dmitrievsky:

de comprendre comment extraire quelque chose d'utile des données

J'ai donc noté plus tôt que j'ai extrait quelque chose d'utile - peut-être est-ce un grain d'or, peut-être est-ce un coup de chance... qui sait... et il n'y a aucun moyen d'en être sûr.

 
Si l'on part du principe que les marchés sont tous identiques et que le comportement des prix présente des caractéristiques similaires, pourquoi ne pas combiner une douzaine d'instruments dans un seul échantillon et rechercher des "signes" communs à tous les marchés ?
 
Vizard_:

C'est comme ça que ça se passe - c'est généralisé. Les "Patterns" sont des modèles trouvés à partir de différents échantillons... Donc vous venez de faire correspondre un échantillon de tendance, et maintenant vous nous donnez un mal de tête))))). Mais vous devez tout de même préparer les données avec soin, car l'idée... Bien que vous soyez peut-être infaillible, mais il est peu probable...

J'avais une formation pour 2016-2017, puis j'ai juste vérifié les feuilles pour 2014-2018 et j'ai sélectionné celles qui étaient rentables chaque année et qui répondaient à un certain nombre d'autres critères (croissance globale/pas de drawdown majeur). Je me demande donc si un tel modèle peut être utilisé.

Quant à la combinaison de différents instruments, le prédicteur est souvent le gain en pips sur différents intervalles de temps, et cela ne fonctionnera pas avec différents instruments...

 
Maxim Dmitrievsky:

Tous les marchés sont différents, bien sûr, tout comme les modèles, et ce qui fonctionne pour l'un est une perte pour l'autre.

Pour supposer quelque chose, vous devez supposer quelque chose comme base pour une telle supposition approximative.

Je suppose donc que le sujet est le même partout - un trader, alors pourquoi changerait-il son comportement en fonction de l'instrument ? S'il utilise l'analyse technique ou toute autre méthode, mais qu'il utilise cette méthode partout, il est différent qu'il puisse utiliser un ensemble de méthodes à différents moments et il est plus facile d'adapter une méthode sur un instrument et lorsque le trader (image collective) passe à un autre, le modèle se casse.