L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 496

 
Dr. Trader:

La forêt peut-elle extrapoler ? Oui.
Le fait-il bien ? Non.


Qu'est-ce qui est bon et qu'est-ce qui est mauvais ?

Disposez-vous d'une analyse comparative des différents modèles ? Et depuis le début : avec l'adéquation de prédicteurs particuliers pour une cible particulière, avec l'adéquation d'un ensemble particulier de prédicteurs pour un modèle particulier, et ensuite l'évaluation avec une exécution obligatoire sur un fichier en dehors des fichiers d'entraînement ? En justifiant que les modèles ne sont pas surentraînés.


Avec tout cela en place, il sera possible de juger ce qui est bon et ce qui est mauvais pour un ensemble particulier de prédicteurs et de cibles. Dans le même temps, il faut comprendre qu'il existe probablement un ensemble différent de prédicteurs et de cibles qui donneront un résultat différent.


Pour mon cas particulier, j'ai fait ce travail. J'ai publié le résultat à plusieurs reprises sur ce fil. Ordre des modèles, en ordre décroissant : ada, rf, SVM. Le pire est NS, mais il s'agit d'une ancienne version, je n'ai pas utilisé les versions modernes. Tout ceci est soumis aux conditions ci-dessus.

 
Dr. Trader:

Voici un exemple intéressant, je l'ai posté dans ce fil il y a quelque temps.
Dans ce cas, l'extrapolation consisterait à prévoir en dehors du "nuage de points connus".

Si les points connus sont bien groupés, on peut voir que l'extrapolation ne pose pas de problème pour la plupart des modèles.
Mais si les points connus étaient disposés de manière plus aléatoire, sans grappes évidentes, alors la prédiction elle-même serait moins bonne et l'extrapolation ne serait pas crédible.

Tout est une question de prédicteurs, si vous mettez des déchets dans le modèle, vous ne pouvez pas vraiment extrapoler.
Et je ne ferais jamais de commerce sur des données financières en utilisant l'extrapolation.


L'extrapolation est une prédiction sur des points inconnus, si les points sont en dehors du maximum et du minimum de l'échantillon d'entraînement, alors RF produira toujours le maximum et le minimum de l'échantillon entraîné.

êtes-vous juste confus avec l'approximation mb ?

 
Dr. Trader:

Voici un exemple intéressant, je l'ai posté dans ce fil il y a quelque temps.
L'extrapolation consisterait à prévoir en dehors du "nuage de points connus".

Si les points connus sont bien groupés, on peut voir que l'extrapolation ne pose pas de problème pour la plupart des modèles.
Mais si les points connus étaient disposés de manière plus aléatoire, sans groupes évidents, alors la prédiction elle-même serait moins bonne et l'extrapolation ne serait pas crédible.

Tout est une question de prédicteurs, si vous mettez des déchets dans le modèle, vous ne pouvez pas vraiment extrapoler.
Et je ne ferais jamais de commerce sur des données financières en utilisant l'extrapolation.


La question de la confiance dans les statistiques en général est philosophique.

Voici la classification.

La notion même d'extrapolation s'y applique-t-elle ? Pas à mon avis. La classification trouve des modèles, puis tente de distribuer les nouvelles données en fonction de ces modèles.


Extrapolation dans les modèles analytiques qui ont une certaine fonction sous forme analytique.


ET ARIMA ? Y a-t-il une extrapolation ? Ça dépend de quoi. Le modèle lui-même prend les dernières mesures, généralement une seule. Mais la sélection des paramètres nécessite des milliers de barres. Ce millier est extrapolé et celui qui était dans le dernier calcul ne l'est pas.


Je ne pense pas que l'extrapolation dans son sens mathématique soit applicable aux marchés financiers.

 
SanSanych Fomenko:

La question de la confiance dans les statistiques en général est philosophique.

Voici la classification.

La notion même d'extrapolation s'y applique-t-elle ? Pas à mon avis. La classification trouve des modèles, puis tente de distribuer les nouvelles données en fonction de ces modèles.


Extrapolation dans les modèles analytiques qui ont une certaine fonction sous forme analytique.


ET ARIMA ? Y a-t-il une extrapolation ? Ça dépend de quoi. Le modèle lui-même prend les dernières mesures, généralement une seule. Mais la sélection des paramètres nécessite des milliers de barres. Ce millier est extrapolé et celui qui était dans le dernier calcul ne l'est pas.


Je ne pense pas que l'extrapolation dans son sens mathématique soit applicable aux marchés financiers.


L'extrapolation en MO est la capacité d'un modèle à fonctionner sur de nouvelles données, et c'est un type spécial d'approximation. Sur un échantillon d'entraînement, votre modèle APPROXIME, sur de nouvelles données ne faisant pas partie de l'échantillon d'entraînement, il EXTRAPOLISE.

c'est pourquoi j'ai donné un exemple avec la régression linéaire par rapport à XGboost, que vous n'avez pas lu attentivement, la régression linéaire extrapole parfaitement, alors que tout ce qui implique des arbres de décision NE PEUT PAS extrapoler en raison de la structure des arbres de décision

 

Larégression linéaire en général existe et en particulier n'extrapole QUE sur des séries stationnaires avec des résidus du modèle normalement distribués. Il existe un grand nombre de limitations à son application qui rendent ce type de modèle inutile pour les séries financières.

Si l'on s'intéresse à l'APPLICABILITÉ des modèles à ses données spécifiques, il s'agit alors de modélisation, dans tous les autres cas, c'est un jeu de chiffres.

Un grand nombre de messages sur ce fil de discussion sont des jeux de chiffres, car aucune preuve n'est donnée pour prouver le contraire.

 
SanSanych Fomenko:

Larégression linéaire en général existe et en particulier n'extrapole QUE sur des séries stationnaires avec des résidus du modèle normalement distribués. Il existe un grand nombre de limitations à son application qui rendent ce type de modèle inutile pour les séries financières.

Si l'on s'intéresse à l'APPLICABILITÉ des modèles à ses données spécifiques, il s'agit alors de modélisation, dans tous les autres cas, c'est un jeu de chiffres.

Un grand nombre de messages dans ce fil est un jeu de chiffres, car aucune preuve n'est donnée pour prouver le contraire.


Qu'est-ce que la régression linéaire a à voir avec ça ? La question était de savoir comment utiliser correctement l'échafaudage pour éviter de faire des erreurs stupides, comme penser qu'ils peuvent EXTRAPOLISER.

Vous alimentez la forêt sous la forme d'une série chronologique sous forme de cotations, et le modèle ne prédit que la valeur maximale et minimale de la série étudiée, si elle dépasse la plage

 
Aliosha:

Quel désordre, messieurs...

un peu d'information de KO :


Sur les marchés financiers, l'extrapolation/interpolation est applicable et très demandée.


Si c'est "applicable et demandé", alors pourquoi n'avez-vous pas fait une TS réussie pendant toutes ces années ?

P.S. J'entends un chat qui aboie... Bon, je pense qu'Aliocha a encore écrit quelque chose !

 
Aliosha:

Quel désordre, messieurs...

un peu d'information de KO :

L'extrapolation et l'interpolation dans le contexte du MO sont les mêmes ! Dans les deux cas, vous devez obtenirla valeur (int, float[]) d'un point qui n'est PAS le même que celui de l'ensemble de données d'apprentissage. Les réserves sur l'emplacement du point dans l'hyperespace, par rapport à un nuage de points de formation, est IMPOSSIBLE, car tout dépend des caractéristiques, la structure de l'espace des caractéristiques, dans une projection sera un point "en dehors" du nuage de formation, dans un autre "à l'intérieur" n'est pas important, il n'a de sens que ce qui n'est pas dans la formation, point.

En résumé, si le point ne se trouve pas dans l'ensemble de données d'apprentissage, le résultat de sa classification ou de sa régression sera à la fois une extrapolation et une interpolation, selon l'interprétation finale du résultat par le domaine concerné, mais pour l'algorithme MO, C'EST LA MÊME CHOSE.

Forest extrapole - génial ! Dans les bonnes mains, il est meilleur et plusieurs fois plus rapide que le NS.

Sur les marchés financiers, l'extrapolation/interpolation est applicable et très demandée.


Un conseil séparé à Maxim : une personne intelligente se trompe plus souvent qu'un imbécile, parce qu'elle fait beaucoup plus d'essais, mais seul l'imbécile est émotionnellement attaché à son point de vue et il lui est difficile de s'en séparer. Vous choisissez qui vous êtes)))


ok, donnez-moi un exemple d'au moins 1 article avec un exemple qui montre à quel point l'échafaudage extrapole bien. Je n'en ai pas trouvé.

ce qui, à mon avis, n'est pas génial.

et comment allez-vous savoir quand le point est à l'intérieur et quand il est à l'extérieur du nuage, quand vous avez beaucoup de caractéristiques différentes, et comment est-ce important quand la gamme de valeurs de la cible dans la formation, quand tous les arbres sont construits alors la cible ne peut JAMAIS sortir de cette plage


 
Maxim Dmitrievsky:

la régression linéaire est excellente pour l'extrapolation, alors que les arbres de décision NE PEUVENT PAS extrapoler

L'extrapolation consiste à prédire de nouvelles données au-delà des valeurs prédictives connues lors de la formation.

Voici un morceau d'une ancienne image, tout ce qui est en vert est de l'extrapolation, et l'image montre que la forêt peut le faire, sinon elle serait colorée en blanc (comme dans le cas de certains modèles SVM).


La forêt, le réseau neuronal et le modèle linéaire peuvent tous deux extrapoler. Si vous voulez prédire des valeurs très éloignées des valeurs connues, tous ces modèles donneront une prédiction et ils ont tous une sorte d'algorithme pour de tels cas.

Mais pourquoi pensez-vous que si un modèle linéaire extrapole en utilisant la formule y=ax+b, il le fera parfaitement, mais que si la forêt le fait en utilisant le plus proche voisin connu, cela ne sert à rien ? Ces deux algorithmes ont le droit d'exister. Comme l'a dit SanSanych - pour chaque ensemble de prédicteurs et d'objectifs, il faut mener des recherches et comparer les modèles, ce n'est qu'alors que l'on peut dire si le modèle effectue une extrapolation parfaite.
Ce qui est écrit dans les articles sur le hubra - s'applique également à des prédicteurs et des cibles spécifiques, ce n'est pas la vérité qui fonctionne pour tous les cas, c'est une étude spécifique pour un cas particulier.

 
Dr. Trader:

L'extrapolation implique de prédire de nouvelles données au-delà des valeurs du prédicteur connues lors de la formation.

Voici un morceau d'une ancienne photo, tout ce qui est ombré en vert est de l'extrapolation, et à en juger par l'image, la forêt peut le faire, sinon tout serait coloré en blanc (comme dans le cas de certains modèles SVM).


La forêt, le réseau neuronal et le modèle linéaire peuvent tous deux extrapoler. Si vous donnez des données très éloignées des valeurs connues pour une prédiction, tous ces modèles donneront une prédiction, ils ont tous des algorithmes pour de tels cas.

Mais pourquoi pensez-vous que si un modèle linéaire extrapole en utilisant la formule y=ax+b, il le fait parfaitement, mais que si la forêt le fait en utilisant le plus proche voisin connu, elle ne peut rien faire ? Ces deux algorithmes ont le droit d'exister. Comme l'a dit SanSanych - pour chaque ensemble de prédicteurs et de cibles, il faut rechercher et comparer les modèles. Ce n'est qu'alors que l'on peut dire si le modèle effectue une extrapolation parfaite.
Ce qui est écrit dans les articles sur hubra - s'applique également à des prédicteurs et des cibles spécifiques, ce n'est pas une vérité qui fonctionne pour tous les cas, c'est une étude de cas spécifique.


Il suffit de faire une étude des arbres.