Équation de régression

 

Membres du forum !

Pouvez-vous nous conseiller - quelqu'un a-t-il travaillé avec des équations de régression pour des cotations de devises ? Existe-t-ildes indicateurs, des MTS, des bibliothèques MQLbasés sur eux ?

Pour ceux qui sont au courant, pourriez-vous répondre à quelques questions ?

Je suis intéressé par les équations de régression. Mais je me heurte au problème de leur description adéquate. Quelles sont les données dont nous disposons : heure (disons M15), HAUT, BAS, OUVERT, FERME, VOLUME. Pour nous, il s'agit d'un ensemble d'observations. Nous avons un indicateur pour lequel nous devons établir une relation fonctionnelle avec les paramètres de l'objet (dans notre cas, la variation du taux de change) - les facteurs. Requis : établir une relation quantitative entre l'indicateur et les facteurs. Dans ce cas, la tâche de l'analyse de régression est comprise comme la tâche consistant à identifier la dépendance fonctionnelle y* = f(x 1, x 2, ..., x t) qui décrit le mieux les données dont nous disposons.

La fonction f(x 1, x 2, ..., x t) qui décrit la dépendance de l'indicateur par rapport aux paramètres est appelée équation (fonction) de régression.

Donc. Question 1 : Parmi les données dont nous disposons, laquelle devons-nous choisir comme indicateur et laquelle devons-nous choisir comme facteur ? Logiquement, l'indicateur est le temps, les facteurs sont H, L, O, C et V.

Dans notre cas, il s'agit d'une série chronologique.

La tâche suivante consiste à choisir la dépendance fonctionnelle. Une équation qui décrit la relation entre la variation de l'indicateur et la variation des facteurs. Il s'agit souvent de fonctions polynomiales. Un cas particulier est le polynôme du 1er degré - une équation de régression linéaire.

Question 2 : Quel est le meilleur polynôme à choisir, et comment le décrire adéquatement étant donné la série temporelle, quels paramètres appliquer, quel est le degré du polynôme. Quelqu'un a-t-il utilisé le polynôme de Chebyshev ? Si oui, quel est l'ordre ?

Notre prochaine tâche consiste à calculer les coefficients de l'équation de régression. La méthode habituelle consiste à utiliser l'ANC.

Question 3 : Quelle est la meilleure méthode pour calculer les coefficients pour notre cas ?

Question 4 : Est-il nécessaire de normaliser les données ?

Et la question la plus intéressante. Comment faire des prévisions, par exemple pour le prochain tick, sur la base des données obtenues et de l'équation de régression ?

Je serais reconnaissant si quelqu'un pouvait partager son expérience, ses idées.

 
Et vous voulez réellement manger ou une recette (excusez-moi). Cette méthode décrit la partie sélectionnée de l'histoire ni mieux ni moins bien que les autres, du côté de l'avant, elle se comporte de la même manière que la grande majorité des systèmes.
 

Merci pour le conseil ! Je suis en train de lire les fils de discussion du forum en ce moment.

À propos - l'opportunité d'introduire une paire de devises supplémentaire pour l'analyse du vermillon, par exemple EURUSD, est assez discutable.

 
ivandurak:
Voulez-vous vraiment manger ou une recette (désolé, ça m'a échappé). A mon avis, cette méthode décrit la partie sélectionnée de l'histoire ni mieux ni pire que d'autres, en avant ils se comportent de la même manière que la grande majorité des systèmes perdent.

Plus précisément, je suis particulièrement intéressé par la régression multivariée. L'examen des options de résolution de la régression non linéaire est également intéressant. Je n'ai pas trouvé d'algorithme pour résoudre la régression multivariée dans MQL. Si vous me fournissez des liens et des indicateurs (si vous n'êtes pas trop paresseux bien sûr) - ce sera génial ! Je ne vais pas chercher le Saint Graal, mais comprendre les méthodes de régression à plusieurs variables du point de vue des séries chronologiques des paires de devises est extrêmement important pour moi.

Je vous remercie de vos commentaires.

 
Jetez un coup d'œil ici à l'ISC, cela pourrait vous être utile.
 

En ce qui concerne le point 3, la LOC est inefficace pour les citations (si vous utilisez la régression comme prédicteur). Il est préférable d'utiliser la régression LAD ou quantile. C'est plus compliqué (beaucoup plus de codage et de science à faire), mais ça marche - contrairement aux moindres carrés.

 
La raison de l'inefficacité de l'ISC, soit dit en passant, est la proverbiale queue de pie. Les quantièmes ne présentent pas cet inconvénient.
 
alsu:
La cause de l'inefficacité de LOM est d'ailleurs la fameuse queue de pie. Les quantiles ne présentent pas ce défaut.

Pouvez-vous être plus précis ?

Le MNC se positionne, entre autres, comme une méthode permettant d'estimer le meilleur choix de paramètres pour une fonction choisie a priori par le chercheur.

Des formules de calcul de ces paramètres minimisant le carré de la déviation des données réelles par rapport à la fonction d'approximation ont été dérivées pour un ensemble de fonctions.

Où apparaissent les queues de pie ?

S'il vous plaît, éclairez-moi...

 
FreeLance: des formules de calcul de ces paramètres minimisant le carré de l'écart des données réelles par rapport à la fonction de remplacement sont dérivées pour un ensemble de fonctions.

D'où viennent les queues épaisses ?

Une telle fonction cible - la somme des carrés des erreurs - n'est optimale que lorsque la distribution des erreurs est elle-même normale.
 
Mathemat:
Une telle fonction cible -- la somme des carrés des erreurs -- n'est optimale que lorsque la distribution des erreurs est elle-même normale.

Où ai-je parlé de distributions ?

Ou le topicstarter ?

On parle d'une approximation d'un polynôme. Pas plus que ça.

Mais pas moins.

Et où est l'inefficacité des MNC ici ?

;)

--

mais les études d'erreurs pour la normalité, un élément important de l'estimation de la plausibilité du modèle a priori...

Pas d'argument.