Équation de régression - page 4

 
Qu'en est-il du choix du polynôme ?
 
j21 20.09.2010 02:32 Et qu'en est-il du choix du polynôme ?

Je pense que si le nombre de degrés de liberté est facile et que le type de dépendance est a priori clair - quelle est la question ?

Privé:


Z.I. J'ai raté Desert Island. J'aimerais lire quelque chose qui a du sens...

Je ne sais pas, mais cette île semble flotter dans la noosphère...

Et la population se berce d'illusions sur son immortalité.

Je pense.

 
FreeLance:

Pouvez-vous être plus précis ?

Le MOC se positionne, entre autres, comme une méthode d'estimation des meilleurs paramètres d'une fonction choisie a priori par le chercheur.

Des formules de calcul de ces paramètres minimisant le carré de la déviation des données réelles par rapport à la fonction de substitution sont dérivées pour une variété de fonctions.

Où apparaissent les queues de pie ?

S'il vous plaît, éclairez-moi...

Des queues grasses peuvent se produire si le modèle choisi par le chercheur n'est pas adapté à la série réelle. La vérification standard de l'adéquation de tout modèle de régression aux données réelles est la distribution des résidus. Les résidus sont la déviation des données réelles par rapport aux données du modèle. Si le modèle est adéquat, alors la distribution des résidus doit être normale. La CNA minimise la somme de ces écarts, mais la distribution des résidus ne sera pas nécessairement normale, bien que dans certaines parties de la série elle puisse l'être. La régression linéaire est logique pour le modèle SB avec dérive ou pour certaines parties de la série satisfaisant ce modèle. Si vous savez comment identifier de tels segments avant qu'ils ne se terminent, alors la régression linéaire a un sens pratique. Et l'ANM ne fait que relever les paramètres du modèle choisi - il ne garantit pas l'adéquation du modèle lui-même. C'est pourquoi ce n'est pas la faute de MNC - c'est la sélection d'un modèle adéquat et son paramétrage correct qui comptent. Et le modèle peut être de n'importe quel type - stationnaire/non-stationnaire ou somme de différentes distributions, par exemple. imha

Voir https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Checking regression model adequacy " pour plus de détails.

 
Avals:

Des queues grasses peuvent se produire si le modèle choisi par le chercheur n'est pas adéquat pour les séries réelles. Le test standard de l'adéquation de tout modèle de régression aux données réelles est la distribution des résidus. Les résidus sont la déviation des données réelles par rapport aux données du modèle. Si le modèle est adéquat, alors la distribution des résidus doit être normale. La CNA minimise la somme de ces écarts, mais la distribution des résidus ne sera pas nécessairement normale, bien que dans certaines parties de la série elle puisse l'être. La régression linéaire est logique pour le modèle SB avec dérive ou pour certaines parties de la série satisfaisant ce modèle. Si vous savez comment identifier de tels segments avant qu'ils ne se terminent, alors la régression linéaire a un sens pratique. Et l'ANC ne fait que reprendre les paramètres du modèle choisi - il ne garantit pas l'adéquation du modèle lui-même. C'est pourquoi ce n'est pas la faute de MNC - c'est la sélection d'un modèle adéquat et son paramétrage correct qui comptent. Et le modèle peut être de n'importe quel type - stationnaire/non-stationnaire ou somme de différentes distributions, par exemple. imha

Voir en détail https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Checking regression model adequacy ".

Tu as écrit ça pour moi ? o)

C'est ce dont je parlais l'autre jour...

FreeLance 19.09.2010 15:52
Mathemat:
Eh bien, obtenez une distribution empirique des erreurs lorsqu'elles sont approximées par un polynôme. Et comparez-la avec la normale. Portez une attention particulière aux queues, et non à la partie centrale.

S'agit-il de choisir les meilleurs paramètres polynomiaux (au sens de MNC) ?

Ou s'agit-il de choisir les meilleurs dans un autre sens ?

Ou sur l'exactitude du polynôme pour l'approximation ?

J'ai demandé une explication de l'inefficacité de MNC pour calculer les paramètres d'une fonction présélectionnée (après tout, la raison de la queue épaisse peut se trouver dans une fonction malheureuse :).

Et s'il existe des procédures tout aussi simples pour déterminer ces paramètres - je suis heureux d'en prendre connaissance.

Mais je suis surpris par la formulation de la question : puisqu'il y a des queues dans les erreurs, le MNC n'est pas bon...

;)

Il y a une idée différente qui est poussée par ici -

Mathemat:

Une telle fonction cible - somme des carrés des erreurs - n' est optimale que lorsque la distribution des erreurs est elle-même normale.

;)

 
FreeLance:

C'est à moi que tu as écrit ça ? o)

C'est ce que je disais l'autre jour...

FreeLance 19.09.2010 15:52

Je n'ai pas écrit contre celui qui est cité, j'étais même pour :)

 
Avals:

Je ne suis pas contre la citation, je suis même pour :)

Merci pour votre aide dans la discussion.

Mais la question/réponse d'Alexey reste ouverte.

Appliquez ISC uniquement si vous êtes sûr que la distribution des erreurs futures est normale ?

Comme - connaître l'adhésion...

;)

 
FreeLance:

Appliquez ISC uniquement si vous êtes sûr que la distribution des erreurs futures est normale ?

;)

Il semble que oui (selon google :)), MNC est optimal si l'erreur de mesure est normalement distribuée. Pour d'autres distributions d'erreurs, il existe la méthode du moindre module (les erreurs sont distribuées par Laplace) et la méthode du maximum de vraisemblance (en général, si la distribution des erreurs est connue). Les MNC ne sont pas toujours les meilleurs :)

Cependant, dans notre cas, la distribution des erreurs est encore inconnue...

 

FreeLance:

Appliquez l'ANC uniquement si vous êtes sûr que la distribution des erreurs futures est normale ?


Oui, et je suis d'accord avec Alexey que MNC dans le cas gaussien est équivalent à la méthode du maximum de vraisemblance. Pour d'autres distributions, il donne des résultats pires, voire bien pires. Je me souviens que, lorsque j'étais étudiant à l'institut de mathématiques, une phrase standard des professeurs, qui m'a toujours laissé perplexe, était : "Puisqu'il est plus facile de faire les calculs de cette façon ( !!!!), nous supposerons que la distribution des erreurs est gaussienne". Peu de gens pensent que même les fondateurs de ces méthodes (Euler en particulier) ont mis en garde les chercheurs contre le danger de sacrifier la logique du raisonnement au profit de la simplicité des calculs. En conséquence, l'appareil mathématique des méthodes alternatives est peu développé, et il faut tout faire et inventer à moitié par soi-même. Heureusement que mes parents m'ont envoyé faire des études d'ingénieur :))))

j21,

En ce qui concerne le choix du polynôme, je ne vois personnellement pas l'intérêt d'aller au-delà du troisième ou quatrième degré.

 
Avals:

Il semble que oui (selon google :)), MNC est optimal si l'erreur de mesure est normalement distribuée. Pour les autres distributions d'erreurs, il existe la méthode du moindre module (les erreurs sont distribuées par Laplace) et la méthode du maximum de vraisemblance (en général, si la distribution des erreurs est connue). Les MNC ne sont pas toujours les meilleurs :)

C'est vrai, dans notre cas, la distribution des erreurs est encore inconnue...

Tout ce que cela signifie, c'est que nous devrions approximer la fonction "plausible", et non pas n'importe quelle...

du quatrième degré.

;)

 

Laissez-moi vous expliquer en donnant une illustration


P.S. Au cas où, je m'explique : cette figure montre clairement ce qu'une forte éjection peut faire au MNC. L'éjection est, bien sûr, très présente ici, apparemment par souci de clarté.