Equazione di regressione - pagina 4

 
E la scelta del polinomio?
 
j21 20.09.2010 02:32 E la scelta del polinomio?

Penso che se il numero di gradi di libertà è facile e il tipo di dipendenza è chiaro a priori - qual è la domanda?

Privato:


Z.I. Mi sono perso Desert Island. Vorrei leggere qualcosa che abbia un senso...

Non lo so, ma quest'isola sembra galleggiare nella noosfera...

E la popolazione si illude della sua immortalità.

Imho.

 
FreeLance:

Puoi essere più specifico?

La MOC si posiziona, tra l'altro, come un metodo per stimare i migliori parametri per una funzione selezionata a priori dal ricercatore.

Le formule per calcolare questi parametri minimizzando il quadrato della deviazione dei dati reali dalla funzione di proxy sono derivate per una varietà di funzioni.

Dove appaiono le code di grasso?

Per favore, illuminatemi...

Le code grasse possono verificarsi se il modello scelto dal ricercatore non è adeguato alla serie reale. Il controllo standard dell'adeguatezza di qualsiasi modello di regressione ai dati reali è la distribuzione dei residui. I residui sono la deviazione dei dati reali dai dati del modello. Se il modello è adeguato, allora la distribuzione dei residui è normale. L'ANC minimizza la somma di queste deviazioni, ma la distribuzione dei residui non sarà necessariamente normale, anche se in alcune parti della serie può esserlo. La regressione lineare ha senso per il modello SB con deriva o in alcune parti della serie che soddisfano questo modello. Se si sa come identificare tali segmenti prima che finiscano, allora la regressione lineare ha un senso pratico. E ANC raccoglie solo i parametri del modello scelto - non garantisce l'adeguatezza del modello stesso. Ecco perché non è colpa di MNC - è la selezione di un modello adeguato e la sua corretta parametrizzazione che conta. E il modello può essere di qualsiasi tipo - stazionario/non stazionario o somma di diverse distribuzioni, per esempio. imha

Vedere https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Checking regression model adequacy" per i dettagli.

 
Avals:

Le code grasse possono verificarsi se il modello scelto dal ricercatore non è adeguato alla serie reale. Il test standard dell'adeguatezza di qualsiasi modello di regressione ai dati reali è la distribuzione dei residui. I residui sono la deviazione dei dati reali dai dati del modello. Se il modello è adeguato, allora la distribuzione dei residui è normale. L'ANC minimizza la somma di queste deviazioni, ma la distribuzione dei residui non sarà necessariamente normale, anche se in alcune parti della serie può esserlo. La regressione lineare ha senso per il modello SB con deriva o in alcune parti della serie che soddisfano questo modello. Se si sa come identificare tali segmenti prima che finiscano, allora la regressione lineare ha un senso pratico. E ANC raccoglie solo i parametri del modello scelto - non garantisce l'adeguatezza del modello stesso. Ecco perché non è colpa di MNC - è la selezione di un modello adeguato e la sua corretta parametrizzazione che conta. E il modello può essere di qualsiasi tipo - stazionario/non stazionario o somma di diverse distribuzioni, per esempio. imha

Per i dettagli https://www.mql5.com/go?link=http://emm.ostu.ru/lect/lect6_2.html[hash]vopros11 "Checking regression model adequacy".

Hai scritto questo per me? o)

È di questo che parlavo l'altro giorno...

FreeLance 19.09.2010 15:52
Matematica:
Bene, ottenere una distribuzione empirica degli errori quando approssimata da un polinomio. E confrontarlo con quello normale. Fate particolare attenzione alle code, non alla parte centrale.

Stiamo parlando di scegliere i migliori (nel senso di MNC) parametri polinomiali?

O stiamo parlando di scegliere i migliori in un altro senso?

O sulla correttezza del polinomio per l'approssimazione?

Ho chiesto una spiegazione dell'inefficienza di MNC per calcolare i parametri di una funzione preselezionata (dopo tutto, la ragione della coda spessa può essere in una funzione sfortunata :).

E se ci sono procedure altrettanto semplici per determinare questi parametri, sono felice di conoscerle.

Ma mi sorprende la formulazione della domanda: dato che ci sono code negli errori, il MNC non va bene...

;)

C'è un'idea diversa che viene spinta qui intorno -

Matematica:

Una tale funzione obiettivo - somma dei quadrati dell'errore - è ottimale solo quando la distribuzione dell'errore stesso è normale.

;)

 
FreeLance:

Mi hai scritto questo? o)

È quello che dicevo l'altro giorno...

FreeLance 19.09.2010 15:52

Non ho scritto contro quello citato, ero addirittura a favore :)

 
Avals:

Non sono contro la citazione, sono addirittura a favore :)

Grazie per il vostro aiuto nella discussione.

Ma la domanda/risposta di Alexey rimane aperta.

Applicare ISC solo se si è sicuri che la distribuzione degli errori futuri sia normale?

Come in - conoscere il prezzo...

;)

 
FreeLance:

Applicare ISC solo se si è sicuri che la distribuzione dell'errore futuro sia normale?

;)

Sembra che sì (secondo google :)), MNC sia ottimale se l'errore di misura è normalmente distribuito. Per altre distribuzioni di errori, c'è il metodo dei minimi moduli (gli errori sono distribuiti da Laplace) e il metodo della massima verosimiglianza (in generale, se la distribuzione degli errori è nota). MNC non è sempre il migliore :)

Tuttavia, nel nostro caso la distribuzione degli errori è ancora sconosciuta...

 

FreeLance:

Applicare ANC solo se si è sicuri che la distribuzione dell'errore futuro sia normale?


Sì, e sono d'accordo con Alexey che MNC nel caso gaussiano è equivalente al metodo della massima verosimiglianza. Per altre distribuzioni dà risultati peggiori e anche molto peggiori. Mi ricordo, quando ero studente all'istituto di mat statistica, una frase standard degli insegnanti, che mi ha sempre lasciato perplesso, era: "Dato che è più facile fare i calcoli in questo modo (!!!!), assumeremo che la distribuzione degli errori sia gaussiana". Pochi pensano che anche i fondatori di questi metodi (Eulero in particolare) avvertirono i ricercatori del pericolo di sacrificare la logica del ragionamento in nome della semplicità dei calcoli. Di conseguenza, l'apparato matematico dei metodi alternativi è poco sviluppato, e bisogna fare e inventare tutto a metà da soli. Meno male che i miei genitori mi hanno mandato a studiare ingegneria :)))

j21,

Per quanto riguarda la scelta del polinomio, personalmente non vedo il senso di andare oltre il terzo o quarto grado.

 
Avals:

Sembra che sì (secondo google :)), MNC è ottimale se l'errore di misura è normalmente distribuito. Per altre distribuzioni di errori, c'è il metodo dei minimi moduli (gli errori sono distribuiti da Laplace) e il metodo della massima verosimiglianza (in generale, se la distribuzione degli errori è nota). MNC non è sempre il migliore :)

Vero, nel nostro caso la distribuzione degli errori è ancora sconosciuta...

Tutto ciò significa che dovremmo approssimare la funzione "plausibile", non qualunque...

del quarto grado.

;)

 

Mi spiego con un'illustrazione


P.S. Nel caso, lasciatemi spiegare: questa figura mostra chiaramente ciò che una forte espulsione può fare al MNC. L'espulsione è, ovviamente, abbastanza prominente qui, apparentemente per amore della chiarezza.