Equazione di regressione - pagina 2

 
Bene, ottenere una distribuzione empirica degli errori quando approssimata da un polinomio. E confrontarlo con quello normale. Fate particolare attenzione alle code, non alla parte centrale.
 
Mathemat:
Bene, ottenere una distribuzione empirica degli errori quando approssimata da un polinomio. E confrontarlo con quello normale. Prestare particolare attenzione alle code, non alla parte centrale.

Stiamo parlando di scegliere i migliori (nel senso di MNC) parametri polinomiali?

O stiamo parlando di scegliere i migliori in un senso diverso?

O stiamo parlando della correttezza del polinomio per l'approssimazione?

Ho chiesto una spiegazione dell'inefficienza di MNC per calcolare i parametri di una funzione preselezionata (dopo tutto, la causa della coda spessa può essere in una funzione sfortunata :).

E se ci sono procedure altrettanto semplici per determinare questi parametri, sono felice di conoscerle.

Ma sono sorpreso dalla formulazione della domanda: dato che ci sono code negli errori, non è una buona MNC...

;)

 
alsu:

Meglio usare la regressione LAD o quantile. Questo è più complicato (dovrete codificare molto di più, e dovrete inserirlo nella scienza), ma funziona...

Cosa, la verità per le citazioni funziona? Ci sono prove oggettive per questo?


P.S. Imho, qualsiasi approssimazione che pretende di estrapolare presuppone la stazionarietà. Le code grasse (sempre imho) rappresentano solo rotture di stazionarietà, cioè il tentativo di tenerne conto non aggiunge nulla di concreto alla previsione. Quindi allargherà gli intervalli di confidenza, rendendo la previsione inutile, e a cosa ci servirà?

Ma questo è tutto un ragionamento speculativo, sarei felice di vedere alcuni dati reali per confutarlo

 
Candid:

P.S. Imho, qualsiasi approssimazione che pretende di estrapolare presuppone la stazionarietà. Le code grasse (di nuovo, imho) rappresentano solo discontinuità di stazionarietà, cioè cercare di tenerne conto non aggiunge nulla di concreto alla previsione. Quindi allargherà gli intervalli di confidenza, rendendo la previsione inutile, e a cosa ci servirà?

Ma questo è tutto un ragionamento speculativo, sarei felice di vedere i dati reali per confutarlo

La valutazione dei parametri di regressione nell'analisi multivalutaria può non comportare un'estrapolazione "diretta", e prendere in considerazione questi parametri, per esempio nel trading su coppie meno liquide - permette di ottenere un certo vantaggio statistico (perché non facciamo trading sul mercato, ma sulla base delle quotazioni DT).

Ma lo spread è troppo grande...

Ma tuttavia - se le major si muovono significativamente, le minors si comporteranno come "scritto".

;)

 

FreeLance:

Ma tuttavia - se c'è un movimento significativo nelle majors, le minors si comporteranno come "scritto".

Forse, non ho controllato personalmente, quindi non ho un'opinione.
 
Candid:

Cosa, la verità per le citazioni funziona? Ci sono prove oggettive per questo?


P.S. Imho, qualsiasi approssimazione che pretende di estrapolare presuppone la stazionarietà. Le code grasse (sempre imho) rappresentano solo rotture di stazionarietà, cioè il tentativo di tenerne conto non aggiunge nulla di concreto alla previsione. Quindi allargherà gli intervalli di confidenza, rendendo la previsione inutile, e a cosa ci servirà?

Ma questo è tutto un ragionamento speculativo, mi piacerebbe vedere dati reali che lo smentiscano.

Cercherò di spiegarlo teoricamente perché non sono pronto a presentare i miei calcoli così come sono grezzi.

Durante la mia ricerca ho cercato di presentare la serie temporale dei prezzi come una somma di due processi stazionari (!): a) gaussiano con correlazioni significative fino a 2-3 conteggi (in senso stretto, è quasi-stazionario, perché le caratteristiche sono ancora un po' "fluttuanti") e b) flusso Poisson di risposte alle influenze esterne. Il primo è quello che tutti sappiamo essere. Il secondo è proprio quello che lei ha chiamato "discontinuità di stazionarietà" e che produce code esponenziali spesse. Ma se prendiamo in considerazione questo particolare modello, si scopre che la non stazionarietà del flusso di citazioni che vediamo sullo schermo è evidente - infatti la somma dei due processi stazionari è stazionaria sia in senso ampio che in senso stretto.

Approssimando con MNC costringiamo il polinomio di regressione ad "aggrapparsi" non solo alla parte normale del processo, ma anche agli outlier di Poisson, da qui la bassa efficienza di predizione che, in generale, ci serve per . D'altra parte, prendendo i polinomi quantili ci liberiamo completamente della seconda parte del processo, quella di Poisson: i quantili semplicemente non rispondono, e in modo assoluto. Così, identificando i luoghi dove la regressione dà tentativi significativi, possiamo quindi quasi online localizzare "fallimenti" con un alto grado di certezza (prevederli non è probabilmente ancora possibile, in quanto non esiste un modello appropriato, almeno, non ho:).

Darò approssimativamente (molto) i miei risultati comparativi (sono stati fatti a metà manualmente): l'efficienza della localizzazione della discontinuità di stazionarietà (frequenza della sua corretta rilevazione sulla prima barra) al MNC è circa 0,55-0,6, ai quantili - 0,85 e più (c'è molto lavoro da fare qui). Questo è il guadagno.

 
alsu:

Approssimando con ANM costringiamo il polinomio di regressione ad "aggrapparsi" non solo alla parte normale del processo, ma anche agli outlier di Poisson, da cui la bassa efficienza di previsione, che, in generale, abbiamo bisogno per . D'altra parte, prendendo i polinomi quantili ci liberiamo completamente della seconda parte del processo, quella di Poisson: i quantili semplicemente non rispondono, e in modo assoluto. Così, identificando i luoghi dove la regressione dà tentativi significativi, possiamo quindi quasi online localizzare i "fallimenti" con un alto grado di certezza (probabilmente non possiamo ancora prevederli, poiché non esiste un modello appropriato, almeno per me:)

Hmmm. quindi è esattamente il contrario, non un allargamento dell'intervallo di confidenza, ma un restringimento. Molto interessante, devo leggerlo, grazie.

Sull'essere stazionari e sul processo di discontinuità naturalmente si vuole discutere. Ma non ci sono argomenti, quindi rimane solo una cosa a cui pensare.

Forse hai risolto anche il problema del tempo? :) Intendo il problema della scelta della dimensione della finestra.

 
alsu:

Nella mia ricerca ho cercato di rappresentare la serie temporale dei prezzi come una somma di due processi stazionari (!): a) una gaussiana con correlazioni significative fino a 2-3 conteggi (in senso stretto, è quasi-stazionaria, poiché le caratteristiche "galleggiano" un po') e b) un flusso Poisson di risposte alle influenze esterne. Il primo è quello che tutti sappiamo essere. Il secondo è proprio quello che hai chiamato "discontinuità di stazionarietà" e che porta realmente alla formazione di code esponenziali spesse.

Interessante, interessante. Candido, ricordi il mio thread su Inhabited Island su un metamodello con un processo quasi-stazionario (diphurcs lì, anche il coniglio dal cappello che abbiamo tirato fuori)? Qualcosa di molto simile. La noosfera esiste, dopo tutto, e i pensieri in essa sono comuni...
 
Mathemat:
Interessante, interessante. Candido, ti ricordi il mio thread su Inhabited Island su un metamodello con un processo quasi-stazionario (diphurs lì, anche il coniglio dal cappello che abbiamo tirato fuori)? Qualcosa di molto simile. La noosfera esiste, dopo tutto, e i pensieri in essa sono comuni...
quindi ora siamo tutti confusi... in senso quantistico, naturalmente :))
 
Candid:

Forse hai risolto anche il problema del tempo? :) Intendo il problema della scelta della dimensione della finestra.

non risolto :)