Equazione di regressione - pagina 8

 
Andrei01:
Cosa c'è di sbagliato in uno zigzag per trovare il minimo di una funzione?
E come si fa a costruire uno zigzag, per esempio, in uno spazio a dieci dimensioni? )))))) E quante risorse computazionali ci vorranno?
 
alsu:
e come farai a costruire uno zigzag, per esempio, in uno spazio a dieci dimensioni? )))))) E quante risorse computazionali ci vorranno?
non molto, non puoi chiudere l'anello. è necessario un cerchio completo ))
 
alsu:
e come farai a costruire uno zigzag, per esempio, in uno spazio a dieci dimensioni? )))))) E quante risorse computazionali ci vorranno?
Penso che le risorse siano secondarie in questa fase, ma se è redditizio, allora possiamo pensare all'ottimizzazione)).
 
j21:

Ero interessato alle equazioni di regressione. Tuttavia, ho incontrato un problema nel descriverli adeguatamente. Quali dati abbiamo: tempo (diciamo M15), HIGH, LOW, OPEN, CLOSE, VOLUME. Per noi è un insieme di osservazioni. Abbiamo un indicatore per il quale dobbiamo stabilire una relazione funzionale con i parametri dell'oggetto (nel nostro caso, la variazione del tasso di cambio) - fattori. Richiesto: stabilire una relazione quantitativa tra l'indicatore e i fattori. In questo caso, il compito dell'analisi di regressione è inteso come il compito di identificare la dipendenza funzionale y* = f(x 1, x 2, ..., x t) che meglio descrive i dati che abbiamo.

La funzione f(x 1, x 2, ..., x t) che descrive la dipendenza dell'indicatore dai parametri è chiamata equazione di regressione (funzione).

Quindi. Domanda 1: Dei dati che abbiamo, quale dovremmo scegliere come indicatore e quale come fattore? Logicamente l'indicatore è il tempo, i fattori sono H, L, O, C, V

Nel nostro caso si tratta di una serie temporale.

Il prossimo compito è quello di scegliere la dipendenza funzionale. Un'equazione che descrive la relazione tra la variazione dell'indicatore e la variazione dei fattori. Spesso si tratta di funzioni polinomiali. Un caso particolare è il polinomio di 1° grado - un'equazione di regressione lineare.

Domanda 2: Qual è il miglior polinomio da scegliere, e come descriverlo adeguatamente in termini di serie temporale, quali parametri applicare, qual è il grado del polinomio. Qualcuno ha usato il polinomio di Chebyshev? Se sì, qual è l'ordine?

Il nostro prossimo compito è quello di calcolare i coefficienti dell'equazione di regressione. Il modo usuale è quello di usare l'ANC.

Domanda 3: Qual è il metodo migliore per calcolare i coefficienti per il nostro caso?

Domanda 4. Hai bisogno di normalizzare i dati?

L'argomento è certamente importante e interessante.

Quindi abbiamo una serie temporale contenente N campioni. A questo punto non è importante cosa si debba intendere esattamente come campioni - tick, OHLC o altro. Ciò che sembra importante è la risposta alla domanda sulla lunghezza ottimale del campione di allenamento n non uguale a N, il numero ottimale di parametri regolabili k<=n (grado del polinomio) e l'orizzonte di previsione T (misurato in conteggi).

In questa fase il tipo particolare di funzione approssimativa e il metodo della sua approssimazione alla serie originale non sono importanti. È importante ottenere le dipendenze dei parametri di cui sopra dalle proprietà della BP iniziale. Si sa, per esempio, che se BP è una variabile casuale integrata, allora la previsione ottimale è una costante pari al valore dell'ultima lettura (barra zero). Se la serie contiene regolarità, bisogna cercare l'optimum in termini di parametri di regressione.

Qualche considerazione di buon senso in questo contesto?

 
grado 3. il numero di campioni n è determinato dall'ora del giorno e dall'ACF. l'orizzonte di previsione è determinato sperimentalmente poiché dipende dalla precisione data e dal modello (il modello può anche essere un polinomio)
 
Neutron:

L'argomento è certamente importante e interessante.

Quindi abbiamo una serie temporale contenente N conteggi. A questo punto non importa cosa si intenda esattamente per conteggi - tick, OHLC o altro. Ciò che sembra importante è la risposta alla domanda su una lunghezza ottimale del campione di allenamento n non uguale a N, un numero ottimale di parametri regolabili k<=n (grado del polinomio) e un orizzonte di previsione T (misurato in conteggi).

In questa fase non è importante il tipo particolare di funzione approssimativa e il metodo della sua approssimazione alla serie originale. È importante ottenere le dipendenze dei parametri di cui sopra dalle proprietà della BP iniziale. Si sa, per esempio, che se BP è una variabile casuale integrata, allora la previsione ottimale è una costante uguale al valore dell'ultima lettura (barra zero). Se la serie contiene delle regolarità, si deve cercare un optimum attraverso i parametri di regressione.

Qualche considerazione di buon senso in questa formulazione?

Nessuna merda in questa formulazione. Teorizzazione del cazzo. Calcia questa regressione polinomiale al muro con un BP.

Abbiamo bisogno di massimizzare il profitto. Fanculo tutte le regressioni univariate. Perché usare solo una frazione delle informazioni di mercato? Quando ci sono molte informazioni.

L'analisi di regressione dovrebbe essere multivariata, questo è il minimo. Analisi di diversi metodi di stima (CIO, MO dei valori di errore assoluto (Laplace o Lagrange - non ricordo), segno, quantile, ecc.) di regressione sull'efficienza.

Anche la stima dell'orizzonte di previsione è un brano interessante.

Ha scritto delle stronzate sull'argomento. Non c'è molto, ovviamente. Solo l'inizio. Davanti a questo c'è la stima dell'orizzonte di previsione dei profitti della BP e un sacco di interessanti bummer...

 
hrenfx: Perché usare solo una parte delle informazioni di mercato? Quando ci sono molte informazioni.

Ha scritto delle stronzate sull'argomento.

Per cosa sei così eccitato?

Pensi che più si accumula il diverso, preferibilmente non semplice e trasparente, sarà meglio?

L'esperienza racconta una storia diversa. È giusto - più semplice, e per capire a fondo nella materia studiata correttamente! E "regressione multivariata", "quantile"... - È come l'analisi degli spinori dell'interazione torsionale.

 

Merda, non ho lanciato niente, da dove l'hai tirato fuori? Ho una semplice regressione LINEARE multivariata in generale. E la logica dell'uso della regressione lineare risiede nella logica di fare un portafoglio ottimale e trovare le correlazioni. Questo è il punto di partenza - da semplice.

Cazzo sa cosa intendi per regressione, ho scoperto io stesso cos'è l'altro giorno. Intendo l'analisi di regressione.

 
hrenfx:

... Ho una semplice regressione LINEARE multivariata...


ma si può fare una regressione polinomiale multivariata... È peggiore del lineare? Non lo so, c'è solo un controllo - se l'accuratezza della predizione aumenta o il tempo di predizione aumenta con la stessa accuratezza, allora sì, è meglio... Ma per controllarlo non basta capire come farlo, bisogna anche spiegarlo alla macchina...

 
Prival:


ma si può fare una regressione polinomiale multivariata ... Non lo so, c'è solo un controllo - se l'accuratezza della predizione aumenta, o il tempo di predizione aumenta con la stessa accuratezza, allora sì, è meglio... Ma per controllarlo non basta capire come farlo, bisogna anche spiegarlo alla macchina...

sarà meglio, naturalmente, ma anche il computer sarà carico:)