L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2526

 
Aleksey Nikolayev #:

Per esempio, se 1<=t1<=t2<n, allora ACF(t1,t2)=sqrt(t1/t2).

Ho un'altra domanda. Qui consideriamo l'ACF dei valori adiacenti in un campione di dimensioni infinite. Per esempio, t1=1, t2=2. Otteniamo ACF =sqrt(0,5) ~ 0,707. Ora prendiamo altri valori vicini, per esempio,t1=10000, t2=10001. Otteniamo ACF = 1 (quasi). Si scopre che i valori vicini sono diversamente correlati tra loro. È normale?

 
LenaTrap #:

Ad essere onesti, non riesco a capire assolutamente nulla.

p.s forse qualche matematico super intelligente avrà pietà di me e mi spiegherà cosa sta succedendo qui?

non hai bisogno di un "matematico super intelligente" nel commercio .....

DL ha 3 strati - interno (nascosto) maniglie t momento rispettivamente esterno t-1 e t+1... - quindi l'autocorrelazione è possibile... imho... Io la vedo così

anche se mi sembra per qualche motivo che se prendiamo non il cambiamento delta di una caratteristica nel tempo, ma qualche indice - allora, forse, l'effetto di autocorrelazione di questi valori intersecanti nello spazio temporale può essere in qualche modo livellato... è discutibile... perché anche close(t)/close(t-1) hanno intersezione e quindi autocorrelazione... anche se a TF>15min l'autocorrelazione sembra scomparire (non osservata) - non l'ho verificato personalmente... e questo non è ancora l'indice di cui ho bisogno...

È inutile pregare per l'autocorrelazione nella modellazione dei movimenti di prezzo con TF adeguati... E non ha senso usare un modello dopo ogni tick (come nella derivazione di regolarità, per di più di lungo termine)... imho (ma più probabilisticamente giusto)...

MA le reti neurali ricorrenti passano solo le informazioni in avanti (con l'avvento delle macchine di Boltzmann hanno cominciato ad essere usate nell'apprendimento probabilistico multistrato)... anche se ha già suonato

Le reti ricorrenti e i metodi bayesiani, da soli, non hanno dimostrato né la capacità di estrarre la "memoria" dalle serie temporali finanziarie né di ottenere conclusioni sul modello più robusto sui nuovi dati.

è per questo che le reti ricorsive con retropropagazione dell'errore e la sua minimizzazione dy/dx sono utilizzate nei problemi reali (poiché permettono di eseguire l'integrazione proprio per questo motivo delle loro capacità di minimizzazione dy/dx)

p.s.

in generale, come per me - è lo stesso metodo Monte Carlo - solo con la macchina... Non vedo ancora nulla di nuovo nel trovare avanti usando la backpropagation... puramente terminologico...

p.p.s

tranne che con Theano si può provare qualcosa senza usare molto le risorse del PC (anche se TensorFlow è stato propagandato)...

e ciò che Y e ciò che X è a discrezione dello sviluppatore (a priori o come risultato dell'analisi statistica)... Se sei bravo con python -- in sklearn, anche le caratteristiche 2-in-1 sono già implementate in alcuni metodi? esempi! -- e l'importanza della caratteristica si fa da sola e ML si fa da sola -- un paio di righe anche (come hai trovato corrcoef in un paio di righe)

 
LenaTrap #:

Nel mercato reale? Personalmente, ho una sorta di filosofia come questa:

*ma non voglio davvero discuterne, perché senza prove è inutile discutere di supposizioni

nel trading reale - non distorcere il significato...

sì, la filosofia è davvero diversa per tutti... lo scopo della statistica è quello di spiegare la varianza

e formalizzare le dipendenze da test indipendenti

 
Doctor #:

Ho un'altra domanda. Consideriamo l'ACF dei valori vicini in un campione di dimensioni infinite. Per esempio, t1=1, t2=2. Otteniamo ACF =sqrt(0,5) ~ 0,707. Ora prendiamo altri valori vicini, per esempio,t1=10000, t2=10001. Otteniamo ACF = 1 (quasi). Si scopre che i valori vicini sono diversamente correlati tra loro. È normale?

È vero, è così. Questa è la seconda ragione per parlare di non stazionarietà di SB (la prima è la crescita della varianza con il tempo). È solo nei processi stazionari (per la loro stessa definizione) che l'ACF dipende solo dalla differenza temporale ACF(t1,t2)=ACF(t1-t2). Questo è il motivo per cui per le serie stazionarie l'ACF è solitamente scritta come funzione di un argomento t1-t2.

 
Doc #:

La domanda dovrebbe ovviamente essere rivolta ad Alexei. Ma io risponderei "qualunque cosa". La questione, presumo, è che SB percorre un percorso proporzionale a sqrt(t).

Quello che si intendeva era il famoso problema della "rovina del giocatore". Potrebbe essere usato, per esempio, per testare la significatività statistica dell'effetto dei prezzi che "aspirano" ad alcuni livelli.

 
Aleksey Nikolayev #:

Si intendeva il famoso problema del "player busting". Potrebbe essere usato, per esempio, per testare la significatività statistica dell'effetto dei prezzi che "aspirano" a certi livelli.

Questo è molto più interessante.

Forse dovremmo abbandonare il punto di vista che il mercato è una serie temporale, e finalmente fare una svolta nell'analisi di mercato.

 
Aleksey Nikolayev #:

È vero, è così. Questa è la seconda ragione per parlare di non stazionarietà di SB (la prima è la crescita della dispersione con il tempo). È solo per i processi stazionari (per la loro stessa definizione) che l'ACF dipende solo dalla differenza temporale ACF(t1,t2)=ACF(t1-t2). Ecco perché per le serie stazionarie l'ACF è solitamente scritto come funzione di un argomento t1-t2.

OK. Permettetemi di porre la domanda in un altro modo. Le due situazioni descritte di seguito sono diverse l'una dall'altra?

1) Abbiamo un campione di dimensioni infinite. Consideriamo due momenti di tempo n e (n-t). Si consideri che 1 <= (n-t) <= n. CalcolareACF((n-t),n)=sqrt((n-t)/n).

2) Abbiamo un campione di lunghezza n. Calcolare l'ACF campione con ritardo t:ACF(t) =sqrt((n-t)/n).

 
JeeyCi #:

anche se mi sembra, per qualche ragione, che se non si prende il cambiamento delta della caratteristica nel tempo, ma si contrae qualche indice - allora forse l'effetto di autocorrelazione di questi valori sovrapposti nello spazio temporale può essere in qualche modo livellato... è discutibile... perché anche close(t)/close(t-1) hanno intersezione e quindi autocorrelazione... anche se a TF>15min l'autocorrelazione sembra scomparire (non osservata) - non l'ho verificato personalmente... e non è ancora l'indice che mi serve...


Probabilmente non ne hai davvero bisogno, ma con qualsiasi tendenza i dati delle serie temporali iniziano a mostrare autocorrelazione, a volte molto alta, che teoricamente dovrebbe interferire con molti modelli di analisi/reti neurali.

Questo effetto è davvero difficile da usare per le previsioni, perché niente dura mai, la tendenza cambia con il rango, il caos con l'ordine, le serie temporali che vagano a caso improvvisamente possono non vagare affatto, e viceversa, e con tale stima non si può capire la struttura del processo, è troppo semplice, sarebbe come fare trading sopra la 200SMA.

Ma forse vale ancora la pena di controllare come la vostra rete neurale reagisce alle autocorrelazioni, e provare a rimuoverle se esistono e interferiscono. Gli elementi vicini non dovrebbero avere alcuna sovrapposizione (se è quello che penso?), se si usano dati del genere, sarebbe un grande miracolo se il modello funzionasse.

 
LenaTrap #:

Probabilmente non ne hai bisogno, ma con qualsiasi tendenza, i dati della serie temporale

non rigirarla: cercando di discutere con me, stai ancora parlando della tua... solo sulle serie temporali... (e nessuno ha cancellato i metodi di campionamento)...

il prezzo a lungo termine non è una funzione del tempo, ho fatto il mio punto molte volte prima (e non lo duplicherò)... Ti ho mostrato dove puoi ottenere l'autocorrelazione in DL... e cosa usare per X e Y e per modellare quali dipendenze - l'ho scritto anche per la decima volta - è a discrezione dello sviluppatore...

Non sono lo sviluppatore del vostro modello - non ho bisogno di dimostrare il comportamento del prezzo nel tempo... (forse non avrei dovuto scarabocchiare sul DL - tutti qui stanno pensando a qualcosa e lo confutano o dimostrano qualcosa a qualcun altro - togliendo una parola da ogni disciplina)... gli ingegneri che fanno MO (che non sono qui) capiranno comunque la ristrettezza del dibattito sull'autocorrelazione (per il gusto di parlare da nerd) sia in trend che in tick, se il modello è costruito in un aspetto molto più ampio e su un orizzonte del set di apprendimento più ampio di quello in cui possono uscire le tue pulci (autocorrelazione)... ecco a cosa serve l'apprendimento profondo (per tenere conto di tutto)

... per me la questione del commercio non è un problema:

Aleksey Nikolayev #:

Il famoso problema della "rovina del giocatore".

... ... ecco perché ho evitato queste sciocchezze per molto tempo ... è stato rivelato che nessuno qui ha un'idea di modellismo, e quelli che ce l'hanno, non perdono il loro tempo su questo thread ... ok, c'è molta più roba utile di DL in rete che tutto il gergo palese che hai sputato qui senza una buona ragione ...

Per la statistica è meglio che parliate con i matematici accademici, non sono io quello a cui chiedere... - Non mi interessa la tua convinzione che l'autocorrelazione domini il DL... - per la 5° volta ho scritto "è un cattivo modello" (non voglio scrivere la 10°)... lasciate che i vostri accademici vi rispondano (se la mia risposta vi ha fatto venire voglia di provare qualcosa)

 
Doctor #:

Bene, d'accordo. Permettetemi di porre la domanda in un altro modo. Le due situazioni descritte di seguito sono diverse l'una dall'altra?

1) Abbiamo un campione di dimensioni infinite. Consideriamo due momenti di tempo n e (n-t). Si consideri che 1 <= (n-t) <= n. CalcolareACF((n-t),n)=sqrt((n-t)/n).

2) Abbiamo un campione di lunghezza n. Calcoliamo l'ACF campione con ritardo t:ACF(t) =sqrt((n-t)/n).

La differenza è che nel primo caso ACF è considerato per tutte le possibili coppie di momenti di tempo, mentre nel secondo caso, uno dei momenti di tempo è fissato t2=n e molte coppie di momenti di tempo( per esempio, la coppia t1=1, t2=2) sono escluse dalla considerazione. In generale, l'ACF è una funzione di due argomenti. Solo per processi stazionari l'ACF può essere considerato come una funzione di un argomento t=t1-t2 (ritardo).

L'ACF campionaria è sempre calcolata da un campione numerico specifico (realizzazione) di un processo e risulta sempre essere una funzione di un argomento (valore di ritardo). Questa è la ragione principale per cui l'ACF campione su un'implementazione SB non è una stima per il suo ACF)