L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1778

 
Dmitry:

E la capacità di prevedere è determinata da come?

Beh, non per correlazione...

forse per correlazione incrociata attraverso la stima dei ritardi...

Dimitri:

Infilando stupidamente tutto il mondo nel modello?

Perché no? Nella formazione, la validazione incrociata eliminerà ciò che non è necessario, o alcune statistiche...

Come si fa a sapere "cosa è cosa" Come si fa a sapere "cosa è cosa" finché non si controlla?

 
Aleksey Vyazmikin:

Non hai ancora detto come fare trading su di esso - quindi non so che tipo di TS inventare.

Come? È ovvio)) ZZ su significa comprare, giù significa vendere.

Prevede la direzione delle ZZ, vero?

 
mytarmailS:

non per correlazione...

forse per correlazione incrociata attraverso la stima dei ritardi...

Perché no? La convalida incrociata estirperà ciò che non serve nella formazione, o alcune statistiche...

Come si fa a sapere "cosa è cosa" fino a quando non l'avrete testato?

Beh, parlerei a lungo del problema della ridondanza, particolarmente rilevante per NS, ma sono pigro.

Per inciso, è questo problema che spesso diventa la causa della scarsa capacità predittiva del modello

 
mytarmailS:

Come? È ovvio)) ZZ su è un acquisto, giù è una vendita.

Stai prevedendo la direzione di ZZ, vero?

Questo si rivelerebbe un tic, probabilmente.

Hai provato a fare la media/lisciatura dell'indicatore di classificazione con la finestra per eliminare gli outlier?

 
Aleksey Vyazmikin:

Questo si rivelerà essere un twitch, probabilmente.

Hai provato a fare la media/lisciatura dell'indicatore di classificazione con la finestra per eliminare gli outlier?

In questo caso, la media è uguale al ritardo. È necessario migliorare la qualità della classificazione, lo smussamento non è un'opzione.

Provalo così com'è!

Dmitriy:

Beh, parlerei a lungo del problema della ridondanza, particolarmente rilevante per NS, ma sono pigro.

A proposito, questo stesso problema è spesso la causa della scarsa capacità predittiva del modello

Ecco perché penso che in questa direzione, i segni possono essere già formati da AMO o da regole di lavoro, questi segni dovrebbero essere informazioni qualitative, compresse e il mio mini esperimento nella pagina precedente lo ha dimostrato.

Ma ancora non capisco come prevedere la correlazione (non lo so).

 
mytarmailS:


E come prevedere per correlazione non l'ho ancora capito (

Previsione di nuovo....

Il coefficiente di correlazione aiuta a identificare in anticipo i predittori più significativi - più alta è la correlazione tra la variabile dipendente e il predittatore, più significativa è quella variabile per il modello.

Quindi, nel tuo esempio, ci sono due modi di procedere. Il primo, il tuo, è quello di sostituire un predittore alla volta nel modello e vedere quanto migliora l'accuratezza della previsione. È molto tempo.

Il secondo, usare il coefficiente di correlazione per schermare in anticipo i predittori non importanti che disturbano il modello.


Semplicemente il problema della ridondanza è che si possono aggiungere 100+1 nuovi predittori al modello, ma 100 predittori aggiungeranno lo 0,01% alla qualità della previsione, mentre 1 aggiungerà il 10%. E non ha senso sovraccaricare il modello con quei 100 nuovi predittori - overfitting

 
mytarmailS:


E a proposito, su un gran numero di predittori l'albero fa schifo, la foresta casuale domina

 
Dmitry:

Previsione di nuovo....

Il coefficiente di correlazione aiuta a identificare in anticipo i predittori più significativi - più alta è la correlazione tra la variabile dipendente e il predittatore, più significativa è quella variabile per il modello.

Quindi, nel tuo esempio, ci sono due modi di procedere. Il primo, il tuo, è quello di sostituire un predittore alla volta nel modello e vedere quanto migliora l'accuratezza della previsione. È molto tempo.

In secondo luogo, usate il coefficiente di correlazione per eliminare in anticipo i predittori non importanti che disturbano il modello.

Beh, la correlazione è solo una delle opzioni di setacciamento e sicuramente non è la migliore... Si può anche usare la cointegrazione, la correlazione incrociata, la correlazione non lineare ecc. e sarà ancora meglio, ma sono tutti gerarchicamente più bassi del semplice errore di classificazione, ecco perché ho scelto i criteri di errore di predizione di un tratto

Dimitri:

E a proposito, su un gran numero di predittori l'albero fa schifo, la foresta casuale domina

Sono parzialmente d'accordo, ma in termini più ampi la foresta è la stessa regola, l'unica differenza è la complessità.

C'è un pacchetto in R che può comprimere una foresta di 200 alberi in una o tre regole rimuovendo tutte le regole inutili e superflue, la perdita di qualità della classificazione è dello 0,5-2%, questa è una compressione delle informazioni a cui dovremmo tendere + interpretabilità

 
mytarmailS:

In questo caso, la media è uguale al ritardo. È necessario migliorare la qualità della classificazione, lo smussamento non è un'opzione.

Provalo così com'è!

Non è un'opzione. C'è troppo inceppamento nell'appartamento.

Naturalmente, è possibile spostare la soglia di attivazione 0,65 - comprare, 0,35 - vendere.


 
Aleksey Vyazmikin:

Non è un'opzione. C'è troppa confusione nell'appartamento.

Si potrebbe, naturalmente, spostare la soglia di attivazione a 0,65 - comprare, e 0,35 - vendere.

Mostrami un grafico con gli scambi