L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 365

 
elibrario:

Ho già fatto la rimozione degli ingressi correlati, mi sto solo chiedendo come altro migliorare gli ingressi.

Quindi, sono d'accordo con te che ci dovrebbe essere una correlazione con il target, ecco perché voglio rimuovere gli input non correlati con il target, per esempio con Ккорр<0,5 o 0,3. Questo dovrebbe accelerare il processo di apprendimento senza influenzare troppo la qualità. Ma c'è il presupposto che dovrò rimuovere tutti gli input )))

Sugli input utilizzati (presi a caso dagli indicatori tecnici), finora non ho trovato alcuna correlazione con l'obiettivo, errore di apprendimento = 0,44, cioè quasi una moneta. Beh, l'equilibrio sta scendendo.


in nessun modo dovrebbe esserci una correlazione con l'obiettivo, dove sta scritto? che senso ha? Se avete una correlazione 1 con l'obiettivo, allora conoscete il futuro e non avete bisogno di una rete neurale
 
Maxim Dmitrievsky:

in nessun modo dovrebbe esserci una correlazione con l'obiettivo, dove è scritto? che senso ha? Se hai una correlazione di 1 con l'obiettivo, conosci il futuro e non hai bisogno di una rete neurale


Tutto il MO si basa sul fatto che le variabili di input devono essere correlate alla variabile di output.

Altrimenti, non c'è senso in TUTTI i modelli MO.

Nel Data Mining TUTTI I MODELLI DI SELEZIONE DELLE VARIABILI implementano un meccanismo per la massima correlazione della variabile di input e della variabile di output:

Procedura di selezione in avanti,
Procedura di eliminazione a ritroso,
la procedura Stepwise,
Procedura Best Subsets.
 
Dimitri:


Tutti i MOE si basano sul fatto che la variabile di input deve essere correlata alla variabile di output.

Altrimenti, non c'è senso in TUTTI i modelli MO.

Nel Data Mining, TUTTI I MODELLI DI SELEZIONE DELLE VARIABILI implementano un meccanismo per massimizzare la correlazione tra la variabile di input e la variabile di output:

Procedura di selezione in avanti,
Procedura di eliminazione a ritroso,
la procedura Stepwise,
Procedura Best Subsets.

correlare nel senso che i vettori (curve) di ingresso e di uscita devono correlarsi o la correlazione significa semplicemente la dipendenza della variabile di uscita da quella di ingresso, in senso generale?
 
Maxim Dmitrievsky:

correlare nel senso che i vettori (curve) di ingresso e di uscita dovrebbero essere correlati o la correlazione significa semplicemente la dipendenza della variabile di uscita dalla variabile di ingresso, in senso generale?


La dipendenza è un caso speciale di correlazione. Se due variabili sono dipendenti, allora c'è sicuramente una correlazione. Se c'è correlazione, non c'è necessariamente dipendenza.

Non ci sono metodi per rilevare la dipendenza nei modelli statistici. C'è solo la speranza che la correlazione identificata tra un insieme di variabili di input e una variabile di output sia una relazione.

Pertanto, le variabili devono essere correlate.

 
Dimitri:


La dipendenza è un caso speciale di correlazione. Se due variabili sono dipendenti, allora c'è sicuramente una correlazione. Se c'è correlazione, non c'è necessariamente dipendenza.

Non ci sono metodi per rilevare la dipendenza nei modelli statistici. C'è solo la speranza che la correlazione identificata tra un insieme di variabili di input e una variabile di output sia una relazione.

Pertanto, le variabili devono essere correlate.


E se c'è una corr inversa, non è più una dipendenza o cosa? ) E gli NS rimarranno bloccati con questo approccio.

Alleluia... zigzag in entrata e zigzag in uscita con offset... la correlazione è quasi perfetta, ma a che serve? )

 
Maxim Dmitrievsky:

Se corr inversa, non è più una correlazione? ) E NS si impantana in questo approccio


Nessuna correlazione è quando il coefficiente di correlazione è 0.

Come si può costruire un modello se le entrate e le uscite non sono affatto correlate?

 
Dimitri:


Nessuna correlazione è quando il coefficiente di correlazione è 0.

Come si può costruire un modello se le entrate e le uscite non sono affatto correlate?


Sì, perché la correlazione degli input e degli output non ha alcuna importanza quando il modello cerca modelli in un insieme di predittori... È una contraddizione rimuovere gli input correlati ma cercare input correlati agli output... )) Cioè, almeno avremo un ingresso correlato con l'uscita, poi tutti gli altri ingressi li dovremo rimuovere, perché anch'essi sono correlati con l'uscita, e di conseguenza con gli altri ingressi... figo, no?
 
Maxim Dmitrievsky:

Questo perché la correlazione degli input e degli output non è affatto importante quando il modello cerca modelli in un insieme di predittori... È una contraddizione: rimuovere gli input correlati ma cercare input correlati agli output. )) Cioè, almeno avremo un ingresso correlato con l'uscita, poi tutti gli altri ingressi li dovremo rimuovere, perché anch'essi sono correlati con l'uscita, e di conseguenza con gli altri ingressi... figo, no?


No, non va bene.

Se avete la prima variabile correlata con la variabile in uscita con un coefficiente di, diciamo, 0,7 e la seconda con un coefficiente di 0,65, ciò non significa che le due variabili siano altamente correlate tra loro.

Ora supponiamo che il primo sia correlato con 0,7 e il secondo con il coefficiente di -0,69.

 
Dmitry:


No, non è bello.

Se avete la prima variabile correlata con la variabile in uscita con un coefficiente di, diciamo, 0,7 e la seconda variabile con un coefficiente di 0,65, ciò non significa affatto che le due variabili siano altamente correlate tra loro.

Ora immaginate il primo con un coefficiente di 0,7 e il secondo con un coefficiente di -0,69.


E se si immagina anche che la correlazione definisce la "somiglianza" in un modo molto particolare... Non gli darei molto credito.

Stiamo costruendo un'accurata rete neurale high-tech e siamo guidati dalla correlazione nella scelta dei predittori? Questo è un po' sbagliato o qualcosa del genere... ma è tutto "secondo me"... )

 
Maxim Dmitrievsky:

E se si immagina anche che la correlazione definisce la "somiglianza" in un modo molto particolare... Non mi fiderei molto.


Poi la seconda opzione - metti tutto quello che hai in NS. Ma ci sono due MA:

1. sperare che le variabili non correlate non degradino la qualità del modello (esiste una cosa del genere per la regressione).

2. sacrificare la dimensionalità e il tempo.