L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1911

 
Maxim Dmitrievsky:
Ti stai inventando tutto man mano). 24 colonne, non 100. Hai chiesto tu stesso il file. Non ci sono errori (l'ho spiegato). 300 e un sacco di righe perché ti ho dato un anno, quindi il tuo 'generatore' non ha fatto la cacca per contare))) Ma vai avanti. Non ho avuto il tempo di finire di guardarlo, ma l'inizio è promettente. Lascerò una recensione completa più tardi. Sembra che dovrò rispondere in formato video.
Sì Maxim scusa, non era il tuo file di allenamento, ma il significato del messaggio penso sia chiaro. Beh, 24 colonne non possono spiegare 2000 vettori senza ripetizioni. Non è fisicamente possibile....
 
Mihail Marchukajtes:

Ho un file sporco di 7700 colonne dove prendo 24 leghe, quindi non continuate, ma guardate qui. Ecco il tuo file.

Ed ecco il mio.

Qual è la differenza???? Non vi terrò in sospeso. Nell'analisi delle componenti principali, quando ogni colonna è un proprio sistema di coordinate, è importante che possano essere raggruppate in modo che i punti di colonne diverse possano essere tracciati sullo stesso sistema di coordinate. L'interpretazione è semplice. Più sono i vettori verticali e orizzontali, più è freddo. Quello che avete è una macchia smussata e uniforme.

Ho capito un po', essenzialmente gli angoli tra i vettori mostrano una correlazione (90g = 0 correlazione). Alimento i ritardi incrementali, non ci sarà alcuna correlazione, è come un rumore bianco.

Che ci si accontenti di 50 esempi di allenamento (50 linee) è sorprendente, è quanto poco profonda deve essere la griglia. Avete bisogno di molti esempi per eliminare le funzioni inutili (idealmente fino a una) che possono descrivere i dati.

 
Mihail Marchukajtes:
Sì Maxim scusa, non era il tuo file di allenamento, ma penso che il messaggio sia chiaro. Beh, 24 colonne non possono spiegare 2000 vettori senza ripetizioni. È solo fisicamente impossibile....


La prossima volta farò una danza.

 
Maxim Dmitrievsky:

la prossima volta ballerò.

vtreet non usa rsa, non si tratta affatto di questo. Io stesso non capisco cosa fanno,

preprocessano i caratteri mancanti e così via + creano nuove caratteristiche ma non la posizionano come induzione di caratteristica così come contano come caratteristica ma non la posizionano come selezione di caratteristica, quindi non so cosa sia o come funzioni.



Per quanto riguarda "la PCA è lineare e quello che hai ptsashil lì puoi semplicemente buttarlo nella spazzatura.

Scommetto che posso ottenere un prezzo da una decomposizione PCA su nuovi dati con una precisione del +-98%.

Posso provarlo, quindi qui ti sbagli, forse anche figo che sia lineare, altrimenti non l'avrei raccolto.

 
Maxim Dmitrievsky:


la prossima volta ballerò

In generale sono d'accordo con la terminologia in cui le colonne sono input (variabili esplicative), le righe sono vettori di allenamento o esempi. È possibile che per alcuni algoritmi di apprendimento questo sia critico quando ci sono meno righe che colonne, ma quando ci sono più righe che colonne ci si avvicina a esempi identici che spingono il modello nella zona di overlearning. Non è possibile descrivere 350 esempi (righe) con 24 variabili esplicative (colonne) ed evitare la ripetizione.

Non uso la PCA in generale in nessun modo, era solo un esempio per un altro utente. Potete usarlo per valutare l'insieme risultante fino al punto in cui può essere diviso.


P.S. Il pod... scopa con la canzone è accreditato. Ben fatto!

 
Quindi teoricamente la matrice più figa da imparare è una matrice quadrata quando il numero di colonne e di righe è lo stesso.... HMM... A proposito, questo mi ha dato l'idea di prendere il maggior numero di esempi per l'addestramento in cui lo stesso numero di colonne è rimasto dopo la pre-elaborazione.... Questo è un pensiero... quindi è.... La matrice quadrata non ha ripetizioni al 100%....
 
Mihail Marchukajtes:

In generale sono d'accordo con la terminologia in cui le colonne sono input (variabili esplicative), le righe sono vettori di allenamento o esempi. È possibile che per alcuni algoritmi di apprendimento questo sia critico quando ci sono meno righe che colonne, ma quando ci sono più righe che colonne si ottengono esempi quasi identici che spingono il modello nell'area dell'overtraining. Non è possibile descrivere 350 esempi (righe) con 24 variabili esplicative (colonne) ed evitare la ripetizione.

Non uso la PCA in generale in nessun modo, era solo un esempio per un altro utente. Potete usarlo per valutare l'insieme risultante fino al punto in cui può essere diviso.


P.S. Il pod... scopa con la canzone è accreditato. Ben fatto!

Solo se le etichette delle classi sono di numero molto diverso (le classi non sono bilanciate)

Ti stavo torturando per niente. il più famoso mago e il mago ))))

 
Mihail Marchukajtes:

Ci si avvicina ad esempi identici, che spingono il modello nell'area del sovraapprendimento.

questi "esempi simili" creano strutture statisticamente significative - cos'è la statistica? è quando qualcosa si ripete e puoi trarne delle conclusioni

Mihail Marchukajtes:

Non è possibile descrivere 350 esempi (righe) con 24 variabili esplicative (colonne) ed evitare la ripetizione.

Cosa c'è di sbagliato nella ripetizione ????

 
mytarmailS:

questi "stessi esempi" sono esattamente ciò che crea strutture statisticamente significative - cos'è la statistica? è quando qualcosa si ripete e si possono trarre conclusioni da esso

qual è il tuo problema con la ripetizione????

Ci sono tre tipi di bugie: bugie, bugie palesi e statistiche. - Mark Twain.

La ripetizione porta all'apprendimento meccanico, abbiamo bisogno di generalizzare la rete. Cioè, abbiamo bisogno di alimentare un vettore unico in modo che quando un nuovo vettore appare, la rete reagisce come previsto. Se un insieme contiene un gruppo di vettori vicini, la rete non li memorizzerà....

In altre parole, l'algoritmo assegnerà un fattore di ponderazione irragionevolmente alto a questi due vettori prossimali....

 
Maxim Dmitrievsky:

solo se le etichette di classe hanno un numero molto diverso (le classi non sono bilanciate)

Ho lottato con te per niente... il più famoso mago e illusionista ))))

All'inizio parlo di due classi e non di più. Se ci sono tre o più classi, allora è permesso creare una tabella di vettori unici dove le righe sono più delle colonne, ma la loro unicità sarà definita esclusivamente dal target.