L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 22

 
Io stesso non ne sono felice, è una cosa temporanea. Se imparo a selezionare i parametri dell'indicatore, passerò da D1 a periodi più piccoli e potrò ottenere molte più osservazioni nello stesso intervallo di tempo.
 
Ciao a tutti, se qualcuno è interessato vi parlerò della mia ricerca...

Per quanto riguarda l'idea del clustering non è venuto fuori niente, incollando pezzi di un cluster non si è osservata omogeneità, perché non lo so...Penso di aver bisogno di studiare l'analisi spettrale con frequenze, ampiezze e fasi, penso che Fourier andrà bene, quindi se c'è qualcuno che conosce l'argomento, sarò felice di comunicare, non così! Cerco un insegnante! Quindi, l'argomento è rallentato finora

====================================

Il prossimo nella ricerca RF.

Ho giocato con le impostazioni del modello RF, cioè il numero di spaccature e kol. Ma ho deciso di ri-addestrare lo stesso modello con gli stessi parametri, non avevo abbastanza intelligenza per salvare il primo modello buono (così ho ri-addestrato il modello e ho ottenuto un risultato molto medio, poi tutta la sera ho ri-addestrato il modello (circa 100 volte) nella speranza di trovare gli stessi parametri ma ahimè, il massimo che ho potuto ottenere è un terzo dei risultati del primo modello

Domanda: cosa è stato? riqualificazione casuale o il modello ha catturato qualche forte dipendenza nei dati, come relazionarsi ad esso in generale, sulla base della vostra esperienza?Questi parametri possono essere recuperati in qualche modo?

Tutti i risultati che ho menzionato sono stati ottenuti con nuovi dati non conosciuti in precedenza dal modello.

dati totali 55.000
formazione a 35.000
controllo a 20 000
Dati futures RTS, TF - 5 minuti
 
mytarmailS:

====================================

Più avanti la ricerca con RF .


Domanda: di cosa si trattava? Era un overtraining casuale o il modello ha colto una forte correlazione nei dati, come dovrebbe essere trattato secondo la tua esperienza?È possibile recuperare questi parametri in che modo?

Non solo dimenticatevi di questi dati, ma quando viene fuori qualcosa del genere, correte il più lontano possibile.

PS.

Abbiamo bisogno di ripulire il set iniziale di predittori dal rumore.

IlDr.Trader ha provato i componenti principali, ma ha pochissime osservazioni. Provate. Link sopra, anche il codice è postato

 
SanSanych Fomenko:

Non solo dimenticatevi di questi dati, ma quando viene fuori qualcosa del genere, correte il più lontano possibile.


perché? discutere
 
mytarmailS:
Ciao a tutti, se qualcuno è interessato vi parlerò della mia ricerca...

Per quanto riguarda l'idea del clustering non è venuto fuori niente, incollando pezzi di un cluster non si è osservata omogeneità, perché non lo so...Penso di aver bisogno di studiare l'analisi spettrale con frequenze, ampiezze e fasi, penso che Fourier andrà bene, quindi se c'è qualcuno che conosce l'argomento, sarò felice di comunicare, non così! Cerco un insegnante! Quindi, l'argomento è rallentato finora

====================================

Il prossimo nella ricerca RF.

Ho giocato con le impostazioni del modello RF, cioè il numero di spaccature e kol. Ma ho deciso di ri-addestrare lo stesso modello con gli stessi parametri, non avevo abbastanza intelligenza per salvare il primo modello buono (così ho ri-addestrato il modello e ho ottenuto un risultato molto medio, poi tutta la sera ho ri-addestrato il modello (circa 100 volte) nella speranza di trovare gli stessi parametri ma ahimè, il massimo che ho potuto ottenere è un terzo dei risultati del primo modello

Domanda: che cosa era? riqualificazione casuale o il modello ha catturato una forte correlazione nei dati, come si riferisce ad esso in generale, nella vostra esperienza?Questi parametri possono essere recuperati in qualche modo?

Tutti i risultati che ho menzionato sono stati ottenuti con nuovi dati non conosciuti in precedenza dal modello.

dati totali 55.000
formazione a 35.000
controllo a 20 000
Dati futures RTS, TF - 5 minuti.

era una specie di errore.

Per evitare questo, tenete il registro dell'esperimento nella tabella: tutti i parametri di allenamento, se c'è la selezione degli input, poi i migliori input, il risultato dell'allenamento, il risultato della validazione. E sarete felici.

 
mytarmailS:
perché? discutere
Sotto e argomentato
 

Ragazzi, per favore aiutateci con esempi di codice

Diciamo che abbiamo tre vettori "A", "B" , "С"

Dobbiamo costruire automaticamente ogni sorta di differenze tra loro, perché ci sono così tante variabili...

come:

x1 = A - B

x2 = A - C

x3 = C - B

e scrivere x1,x2,x3 come colonne nel frame di dati

Mostrami il codice se puoi

 
mytarmailS:

Ragazzi, per favore aiutateci con esempi di codice

Diciamo che abbiamo tre vettori "A", "B" , "С"

Dobbiamo costruire automaticamente ogni sorta di differenze tra loro, perché ci sono così tante variabili...

come:

x1 = A - B

x2 = A - C

x3 = C - B

e scrivere x1,x2,x3 come colonne nel frame di dati

Per favore mostrate il codice se potete.

Una variante funzionante. Potrebbe non essere ottimale:

sampleA <- as.data.frame(matrix(round(runif(n = 51000, min = 0, max = 1)), ncol = 51))


n <- ncol(sampleA) #your columns

differences <- list()
counter <- 1
for (i in 1:n){
        for (j in 1:n){
                differences[[counter]] <-       sampleA[, i] - sampleA[, j]
                counter <- counter + 1
        }
}

diff_data <- as.matrix(do.call(rbind.data.frame, differences))

diff_data_frame <- as.data.frame(t(diff_data))
 
Alexey Burnakov:

Opzione di lavoro. Forse non ottimale:

Grazie mille, mentre scrivevo tutte le combinazioni possibili con tre candele e quattro prezzi OHLC ho sudato tre volte, tanto codice
 
mytarmailS:
Grazie mille, mentre scrivevo tutte le combinazioni possibili con tre candele e 4 dei loro prezzi OHLC, ho sudato tre volte, tanto codice

Come posso fare in modo che il codice non faccia colonne extra? Per esempio, 3 colonne in una funzione producono 9 combinazioni, anche se tre sono effettivamente sufficienti, come nel mio esempio sopra

non ha senso fare A/B e poi B/A