L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 453

 

L'argomento è sceso a indovinare i fondi di caffè - almeno hanno portato una scienza chiamata astrologia.


Perché preoccuparsi di sciocchezze e dare la colpa di tutto all'input del modello? È stato discusso per quasi un centinaio di pagine che si dovrebbero prendere solo quei predittori che influenzano la variabile obiettivo. Eseguo sempre il datamining e non ho mai modelli con più del 40% di errore. È vero, i modelli con meno del 30% di errore sono difficili da trovare. Ma non ho mai un'indignazione come il 50%.

 
SanSanych Fomenko:

L'argomento è sceso a indovinare i fondi di caffè - almeno hanno portato una scienza chiamata astrologia.


Perché preoccuparsi di sciocchezze e dare la colpa di tutto all'input del modello? È stato discusso per quasi un centinaio di pagine che si dovrebbero prendere solo quei predittori che influenzano la variabile obiettivo. Eseguo sempre il datamining e non ho mai modelli con più del 40% di errore. È vero, i modelli con meno del 30% di errore sono difficili da trovare. Ma non ho mai un'indignazione come il 50%.

Perché avete "cavalli misti persone, caratteristiche, targeting, ZZ ...", mentre prevedere il colore delle candele o il ritorno, a tali frequenze (>5min), avrebbe circa lo stesso.

 
Dr. Trader:

Esperimento. Che ne dici di prendere diversi gbpusd, usdchf, usdrub e altri simboli popolari e usarli per prevedere l'eurusd.

Qui ci sono due tabelle in atache, train.csv e test.csv, in essi l'obiettivo è la crescita di eurusd m5 per la prossima barra, e i predittori sono audusdOpen[0]-audusdOpen[1], audusdOpen[2]-audusdOpen[3], audusdOpen[3]-audusdOpen[4], eurusdOpen[0]-eurusdOpen[1], eurusdOpen[1]-eurusdOpen[2], ecc. Ci sono 12 simboli in totale, gli incrementi delle precedenti 3 barre della storia sono presi da ciascuno di essi. In generale, tutto è chiaro dal nome delle colonne.
La tabella di allenamento ha 10000 righe, cioè circa 7 settimane.

Ho provato ad addestrare un modello e ho ottenuto r^2 = 0.0006164161 sui dati di allenamento, e se arrotondiamo target e risultati alle classi -1 e 1, la precisione è 0.5052. Questo è molto brutto. Ma non è realistico prendere decine di barre per ogni esempio di allenamento e decine di personaggi stessi, il mio modello su queste centinaia di colonne richiederà settimane di allenamento.
Sul testbed, i risultati di convalida del modello sono in calo, r^2 = -0,003390913 e precisione 0,4907. Casuale era, casuale è, e lo è ancora.

Ma è tutto noioso e inconcludente.
È stato interessante quando ho guardato quali pesi il modello ha dato ad ogni predittore (più alto è il peso, meglio è):


Conclusione: cercare di prevedere la direzione di eurusd sulla prossima barra m5 è meglio usando prima di tutto audusd, usdrub, usdsgd

Sì, il risultato non è buono, ma è giusto e il tester avrà l'equità pertinente, non lo stesso errore sul forward 30% e Sharp Ratio +-0.5 che dovrebbe essere 10))))

I tuoi chip non sono affatto buoni, almeno per ogni strumento alcuni ritorni passati con finestra esponenzialmente crescente (1,2,5,10,30,60...) e ti conviene prendere i minuti.

 

Ad essere onesti, ho iniziato a pensare la stessa cosa di Yura Reshetov molto tempo fa. Una volta ha detto: "Me ne andrò da qui". Ero così sorpreso, all'inizio ho pensato che potesse essere entrato in un'organizzazione segreta, non si sa mai... poi il sito web ha smesso di funzionare e così via. Peccato, se è così, lasciatelo riposare in pace. .....

Infatti, la serietà del suo lavoro è innegabile..... Ma mi sembra che non l'abbia finito solo un po'..... Penso che smonterò il suo metodo e lo avviterò... beh, vediamo .....

 
tossico:

Perché hai "cavalli misti persone, chip, targeting, ZZ...", e se tu stessi prevedendo il colore della candela o il ritorno, a tali frequenze (>5min), avresti circa la stessa cosa.


Qui non ho esattamente nulla di confuso: il problema principale nel datamining, la quantità principale di lavoro.... E quello che avete qui è un divertimento intellettuale.

 
SanSanych Fomenko:

Qui non ho esattamente nulla di confuso: il problema principale nel datamining, la quantità principale di lavoro.... E qui c'è del divertimento intellettuale.

Sono solo con i predicati HFT tutto sommato nobili, stavo disponendo il dataset, e 10 min e oltre non c'è niente di niente, nei prezzi stessi, ha bisogno di altri dati, macro, notizie, ecc nel prezzo stesso zero, efficienza proverbiale.

 
L'altro è questo:

I miei prefissi HFT sono tutti molto rispettabili, ho steso il dataset, e 10 min e oltre non c'è proprio nulla, nei prezzi stessi, ha bisogno di altri dati, macro, notizie, ecc. nel prezzo stesso zero, famigerata efficienza.

Sono piuttosto d'accordo con te. Ma che dire delle persone che aprono per segni, come TA, e mi assicurano che vincono regolarmente e con piacere?

Ci sono 2 possibilità: 1. si tratta di un wishful thinking ed è tutto solo tongue-in-cheek, e 2. su 10 minuti c'è ancora qualcosa di valore predittivo.

 
Non sono sicuro:

I miei predicati HFT sono tutti a posto e dignitosi, ho disposto un set di dati, e a 10 min e oltre non c'è proprio nulla, nei prezzi stessi, ha bisogno di altri dati, macro, notizie, ecc. nel prezzo stesso zero, famigerata efficienza.

Avete HFT da scambiare? Se non è un segreto ovviamente e "onestamente" ...

 
Vizard_:

Non si spaventi, è da molto tempo che rido di lui e di Vova, anche se Mishka li supera tutti)))
Non brillare la luce e non discutere, lasciamoli soli)))


Quindi... più..... Non si riesce a far parlare nessuno, non si riesce a far dire niente di buono a nessuno.... Ti vedo ridere dietro l'angolo.... Cosa sei buono?

Probabilmente lo stesso di me. No.... Ma almeno sono divertente).

 
Vizard_:

Scusa, Teacher))))))


Va bene... Non sono arrabbiato con te..... Sono solo curioso, sai, puramente teorico..... Solo per il gusto di sperimentare. Invierò di nuovo il mio set di dati, si tratta di 3 futures, cioè quasi 9 mesi di dati, voi costruirete un modello e darete qualche verdetto. Mi piacerebbe idealmente eseguire il tuo modello sul mio computer, ma non insisto molto su questo..... Semplicemente curioso....

Quindi... Devo pubblicarlo?