L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 156

 
E a proposito, le percentuali cosmiche a lungo termine sono guadagnate su 5 minuti, con un corrispondente aumento dei trade, quindi..... tutto si adatta....
 
Alexey Burnakov:


2) beh sì... ma questo Sharpe 2-3 come viene calcolato? Come calcolano i fondi, o meglio COME determinano che questa è la vera stima di Sharpe su un trade reale?


Il punto è che sui modelli, lo Sharp è il rapporto tra rendimento e rischio, ci sono molte varianti, cosa contare come ritorno, come la percentuale di crescita stupida o la regressione della dinamica di crescita, e il rischio è CKO o il massimo drawdown, ecc Le differenze non sono fondamentali, ma se 2-3 fosse una realtà tutti sarebbero miliardari, nel trading reale per diversi motivi viene fuori molte volte meno, anche quando è fatto da PhD team. Ma molto ha a che fare con la capacità, se molti modelli scambiassero per $100K o anche fino a $10M la situazione sarebbe molto più bella, ma questo non ripagherebbe nemmeno l'investimento e gli stipendi con i bonus dei dipendenti.

 
J.B:

Questa è la cosa con i modelli, Sharpe è il rapporto tra rendimento e rischio, ci sono molte variazioni di cosa contare come rendimento, come la stupida crescita percentuale o la regressione della dinamica di crescita, e il rischio è CKO o il massimo drawdown, ecc le differenze non sono fondamentali, ma se 2-3 fossero reali tutti sarebbero miliardari, nel trading reale per diversi motivi viene fuori volte meno, anche quando fatto da team PhD. Ma molto ha a che fare con la capacità lì, se molti modelli scambiati a $100K o anche fino a $10M la situazione sarebbe molto più bella, ma questo non ripagherebbe nemmeno l'investimento e gli stipendi con i bonus dei dipendenti.

Il dottorato non è un indicatore. La riqualificazione sarà buona come Ms e Bs. Da qui il forte calo delle metriche sul reale.
 
Alexey Burnakov:

Bene, ok.

Supponiamo che non sto classificando il guadagno per su/giù, ma costruendo un modello di regressione. Quindi R^2 o qualche altra metrica deterministica (ad esempio la metrica della deviazione assoluta robusta) va bene.

Per quanto riguarda l'informazione reciproca - è infondata o ci sono forti prove che la metrica funziona in modo inaffidabile? Ho i miei dubbi.

Aggiornamento: ho fatto molte ricerche su dati sintetici e reali usando le informazioni reciproche. Se la dipendenza è stazionaria, la metrica funziona bene ovunque. Se la dipendenza è al limite del rumore, la metrica può mostrare dipendenza zero. Ma nel complesso non vedo alcuna ragione per cui si comporti peggio nei sistemi non lineari multivariati rispetto, per esempio, alla F1. Potete leggere qui:https://habrahabr.ru/company/aligntechnology/blog/303750/

Ma quando ho classificato un movimento incrementale di prezzo ho ottenuto approssimativamente il seguente quadro (per 5 coppie di valute insieme, cioè un modello per tutti):


Cioè almeno valori di precisione mediana su 50 campioni pendenti nella regione del 57% al massimo. Per le singole coppie di valute raggiungo una precisione mediana superiore al 60%. Questo è solo su dati di serie temporali.

Mi dispiace, non ho tempo per dare prove solide, i dati di mercato non sono stazionari e le dipendenze non sono lineari, simulare per esempio un rumore frattale a 10 dimensioni in 2d come questo: rosso una classe verde l'altra solo in 10d

Come vedete non è Gaussiano dipendenze un sacco di "isole" e così via. Bene, allora calcola qual è l'efficienza dell'uso dell'informazione reciproca o di r^2 quando si aggiunge e si rimuove una dimensione mentre la classificazione cade. R^2 è generalmente lineare, nel caso di ipersuperficie di separazione di topologia complessa e di molte isole tutto è triste. Qui non si può fare a meno dei classici criteri statistici, potete controllare voi stessi. E se ci sono 100d o 1000d di questi casini?

 
J.B:

Mi dispiace, non c'è tempo per dare prove forti, i dati di mercato non sono stazionari e le dipendenze non sono lineari, simulare per esempio 10 rumore frattale dimensionale in 2d come questo: rosso una classe verde l'altra solo in 10d

Come vedete non è Gaussiano dipendenze molto, ci sono "isole" e così via. Bene, allora calcola qual è l'efficienza dell'uso dell'informazione reciproca o di r^2 quando si aggiunge e si rimuove una dimensione mentre la classificazione cade. R^2 è generalmente lineare, nel caso di ipersuperficie di separazione di topologia complessa e di molte isole tutto è triste. Qui non si può fare a meno dei criteri statistici classici, potete controllare voi stessi. Che cosa succede se ci sono 100d o 1000d di questi pasticci?

Non è dimostrabile...

Non puoi capirmi. Non sto classificando, sto costruendo un modello di regressione. Cosa c'entra la classificazione... Non sto eseguendo alcun iperpiano. Sto facendo una modellazione condizionale del valore mediano dell'obiettivo e misuro la sua qualità con l'analisi dei residui. È così che si è sempre fatto.

Se stiamo parlando di classificazione, allora il requisito di normalità di qualcosa non è necessario, per esempio, se la probabilità di qualcosa è vicina allo zero. La non linearità e la multidimensionalità sono solo la portata dell'informazione reciproca. Non credo che lei sia al corrente di questo problema...

 
Dimitri:

Il 10% è il carico del deposito.

Se hai un deposito di 1.000 dollari, lo carichi del 10% - apri un trade per 100 dollari.

Ora, ATTENZIONE, a seconda della leva fornita dal tuo broker/allenatore puoi comprare diversi lotti - $10.000 (1:100), $5.000 (1:50), $20.000 (1:200).

P.S. fuckerbaby........


Non bestemmiare in un argomento leggero...

Facciamo i conti.

Primo esempio: ho 500 dollari. un microlotto vale 1000 dollari. Apro un trade con un microlotto (perché gli acquisti di importi maggiori non rientrano più nel limite di rischio intrinseco) e quindi uso una leva 1:2. Dato che il commerciante mi dà una leva massima di 1:100, carico il mio deposito con il 2% per comprare $1000 / 100.

Secondo esempio. Se apro 5 trade, con lo stesso livello di capitale, carico il mio deposito del 10% e uso una leva 1:10 (0,01 * 100000 * 5 / 500).

Cioè, la leva massima fornita dipende solo dalla percentuale del carico del deposito e mi dà la possibilità di aprire l'intero taglio. La leva effettiva coinvolta è a mia discrezione. Ma il minimo è 1:2 per i miei investimenti.

Tutto chiaro ora?

 
Alexey Burnakov:

Non bestemmiare in un argomento leggero...

Facciamo i conti.

Primo esempio: ho 500 dollari. un micro lotto costa 1000 dollari. Apro un trade con un microlotto (perché l'acquisto di quantità maggiori non rientra più nel limite di rischio intrinseco) e quindi uso una leva 1:2. Dato che il commerciante mi dà una leva massima di 1:100, carico il mio deposito con il 2% per comprare $1000 / 100.

Se apro 5 trade, con lo stesso livello di capitale, carico il deposito del 10% e uso una leva 1:10 (0,01 * 100000 * 5 / 500).

È tutto chiaro ora?

State usando la stessa leva che vi fornisce la cucina. Non si varia la leva (è data - una costante), ma la quantità di capitale che si usa per una data leva.

Ancora una volta - quale leva ti dà la cucina per il tuo tipo di conto? 1:100?

 
Dimitri:

Usate la stessa leva che vi fornisce la cucina. Non è la leva che stai usando (è una costante fissa), è la quantità di capitale che stai usando per una data leva.

Ancora una volta - quale leva ti dà la cucina per il tuo tipo di conto? 1:100?


Leva massima - sì, 1:100. Ma non lo uso. Ancora una volta.

 
Alexey Burnakov:

Non è probatorio...

Non puoi capirmi. Io dico: non classifico, costruisco un modello di regressione. Cosa c'entra la classificazione... Non sto eseguendo alcun iperpiano. Sto facendo una modellazione condizionale del valore mediano dell'obiettivo e misuro la sua qualità con l'analisi dei residui. È così che si è sempre fatto.

Se stiamo parlando di classificazione, allora il requisito di normalità di qualcosa non è necessario, per esempio, se la probabilità di qualcosa è vicina allo zero. La non linearità e la multidimensionalità è solo la portata dell'informazione reciproca. Non credo che lei sia al corrente di questo problema...

Bene, come non una classificazione, prendiamo per esempio 1000 fattori, una neuronet profonda con ben per esempio 100 uscite che danno probabilità di movimenti su/giù di un dato strumento a diversi orizzonti temporali. È una regressione? La regressione è quando si predice il prezzo.

Si può usare l'informazione reciproca, mentre noi possiamo semplicemente guardare attraverso i fattori e calcolare la percentuale di influenza di ciascuno di essi sulla previsione finale, per un modello specifico, che è ancora peggio. googleNet in termini di sofisticazione. Non abbiamo bisogno della regressione, non ci interessa sapere esattamente quanto varrà un bene, complica il modello e non ha senso, l'importante è che per N secondi si muova nella giusta direzione con una data probabilità.

 
Alexey Burnakov:

La leva massima è sì, 1:100. Ma non lo uso. Lo dirò di nuovo.

OK, se non capisci le cose elementari, allora è inutile discutere.

In breve, dovete dividere il vostro interesse per la percentuale del fondo hedge per circa 10.