L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3091

 
 
Forester #:

Finora a pagina 8. E questa è ancora un'introduzione)))
Sembra che si tratti di un confronto di Sharpe (ma scrivono che è possibile utilizzare qualsiasi altro indicatore) sulla convalida incrociata.

Da quello che ho capito, dovrebbero essere ottimizzati 4 parametri

summary(my_pbo)
Performance function Omega with threshold 1

      p_bo      slope       ar^2     p_loss 
 0.3714286  1.6891000 -0.0140000  0.3430000 
  • p_bo ( probabilità di sovrallenamento nel backtest) dovrebbe essere vicino a 0, il che indica un basso rischio di sovrallenamento.
  • slope ( coefficiente di pendenza della regressione lineare) dovrebbe essere prossimo a 1, il che indica una forte relazione lineare tra i valori delle metriche di performance per i sottoinsiemi di allenamento e di test.
  • ar^2 ( coefficiente di determinazione aggiustato) dovrebbe essere prossimo a 1, indicando una buona accuratezza della regressione lineare.
  • p_loss (la proporzione dei valori delle metriche di prestazione per il sottoinsieme di test che sono al di sotto di una determinata soglia) dovrebbe essere vicino a 0, indicando che la maggior parte dei valori delle metriche di prestazione per il sottoinsieme di test sono al di sopra di una determinata soglia.

Tuttavia, va notato che questi valori possono dipendere dalla metrica di prestazione e dal valore di soglia selezionati.


Necessità di ottimizzazione multi-criteri Pareto front-to-back multi-criteri

 
mytarmailS #:

Da quello che ho capito, ci sono 4 parametri da ottimizzare

  • p_bo ( probabilità di sovrallenamento nel backtest) dovrebbe essere prossimo a 0, il che indica un basso rischio di sovrallenamento.
  • slope ( coefficiente di pendenza della regressione lineare) dovrebbe essere prossimo a 1, indicando una forte relazione lineare tra i valori delle metriche di performance per i sottoinsiemi di allenamento e di test.
  • ar^2 ( coefficiente di determinazione aggiustato) dovrebbe essere prossimo a 1, indicando una buona accuratezza della regressione lineare.
  • p_loss (la proporzione dei valori delle metriche di prestazione per il sottoinsieme di test che sono al di sotto di una determinata soglia) dovrebbe essere vicina a 0, indicando che la maggior parte dei valori delle metriche di prestazione per il sottoinsieme di test sono al di sopra di una determinata soglia.

Tuttavia, va notato che questi valori possono dipendere dalla metrica di performance scelta e dal valore di soglia.

Troppo breve per capire quali siano questi parametri. ecco altri dati dall'articolo a pagina 13 (se il pacchetto riproduce completamente i metodi dell'articolo, ma forse è stato aggiunto/sottratto qualcos'altro)

Statistiche di overfit
Il quadro introdotto nella Sezione 2 ci permette di caratterizzare l'affidabilità
del backtest di una strategia in termini di quattro analisi complementari:
1. Probabilità di backtest overfitting (PBO): La probabilità che la
configurazione del modello selezionata come ottimale IS sottoperformi la me-
diana delle N configurazioni del modello OOS.
2. Degradazione delle prestazioni: determina in che misura una maggiore per-
formance IS porta a una minore performance OOS, un evento associato
agli effetti memoria discussi in Bailey et al.[
3. Probabilità di perdita: la probabilità che il modello selezionato come ottimale
IS comporti una perdita OOS.
4. Dominanza stocastica: Questa analisi determina se il procedimento
utilizzato per selezionare una strategia IS sia preferibile alla scelta casuale diuna
configurazione di modello tra le N alternative.

Ogni elemento è discusso in dettaglio di seguito.

 
Forester #:

È troppo breve per capire quali siano questi parametri. Ecco qualcosa di più dalla pagina 13 dell'articolo (se il pacchetto riproduce completamente i metodi dell'articolo, ma forse è stato aggiunto/sottratto qualcos'altro).

il pacchetto è semplicemente orribile, non ho mai visto un pacchetto del genere in tanti anni.

il codice è terribile

la documentazione è praticamente inutile

Non capisco come sia finito in CRAN.


Non riesco ancora a capire, c'è un sistema di trading che viene investigato diviso in lotti o ci sono diversi TS (in questa libreria)?

 
mytarmailS #:

Non riesco ancora a capire se un sistema di trading viene studiato diviso in lotti o se si tratta di diversi TS (in questa libreria).

Selezione del modello migliore tra un insieme di modelli ottenuti con diversi parametri/iparametri. L'input è una matrice, dove ogni colonna è una previsione di uno dei modelli.

O forse no. Non l'ho ancora capito nemmeno io
 
Forester #:

Selezione del modello migliore tra l'insieme dei modelli ottenuti con diversi parametri/iparametri. L'input è una matrice in cui ogni colonna rappresenta la previsione di uno dei modelli.

Ho già capito come funziona.

Non capisco come lavorare con il risultato

Fornisco una colonna (una TS)

risultato

summary(my_pbo)
Performance function Omega with threshold 1

  p_bo  slope   ar^2 p_loss 
0.0000 2.2673 0.9700 0.3710 

Do 5 colonne (cinque TS)

Ottengo anche una riga.

summary(my_pbo)
Performance function Omega with threshold 1

     p_bo     slope      ar^2    p_loss 
0.3428571 1.9081000 0.0440000 0.2860000 

Dovrebbero esserci 5 righe, oppure se è il risultato della migliore TS, dovrebbe esserci un mndex della migliore...


Ucciderei questo autore

 
Forester #:

Selezione del modello migliore tra l'insieme dei modelli ottenuti con diversi parametri/iparametri. L'input è una matrice in cui ogni colonna è la previsione di uno dei modelli.

O forse no. Non ho ancora capito nemmeno questo.

Si può interpretare come se si prendessero i rendimenti dei TS da diverse sezioni di mercato (parametri/iperparametri ) ????



sezioni di mercato diverse == parametri/iperparametri?

 
mytarmailS #:

Può essere interpretato come l'assunzione dei rendimenti del profitto del TC da diverse parti del mercato (parametri/iperparametri ) ????

Esattamente i ritorni di profitto.

mytarmailS #:

diverse parti del mercato == parametri/iperparametri?

Come ho capito esattamente le impostazioni: diversi periodi di MA, SL, ecc.

 
mytarmailS #:

Ricevo anche una riga

Dovrebbero esserci 5 righe, o se si tratta del miglior TC, dovrebbe esserci un mndex dei migliori...

Come risultato, si ottiene la valutazione complessiva del modello (e probabilmente dei dati del predittore e del target)
Un cattivo modello dà questi risultati (solo il 17% dei risultati OOS superiori a 0).

Un buon modello - 95% di risultati OOS superiori a 0

 
Forester #:

Sono arrivati i rimpatriati.

Sapete, guadagni e perdite, giusto?

Quindi prendiamo i ritorni degli Stati quando la posizione è aperta.

Forester #:

Da quanto ho capito, si tratta delle impostazioni: diversi periodi di MA, SL, ecc.

Invece di impostazioni diverse del TS, mi limiterò a fare trading su aree diverse, penso che possa essere equiparato.