L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2805

 
https://habr.com/ru/post/695276/ può essere utile/interessante per alcune persone.
Хитрые методики сэмплинга данных
Хитрые методики сэмплинга данных
  • 2022.10.27
  • habr.com
Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть...
 

A volte è utile sovrapporre il grafico del bilancio (blu) al grafico del prezzo (arancione).

In questo caso è chiaramente visibile, ad esempio, che il modello ha guadagnato solo su un mercato in calo per 10 anni.

Il modello più raffinato, analogamente, impara a guadagnare soprattutto sui ribassi, ma tira meno sui rialzi e sui consolidamenti. Poiché il mercato è stato in ribasso per tutti i 10 anni, il campione di formazione è distorto


 
elibrarius #:

Sei sicuro che stia selezionando casualmente i priori? Non stavo facendo catbusting, stavo guardando il codice degli esempi di bousting di base. Lì vengono utilizzati tutti i predittori. Cioè, viene preso il migliore. Quello correlato sarà accanto ad esso, ma leggermente peggiore. Ma ad altri livelli di suddivisione o negli alberi di correzione, un altro dei predittori correlati potrebbe essere migliore.

Esiste un parametro separato che consente di prendere solo una parte dei predittori per la stima - viene preso in modo casuale - che aumenta il numero di alberi del modello, ma in teoria velocizza l'addestramento.

Sarei sicuro se avessi analizzato il loro codice, quindi parlo solo di ciò che hanno dichiarato - c'è una piccola possibilità di aver frainteso gli sviluppatori.

Quindi, quello di cui si parla è l'aggiunta della randomizzazione alla valutazione degli split, e in questo modo si è migliorato l'apprendimento.

Che ci sia una preelaborazione per eliminare i predittori correlati - non ne ho sentito parlare.

Sono d'accordo che un altro predittore possa essere migliore o più utile, ma il mio obiettivo è addestrare il maggior numero possibile di modelli diversi. Voglio che imparino qualcosa.

 
Maxim Dmitrievsky #:
Quindi proponetemi un paio di formule informative da testare.

Non ho capito, devo inviarlo a voi o al set di dati? Se nel dataset, in che modo è legato al raggruppamento di simili o alla correlazione, perché il target non è coinvolto in questo processo?

 
Aleksey Vyazmikin #:

Non capisco, devo buttarla su di te o sul dataset? Se nel dataset, cosa c'entra il raggruppamento per similarità o la correlazione, perché il target non è coinvolto in questo processo?

formule per il calcolo di buone schede da riprodurre in python e mql. Raccoglierò io stesso le etichette.

solo per guardare, perché uso solo gli incrementi.

Posso caricare i bot per loro dopo l'addestramento.
 
Maxim Dmitrievsky #:

A volte è utile sovrapporre un grafico di equilibrio (blu) a un grafico di prezzo (arancione).

In questo caso è chiaramente visibile, ad esempio, che il modello ha guadagnato solo su un mercato in calo per 10 anni.

Il modello più raffinato, analogamente, impara a guadagnare soprattutto sui ribassi, ma si ritrae meno sui rialzi e sui consolidamenti. Poiché il mercato è stato in ribasso per tutti i 10 anni, il campione di formazione è distorto


Il prezzo è costruito sul principio dei delta tra le operazioni di chiusura e quelle di apertura o è una sorta di razionamento del tempo?

 
Aleksey Vyazmikin #:

Il prezzo è costruito sul principio dei delta tra la chiusura e l'apertura di un'operazione o è una sorta di razionamento del tempo?

sì, al momento degli scambi è fisso

 
Maxim Dmitrievsky #:

formule per il calcolo di buoni chip da riprodurre in python e mql. Raccoglierò io stesso le etichette.

solo per guardare, perché uso solo incrementi.

Posso caricare i bot su di esse dopo l'addestramento.

Sapete che la "bontà" di una caratteristica è determinata dal suo obiettivo.

Ho descritto il principio di creazione in precedenza. Il codice in MQL5 è tutto in MQL5, e non si tratta di una conversione attraverso una funzione - non è possibile fornire una formula.

Ad esempio, spesso viene selezionata l'ora di inizio del segmento corrente ZZ(48).

 
Aleksey Vyazmikin #:

Si sa che la "bontà" di una caratteristica è determinata dall'obiettivo.

Ho descritto il principio di creazione in precedenza. Il codice in MQL5 è tutto in MQL5, e non c'è alcuna questione di conversione attraverso una funzione - è impossibile dare una formula.

Ad esempio, spesso viene selezionata l'ora di inizio del segmento corrente ZZ(48).

Ah, beh, soprattutto sugli indicatori standard e sui loro derivati?

 
Maxim Dmitrievsky #:

Sì, il momento delle transazioni è fissato

Provate a fare un markup per l'acquisto e la vendita, selezionando un modello più equilibrato per il numero di input, e poi dividete il campione in due e fate due modelli separati.