L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3024

 
Maxim Dmitrievsky #:

Propongo di realizzare questo cappello in python con un albero con una scelta di foglie, in kolab, in cui è possibile inserire i propri dataset

se avete qualche idea su cosa sia meglio/peggio, su regole per prendere solo il meglio o attraverso alcuni filtri, suggeritemelo

Voglio fare un confronto, facendo passare un set di dati attraverso entrambi gli approcci. Così capiremo come stanno le cose :)

Idea interessante!

Prima di tutto, dobbiamo capire quale implementazione dell'albero permetterà di estrarre facilmente le regole della foglia per lavorarci ulteriormente.

Poi il modo di costruire l'albero - avido o genetico. Ho controllato le foglie degli alberi di tutte le popolazioni (se non ho capito bene :))

Naturalmente, è possibile utilizzare la foresta al posto della genetica, ma in questo caso sono necessari più alberi per la ricerca delle foglie e la potatura deve essere effettuata in base alla percentuale di esempi presenti nella foglia rispetto all'intero campione. Gli alberi della foresta possono essere più veloci della genetica e ovviamente avranno meno impostazioni.

Il processo di generazione di nuove foglie deve essere portato avanti fino al raggiungimento del numero richiesto (specificato) di foglie selezionate.

In questo caso, prima di costruire l'albero, è necessario garantire la generazione di un sottocampione casuale di due tipi di campioni: il primo è la selezione di N parti da intervalli uniformi continui della dimensione specificata come percentuale del campione di addestramento, il secondo è un sottocampione ottenuto in modo completamente casuale.

Un insieme casuale di predittori utilizzati per costruire l'albero.

Per quanto riguarda la pre-elaborazione di tutti i dati, è necessario riflettere maggiormente.

Criteri di valutazione delle foglie - anche questi possono essere aggiunti in seguito, ma la sostanza è che le metriche hanno una soglia stabilita. Non so quali metriche abbiate e non ricordo quali ho usato io: devo analizzare il codice. È possibile prendere l'equilibrio, la matrice di aspettativa e il fattore di recupero.

La stima deve avvenire a ogni intervallo dell'intero campione di allenamento; il numero di intervalli è impostato. Se il criterio richiesto non viene raggiunto in nessun intervallo, la foglia viene archiviata o scartata. Ho tenuto un database di foglie, eliminando i duplicati per non doverli ricontrollare.

Dopo aver selezionato le foglie, queste dovrebbero essere raggruppate per similarità, forse la correlazione di rango lo fa correttamente. Poi distribuire i pesi all'interno del gruppo e decidere le regole di voto per i gruppi. Tuttavia, forse questo è già molto, e vale la pena almeno imparare a selezionare le foglie che saranno efficaci per i nuovi dati.


Non ho capito bene su quale campione vuoi fare l'esperimento: quello che ti darò io o quello che verrà creato casualmente?

In ogni caso, per confrontare i metodi, il campione dovrebbe essere lo stesso e per un ampio intervallo di tempo, il che consentirà di prendere in considerazione, se non la ciclicità, l'andamento delle diverse fasi di mercato su grandi TF.

Vorrei dire subito che il metodo che ho utilizzato è molto lento. Forse è meglio eseguire il processo di valutazione delle foglie in MQL5 - questo permetterà di distribuire il carico sui core.

 
Aleksey Vyazmikin #:

Idea interessante!

Per ora faccio uno schizzo di un semplice esempio su un albero e lo provo subito, poi lo amplieremo a piacere.

su qualsiasi set di dati, tramite il disco di google che si può scaricare e testare senza installare nulla.

Voglio che funzioni velocemente)
 
Maxim Dmitrievsky #:

Per il momento, abbozzerò un semplice esempio su un albero, in modo da poterlo testare subito, poi lo amplieremo a piacere

su qualsiasi set di dati, tramite google disc è possibile scaricarlo e testarlo senza installare nulla.

Voglio che funzioni velocemente)

Bene - l'importante è iniziare! :)

 
Maxim Dmitrievsky #:

Non è più divertente.

Cosa c'entra il "divertente"?

C'è un fuori campione o no?

 
СанСаныч Фоменко #:

Cosa c'entra il "divertente"?

C'è un fuori campione o no?

E se trovo

 
Maxim Dmitrievsky #:

e se trovo

Non c'è un "se". È uno standard di giudizio. Qualsiasi stima senza una stima fuori campione non è interessante.

 
Maxim Dmitrievsky #:

e se trovo

Realizzare un grafico di dieci periodi di OOS in avanti e all'indietro.

 
СанСаныч Фоменко #:

Non ha nulla a che fare con il "se". È uno standard di giudizio. Qualsiasi valutazione senza una valutazione fuori campione non è interessante.

Va bene, basta con le risate
 
Valeriy Yastremskiy #:

Creare un grafico di dieci periodi di OOS in avanti e all'indietro.

Sono 100 anni
 
Maxim Dmitrievsky #:
Basta con le risate.

Stai parlando con l'egiziano o con me?

Noto che sono abbastanza soddisfatto della tua attività in questo topic.