L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1710

 
Maxim Dmitrievsky:

Max, ricordami ancora come si chiamano questi modelli...

1) Il modello 1 è addestrato

2) il modello 2 è addestrato sulle previsioni sui dati di prova del modello 1 ecc.

impilamento?

 
Aleksey Vyazmikin:

Sì, strani risultati. Non prendono la probabilità dal campione di prova coinvolto nella formazione? Ma sembra esserci un errore.

E quante unità totali (linee dell'obiettivo) ci sono nel campione?
Nessun campione di prova.
Ci sono 891 righe in totale nel set di dati.

Penso che una delle formule rms,rmse,cls o qualcos'altro sia usata lì. La cosa principale è che il risultato converge a 0%, 50% e 100%. E nel mezzo sono curvi. La divisione per classe è di solito fatta al 50%, e a questo punto c'è una comune corrispondenza di probabilità. Così ha deciso di lasciare la questione irrisolta.
 
Aleksey Vyazmikin:
elibrario:

Posso farle una domanda?

Perché ketbust? Cos'ha che gli analoghi non hanno?

 
elibrario:
Nessun campione di prova.
Ci sono 891 righe in totale nel set di dati.

Penso che una delle formule rms, rmse, cls o qualcos'altro sia usata lì. La cosa principale è che il risultato converge a 0%, 50% e 100%. E nel mezzo sono curvi. La divisione per classe è di solito fatta al 50%, e a questo punto c'è una comune corrispondenza di probabilità. Così ha deciso di lasciare la questione irrisolta.

Sì, bisogna rompere il codice per capire la profondità dell'idea. Ma è interessante come assegnano i pesi alle foglie, tenendo conto di quelle che hanno già.

 
mytarmailS:

Posso farle una domanda?

Perché ketbust? Cos'ha che gli analoghi non hanno?

Mi interessa per le seguenti ragioni:

1. Supporto - molte informazioni e feedback dagli sviluppatori.

2. Apprendimento veloce - utilizzando tutti i core del processore.

3. Impostazioni flessibili per la costruzione del modello e il controllo della riqualificazione - anche se qui c'è molto da migliorare.

4. Possibilità di applicare modelli binari simmetrici dopo la formazione in MQL5, ma non è il mio sviluppo.

 
Aleksey Vyazmikin:

grazie

 

Forse qualcuno sarebbe interessato a

È stato pubblicato un nuovo libro sulla previsione delle serie temporali in R, che include esempi di previsione di bitcoin

https://ranalytics.github.io/tsa-with-r/

 
Aleksey Vyazmikin:

Sì, per capire la profondità dell'idea, bisogna rompere il codice. Ma è interessante come assegnano i pesi alle foglie, tenendo conto di quelle esistenti.

Per definizione
L'idea del gradient binning è quella di costruire un insieme di modelli elementari che si raffinano in modo sequenziale. L'ennesimo modello elementare è addestrato sugli "errori" dell'insieme di n-1 modelli, e le risposte dei modelli sono pesate insieme. "Errori" qui sono tra virgolette, poiché in effetti ogni modello successivo approssima l'antigradiente della funzione di perdita, che non è necessariamente uguale alla differenza dei valori reali e predetti (cioè un errore in senso letterale).

Sembra che i pesi siano determinati come al solito - dalla probabilità.
Ma a quanto pare la divisione non è solo la migliore, ma quella che migliora il risultato complessivo. Ma questa è solo una supposizione. È impossibile cercare il codice perché contiene chilometri di elenchi. Non sono 4000 stringhe dell'alglib.

mytarmailS:

Perché catbust? Cos'ha che gli analoghi non hanno?

Sono d'accordo con Alexey. Ho una certa esperienza con xgboost. Sarà possibile confrontare nella pratica.
 
elibrario:

Sto solo chiedendo perché, vedo che stai lottando con questi alberi da ketbust, ci sono alcuni problemi di uscita, stampelle...

Mi sono addentrato un po' nell'argomento "induzione di regole" e vedo che R ha molti pacchetti di generazione di regole o insiemi di regole...


1) le regole sono facili da produrre, una linea

2) le regole sono facili da leggere per un umano

3) tipi di heap di generazione di regole, da banale a genetico

4) la qualità della previsione è alla pari con qualsiasi altra cosa


Quindi penso che forse non dovresti preoccuparti di Ketbust. e andare per qualcosa di più piacevole o qualcosa del genere...

 
mytarmailS:

Max, ricordami ancora come si chiamano questi modelli...

1) Il modello 1 è addestrato

2) il modello 2 è addestrato sulle previsioni sui dati di prova del modello 1 ecc.

impilamento?

etichettatura meta de prado