L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3336

 
СанСаныч Фоменко #:

Leetichette (insegnante, variabile target) non possono essere spazzatura per definizione.

Sanych, non metterti in imbarazzo.

Non hai nemmeno iniziato a studiare per esprimere la tua opinione.

 

Un altro fatto divertente: stavo pensando che a quanto pare questa è solo la riqualificazione, e ho deciso di vedere su quali indici si è verificato il cambiamento di classe - ho pensato che verso la fine e questo è solo una buona illustrazione della riqualificazione.

In realtà, il risultato è stato questo


Sul campione di prova

Si scopre che i primi mille fogli (nella sequenza successiva di aggiunta al modello) sono per lo più instabili!

Sorpreso.

Sul campione d'esame

 
Aleksey Vyazmikin #:

Un altro fatto divertente: stavo pensando che a quanto pare questa è solo la riqualificazione e ho deciso di vedere in quali indici si è verificato il cambio di classe - ho pensato che fosse verso la fine e che questa fosse solo una buona illustrazione della riqualificazione.

In realtà, il risultato è stato questo


Sul campione di prova

Si scopre che sono i primi mille fogli (nella sequenza successiva di aggiunta al modello) ad essere per lo più instabili!

Sorpreso.

Su un campione

Si sta contando per rimbalzo, giusto? In questo caso, solo il primo albero viene addestrato sulle etichette dell'insegnante originale.
Per tutti gli altri alberi, il maestro è l'errore di predizione, cioè (Y - Pred). E anche con eta = 0,1...0,001. L'influenza delle foglie di questi alberi è insignificante, si limitano a correggere. Ciò che avete dimostrato (la loro insignificanza).
 

GPT per insegnare)

Aggiungiamo l'indicatore Envelopes alla nostra analisi. L'indicatore Envelopes rappresenta le linee sopra e sotto una media mobile. Di solito si trovano a una distanza percentuale fissa da quella media mobile.

  1. Inviluppi per l'ultimo mese (novembre 2023):

    • Scegliamo una distanza percentuale dalla media mobile.
    • Calcoliamo le linee di inviluppo superiore e inferiore.
  2. Tendenza complessiva utilizzando RSI, Bande di Bollinger e Inviluppi:

    • Confrontiamo i segnali ottenuti da diversi indicatori.

Consideriamo anche che i segnali di diversi indicatori possono essere contrastanti ed è importante analizzarli insieme.

Continuiamo con i calcoli e l'analisi.

 
Yuriy Vasilyev indicatore Envelopes alla nostra analisi. L'indicatore Envelopes rappresenta le linee sopra e sotto una media mobile. Di solito si trovano a una distanza percentuale fissa da tale media mobile.
  1. Inviluppi per l'ultimo mese (novembre 2023):

    • Scegliamo una distanza percentuale dalla media mobile.
    • Calcoliamo le linee di inviluppo superiore e inferiore.
  2. Tendenza complessiva utilizzando RSI, Bande di Bollinger e Inviluppi:

    • Confrontiamo i segnali ottenuti dai diversi indicatori.

Inoltre, teniamo conto del fatto che i segnali provenienti da diversi indicatori possono essere contrastanti ed è importante analizzarli insieme.

Continuiamo con i calcoli e l'analisi.

Avete provato a presentare i prezzi per ottenere una previsione? Questo genere di cose è praticato nel mercato, qualcuno ha fatto trapelare l'algoritmo, a quanto pare
 
Forester #:
State contando il boost, vero?

Hai ragione, stiamo parlando di CatBoost!

Forester #:
Lì solo il primo albero viene addestrato dalle etichette del docente iniziale.
Per tutti gli altri alberi, il maestro è l'errore di previsione, cioè (Y - Pred).

In effetti, questo è ciò che suggerisce la teoria.

Forester #:
Sì anche con coefficiente eta = 0,1...0,001

Il coefficiente "tasso di apprendimento", almeno in CatBoost, è fisso per tutti gli alberi.

Forester #:
L'influenza delle foglie di questi alberi è insignificante, si limitano a correggere. Che è quello che avete dimostrato (la loro insignificanza).

Puoi spiegare come sono disposti i coefficienti delle foglie in CatBoost?

Ci sono punti che non capisco bene.

Tuttavia, ho dimostrato un cambiamento di "classe" nelle foglie, vale a dire che il 40% delle foglie sembrava tirare i totali nel modo sbagliato sui nuovi dati.

 
Aleksey Vyazmikin #:

Potete spiegare come sono disposti i coefficienti per le foglie in CatBoost?

Vuole che scavi nel codice di CatBoost e le dia la risposta esatta? Io cerco solo quello che mi interessa. Non uso CatBoost.
È la prima volta che sento parlare di coefficienti delle foglie: cosa sono?

Tutorial e semplice codice boost qui https://habr.com/ru/companies/vk/articles/438562/
Пишем XGBoost с нуля — часть 2: градиентный бустинг
Пишем XGBoost с нуля — часть 2: градиентный бустинг
  • 2019.02.07
  • habr.com
Всем привет! В прошлой статье мы разбирались, как устроены решающие деревья, и с нуля реализовали алгоритм построения, попутно оптимизируя и улучшая его. В этой статье мы реализуем алгоритм градиентного бустинга и в конце создадим свой собственный XGBoost. Повествование будет идти по той же схеме: пишем алгоритм, описываем его, в заверешение...
 
Aleksey Vyazmikin #:

Riferisco che su un test campione separato - 7467, e su un esame - 7177, ma non c'è un piccolo numero di foglie con nessuna attivazione - non ho contato in una sola volta.


Questa è la distribuzione delle foglie che hanno cambiato classe in base al loro valore per il campione d'esame


e questo è l'esame.

Questa è la ripartizione in classi - ce ne sono tre, la terza è "-1" - nessuna attivazione.


Per il treno campione


Per il campione di prova


Per il campione d'esame

In generale, possiamo notare che i pesi delle foglie non corrispondono più alla logica della classe - di seguito il grafico del campione d'esame - non c'è un vettore chiaro.


In generale, questo metodo approssima tutto, ma non garantisce la qualità dei predittori.

In generale, presumo che le "barre" distinte sul grafico qui sopra siano foglie molto simili per luogo e frequenza di attivazione.


È difficile discutere di ciò che non si conosce. Pertanto, posso solo essere felice per il vostro successo. Se avessi un metodo simile, lo userei :)

Il mio metodo non dà ancora risultati così qualitativi, ma è abbastanza simile.

Vi siete mai chiesti perché questo accade?

 

Test di velocità del modello esportato in codice naive (catbust)

EURUSD,H1: total time from login to stop testing 0:00:04.143 (including 0:00:00.031 for history data synchronization)

Ed esportato in ONNX

EURUSD,H1: total time from login to stop testing 0:00:09.539 (including 0:00:00.025 for history data synchronization)

Gli interni delle due versioni del bot sono quasi simili, i risultati sono gli stessi.

 
Forester #:
Volete che scavi nel codice catbust per voi e vi dia una risposta esatta? Mi occupo solo di ciò che mi interessa. Non uso catbust.

Pensavo che lo sapessi, ma non è così... Non ho pensato di darti il disturbo.

Forester #:
È la prima volta che sento parlare di coefficienti fogliari: cosa sono?

Valori della foglia che vengono sommati per formare la coordinata Y di una funzione.


Un valore maggiore o uguale a 0,5 in X significa che la classe predefinita è "1" in CatBoost.