L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3354

 
Aleksey Vyazmikin #:

Le probabilità del modello sono date dalle statistiche sul campione di addestramento.

Di conseguenza, senza un campione rappresentativo non sono accurate, quindi fatevene una ragione :)

O capisci in cosa consiste il modello e ripesi le foglie secondo l'algoritmo che hai ideato....

Le probabilità del modello sono date dalla sigmoide, non da questo. Per semplicità, prendi il binario e l'albero, non importa cosa c'è fuori. E anche in questo caso, si ottiene un balbettio.
 
Maxim Dmitrievsky #:
Le probabilità del modello sono date dalla sigmoide, non da questo.

Sì, beh, quale numero inserisci nella funzione, da dove proviene?

 
Aleksey Vyazmikin #:

Sì, beh, che numero metti nella funzione, da dove viene?

Hai intenzione di rispondere a una domanda con una domanda? Conosco la risposta definitiva, semmai.
 
Ciò che si ottiene nell'output dei modelli non sono le probabilità di classe. Un'analogia è la regressione, che fornisce un singolo valore. Un classificatore funziona secondo lo stesso principio: fornisce un valore grezzo passato attraverso una sigmoide, non una probabilità.

Come si ottiene la probabilità?
 
Maxim Dmitrievsky #:
Come si è capito che il classificatore fornisce le probabilità corrette? Non solo valori in un intervallo. Leggete quello che vi viene scritto?

Se si imposta una soglia di 0,8, l'80% delle operazioni sarà redditizio? E se è 0,51?

È quasi certo che non lo sarà. Verificate.

Ho controllato molte volte. Questa è la base per il TC.

Anche in questo caso, se non lo è, viene riqualificato.

 
Maxim Dmitrievsky #:
Ciò che si ottiene nell'output dei modelli non sono le probabilità di classe. Un'analogia è la regressione, che fornisce un singolo valore. Il classificatore funziona secondo lo stesso principio: fornisce un valore grezzo passato attraverso una sigmoide, non una probabilità.

Come si ottiene la probabilità?

Passando attraverso la sigmoide si ottiene la classe, non la probabilità della classe.

 
СанСаныч Фоменко #:

Passando attraverso la sigmoide si ottiene una classe, non la probabilità della classe.

Otteniamo un valore che viene chiamato probabilità, ma che in realtà non lo è.
 
СанСаныч Фоменко #:

L'ho controllato molte volte. Questa è la base del TC.

Ancora una volta, se non lo è, viene riqualificato.

Non mi fido della tua parola, ci sono dei test per questo.
 
Maxim Dmitrievsky #:
Hai intenzione di rispondere a una domanda con una domanda? Conosco la risposta univoca, semmai.
Maxim Dmitrievsky #:
Ciò che si ottiene in uscita dai modelli non sono le probabilità delle classi. Un'analogia è la regressione, che fornisce un valore. Un classificatore funziona con lo stesso principio: fornisce un valore grezzo passato attraverso una sigmoide, non una probabilità.

Come si ottiene la probabilità?

Sapete come si ottiene il valore nelle foglie del modello CB, potete riprodurlo?

Il punto è che le probabilità sono stimate dalla storia, ma solo una teoria con un campione rappresentativo può garantire che continueranno ad esserlo. Noi non abbiamo un tale campione. Pertanto, qualsiasi correzione in questa direzione non darà precisione su nuovi dati. La correzione potrebbe essere rilevante per il motivo che ci sono detriti nelle foglie, ed è questo che deve essere corretto sovrastimando o sottostimando il punto di classificazione sigmoide.

Oppure, ancora una volta, non è chiaro il motivo.

Se avete trovato qualcosa di intelligente, vi prego di condividerlo :)

 
Aleksey Vyazmikin #:

Sapete come viene ricavato il valore nelle foglie del modello CB, potete riprodurlo?

Il punto è che le probabilità storiche sono stimate, ma solo una teoria con un campione rappresentativo può garantire che continueranno ad esserlo. Noi non abbiamo un tale campione. Pertanto, qualsiasi correzione in questa direzione non darà precisione su nuovi dati. La correzione può essere rilevante per il motivo che i detriti sono entrati nelle foglie, ed è questo che dovrebbe essere corretto, sia per dipendenza che per sottostima del punto di classificazione sigmoide.

Oppure, ancora una volta, non è chiaro di cosa stiamo parlando.

Se avete trovato qualcosa di intelligente, condividetelo :)

Speravo che qualcuno cercasse almeno su Google il suggerimento.

Anche se hai curve di probabilità nella tua formazione, di quali nuovi dati possiamo parlare. E bousting e forrest peccano molto in questo. Il bousting è eccessivamente fiducioso, Forrest è poco fiducioso. Sempre che, ovviamente, si intenda utilizzare la soglia.

Io stesso ho osservato che quando si aumenta la soglia, la qualità dei trade non migliora nemmeno sulle traine. Poi la probabilità di cosa restituisce il modello? Niente :)

Nell'immagine di Sanych, il bousting autoconvinto, si può vedere dalla colonna del bordo outliers. L'avvallamento dovrebbe essere più morbido. Questo è un modello overfitting.