L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2536

 
Aleksey Nikolayev #:

Uno scienziato rispettabile ha scritto che il prezzo deve necessariamente essere logaritmico e tutti i teorici continuano ciecamente a farlo.

John Tukey o Box e Cox?

 
transcendreamer #:

John Tukey o Box e Cox?

Forse Eugene Fama nella sua tesi, ma non ne sono sicuro.

 
Renat Akhtyamov #:

Credo che sia già stato qui.

Bene, il problema del piatto e del trending rotolerà di nuovo


...........

Il metodo è il seguente:

1)Hai un qualche tipo di modello (per esempio la regressione lineare)

2) Avete una certa serie di osservazioni di cui non siete sicuri.

Poi create del rumore casuale e combinatelo con una serie di osservazioni, ripetete più volte.

Poi confrontate il comportamento del modello sui diversi set risultanti e traete alcune conclusioni.

Opzionalmente, possiamo selezionare il comportamento più stabile come quello preferito.

Questa non è una bacchetta magica ma solo uno strumento di analisi e di possibile leggero miglioramento, non rende corretto un modello sbagliato.

 
LenaTrap #:

...........

Il metodo è il seguente:

1)Hai un qualche tipo di modello (per esempio la regressione lineare)

2) Una serie di osservazioni di cui non siete sicuri

Poi create del rumore casuale e combinatelo con una serie di osservazioni, ripetete più volte.

Poi confrontate il comportamento del modello sui diversi set risultanti e traete alcune conclusioni.

Opzionalmente, possiamo selezionare il comportamento più stabile come quello preferito.

Questa non è una bacchetta magica, ma solo uno strumento di analisi e di possibile leggero miglioramento, non trasforma un modello sbagliato in uno giusto.

Non è chiaro. Esiste una serie deterministica e un modello che la descrive con il 100% di precisione. Aggiungete il rumore e la precisione del modello è del 52%. Qual è lo scopo di questa azione?
 
Dmytryi Nazarchuk #:
Non chiaro. Esiste una serie deterministica e un modello che la descrive con il 100% di precisione. Si aggiunge il rumore - la precisione della descrizione del modello è del 52%. Qual è il significato di questa azione?

Nel codice morse e nei comunicatori. viene da lì.

 
LenaTrap #:

...........

Il metodo è il seguente:

1)Hai un qualche tipo di modello (per esempio la regressione lineare)

2) Una serie di osservazioni di cui non siete sicuri

Poi create del rumore casuale e combinatelo con una serie di osservazioni, ripetete più volte.

Poi confrontate il comportamento del modello sui diversi set risultanti e traete alcune conclusioni.

Opzionalmente, possiamo selezionare il comportamento più stabile come quello preferito.

Questa non è una bacchetta magica, ma semplicemente uno strumento di analisi e di possibile leggero miglioramento, non trasforma il modello sbagliato in quello giusto.

Solo in certe situazioni, e ci sono una serie di situazioni in cui non funziona. L'unica speranza è che per logica, che non è sempre il caso, ci siano meno situazioni in cui non funziona.

 
Dmytryi Nazarchuk #:
Non chiaro. Esiste una serie deterministica e un modello che la descrive con il 100% di precisione. Si aggiunge il rumore - la precisione della descrizione del modello è del 52%. Qual è il significato di questa azione?

Se si possono ottenere valori esatti da questa serie, non ha senso. Se potete ottenere solo dei valori approssimativi, il punto è abbastanza semplice, controllare se il risultato del modello è l'errore delle vostre misure imprecise della serie originale (ideale). Ci sono precise formule matematiche e definizioni per questo, ma non le capisco.

 
LenaTrap #:

Se si possono ottenere valori esatti da questa serie, non ha senso. Se potete ottenere solo dei valori approssimativi, allora il punto è abbastanza semplice, controllare se il risultato del modello è un errore delle vostre misure imprecise della serie originale (ideale). Ci sono formule matematiche e definizioni precise per questo, ma non le capisco.

Il punto è l'affidabilità dell'isolamento del ricercato, non la precisione dei valori. C'è il desiderato, mescola il 10 per cento, seleziona il 99, mescola il 50, seleziona l'80 o il 20... tutto dipende dall'algoritmo di selezione dei dati da cercare.

Beh, dipende dalla qualità del rumore, naturalmente. Si può velare qualsiasi segnale se si conosce il segnale.
 
LenaTrap #:

Se si possono ottenere valori esatti da questa serie, non ha senso. Se potete ottenere solo dei valori approssimativi, allora il punto è abbastanza semplice, controllare se il risultato del modello è un errore delle vostre misure imprecise della serie originale (ideale). Ci sono formule matematiche e definizioni precise per questo, ma io non le capisco.

Non è per la regressione
 
elibrarius #:
Ho compilato i predittori e l'output in modo casuale. Solo per assicurarsi che l'apprendimento non sia possibile. Mi sono assicurato che fosse il 50/50%.
Con le quotazioni e con il target a TP=SL è anche 50/50%.

Ma cosa succede se l'obiettivo non è impostato in modo casuale?

Qui ho provato un esperimento - il mio campione è solitamente diviso in 3 parti, così li ho fusi in un unico campione e ho addestrato il modello con 100 alberi, poi ho controllato quali predittori non sono stati usati e li ho bloccati. Poi ho addestrato il modello come al solito con uno stop all'overtraining nel secondo campione, e ho confrontato i risultati nel terzo campione con la variante quando mi alleno senza escludere i predittori. Si è scoperto che i risultati erano migliori sui predittori selezionati, e qui trovo difficile concludere questo effetto pensando "la selezione dei diversi predittori è dovuta alla differenza dei campioni sull'intervallo, allenandosi sull'intero campione selezioniamo automaticamente i predittori che non perdono la loro significatività nel tempo". Tuttavia, questo significa che più grande è il campione, più robusto è il modello sull'orizzonte lungo? I predittori possono essere selezionati per l'apprendimento in questo modo, cioè non contribuisce all'apprendimento eccessivo? In generale ho sentito raccomandare dai fondatori di CatBoost che è necessario trovare gli iperparametri del modello, e poi stupidamente allenarsi su tutti i campioni accessibili per l'applicazione del modello nel lavoro.


elibrarius #:
C'era una variante con il 47,5% di errore, sembrava bella, ma quando l'ho collegata al tester MT si è rivelata una caduta invece di una crescita. Si scopre che non ho tenuto conto della commissione, si è mangiato quel 2% di vantaggio.

Qui si sta pensando a come contabilizzare la commissione...
Volevo aggiungere 4 punti allo spread. Ma questo non è giusto. Perché TP e SL a volte saranno attivati da Ask sovrastimati, non su quella barra, dove dovrebbe essere nel tester, a causa di questo l'ordine dei trade successivi può cambiare.
Ma il tester usa lo spread minimo sulla barra, sarà anche diverso dalla realtà.

Non ho ancora trovato il modo migliore.

Se il mercato si è mosso nella direzione di A di 100 punti, allora la dipendenza dallo spread non dovrebbe esistere affatto - il risultato finanziario dipende solo dallo spread - credo che non dovrebbe essere preso in considerazione nella formazione. Supponiamo che io abbia delle entrate a mercato, dopo che il modello le confermi o meno, e quando le segno ho la possibilità di allargare solo virtualmente lo spread - cioè se il profitto è inferiore al numero di punti specificato, allora non entrare. Anche lo spread è preso in considerazione nell'analisi del modello, quando il risultato è calcolato puramente per campionamento - semplicemente sottraggo un determinato numero di punti dal risultato finanziario del commercio.

Su Moex gli stop vengono attivati dove si trovava il prezzo, quindi ovviamente è più facile con quello.