L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2730

 
Aleksey Nikolayev #:

Qui si parla apparentemente di campioni multivariati (ogni elemento è una riga di una tabella, un vettore), mentre i criteri di omogeneità nei vostri tre link riguardano campioni numerici. I criteri di omogeneità multivariata in matstat sono un brano a parte e non mi sono del tutto chiari.

Ogni predittore separatamente è un campione numerico, quindi perché non valutarli separatamente e fare una media dei risultati? Se ci sono dinamiche di deterioramento nella maggior parte dei predittori, il campione è ridondante.

Aleksey Nikolayev #:

Sembra che il compito di ricercare molti punti di cambiamento sia stato individuato. Ancora una volta, si scopre che dobbiamo lavorare con un caso multivariato (vettoriale), il che complica molto le cose.

In generale, non mi piace la dipendenza dagli attributi scelti per lo studio. Se prendiamo set diversi di attributi, i risultati possono essere diversi.

Forse dovremmo trovare le varianti che danno i migliori risultati in termini di identificazione dell'appartenenza dei segmenti a un particolare gruppo e di efficienza della formazione su una popolazione raggruppata.

 
Aleksey Vyazmikin #:

Si può mescolare solo all'interno di un campione, se si mescolano due campioni, si nega che il mercato stia cambiando.

Non riuscite a capire di nuovo la logica?
Non ha senso confrontare le serie per determinare la lunghezza ottimale del campione di formazione, perché il mercato sta cambiando.

Potete mischiarli in qualsiasi momento, non cambierà nulla.
 
Maxim Dmitrievsky #:
Non riuscite a capire di nuovo la logica?
È inutile confrontare le serie per determinare la lunghezza ottimale del campione di allenamento, perché il mercato cambia.

Si può mescolare in qualsiasi momento, non cambierà nulla.

Come si può dimostrare che il mercato sta cambiando? Quanto dura questo processo? O è in continua evoluzione?

 
Aleksey Vyazmikin #:

Come si può dimostrare la mutevolezza del mercato? Quanto dura questo processo? O è in continua evoluzione?

Ecco, il delizioso argomentatore è in scena.
Non stazionarietà, come minimo. Cambiamento costante, a volte si ferma per una pausa sigaretta.
 
Maxim Dmitrievsky #:
Ecco, il delizioso argomentatore è acceso.
A dir poco instabile. Cambia continuamente, a volte si ferma per una pausa sigaretta.

E quale dimensione del campione dovrebbe essere presa per determinare la stazionarietà/non stazionarietà?

Secondo voi un pattern non vive più a lungo della durata della variazione del campione, ma cosa succede se nel mio campione c'è un pattern che si ripete per 8 anni? Che cos'è, un'anomalia, o i pattern non stanno cambiando tutti o i pattern identificati in una piccola area sono errati e dovuti ad altri fattori?

 
Aleksey Vyazmikin #:

Ogni singolo predittore è un campione numerico, quindi perché non stimarli singolarmente e fare una media dei risultati?

Questo funziona solo nel caso di caratteristiche indipendenti, e dato che sono conteggiate allo stesso prezzo, non è possibile. Nel caso della dipendenza tutto è molto più complicato: possiamo prendere come esempio le copule, dove le distribuzioni univariate sono sempre uniformi, ma le distribuzioni bivariate possono essere molto diverse.

Aleksey Vyazmikin #:

Forse dovremmo trovare le varianti che danno i migliori risultati in termini di identificazione dell'appartenenza dei segmenti a un particolare gruppo e di efficienza dell'addestramento su una popolazione raggruppata.

Dovremo aggiungere (alla già considerevole quantità di enumerazione) l'enumerazione per tipi di caratteristiche e, probabilmente, per parametri delle caratteristiche.

Ciononostante, mi sembra che ci sia una venatura razionale nel vostro approccio, c'è qualcosa su cui riflettere.

 
Aleksey Vyazmikin #:

Non ho forse scritto che l'idea è quella di confrontare i campioni (di addestramento e di applicazione), che se la tua teoria è corretta, il campione cesserà di essere simile man mano che aumenta, e per capire questo abbiamo bisogno di criteri per valutare il suo cambiamento, che sono derivati dai metodi di valutazione della somiglianza?

Forse, invece di criteri statistici di omogeneità del campione, si dovrebbe semplicemente osservare il cambiamento dell'importanza delle caratteristiche del modello nella dinamica (in una finestra scorrevole).

Se c'è una forte discrepanza tra lo stato attuale e quello precedente, significa che siamo già in un campione diverso.....

Pro:
1. Non è necessario programmare le statistiche. Test, tutto è già pronto.
2. Tiene conto non solo del cambiamento nel tempo del campione, ma anche del cambiamento del campione di destinazione, che a mio avviso non è meno importante.

 
Aleksey Vyazmikin #:

E quale dimensione del campione deve essere presa per determinare la stazionarietà/non stazionarietà?

Secondo voi, un pattern non vive più a lungo della durata di una variazione del campione, ma cosa succede se nel mio campione c'è un pattern che si ripete per 8 anni? Che cos'è, un'anomalia, o i pattern non stanno cambiando tutti o i pattern identificati in una piccola area sono sbagliati e dovuti ad altri fattori?

Direi non più della durata di una particolare tendenza su una scala temporale arbitraria.
Ma è una descrizione approssimativa.

Dal punto al punto di biforcazione.
 

Modelli diversi ma simili, diversi e non simili come si differenziano? Il punto di biforcazione non porterà necessariamente a una modifica del modello, è possibile marcare visivamente le stesse aree manualmente, ma non c'è una parte predittiva alla fine, l'obiettivo è trovare la lunghezza minima del campione, che conferma lo stato o la conformità del modello.

Complessità del modello, qui ovviamente c'è anche una contraddizione, un modello semplice non descriverà una sezione sufficientemente lunga necessaria, ma sarà ripetuto, un modello complesso può descrivere una sezione sufficientemente lunga necessaria, ma può essere unico. Come sempre è necessaria una via di mezzo))))))

 
Valeriy Yastremskiy trovare la lunghezza minima del campione che conferma lo stato o l'adattamento del modello.

Complessità del modello, qui ovviamente c'è anche una contraddizione, un modello semplice non descriverà una sezione sufficientemente lunga necessaria, ma sarà ripetuto, un modello complesso può descrivere una sezione sufficientemente lunga necessaria, ma può essere unico. Come sempre, una via di mezzo è necessaria))))))

In generale, i diversi modelli si differenziano per l'implementazione della casualità e sono simili per lo stesso motivo.

Soprattutto quando si utilizzano decine e centinaia di caratteristiche. Alcune di esse funzionano in avanti, altre no. Ma non c'è modo di selezionarle.

Solo con l'aiuto di un buon impianto di produzione di alcolici, come suggerito sopra.