L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 302

 
Andrei:

Un filo interessante. Un sacco di flubber, ma anche alcuni pensieri intelligenti. Grazie.


+
 
Alexander Ivanov:
))) La cosa principale è la comunicazione e il processo. Sembra che alcune persone stiano già creando bot neurali. Vorrei provare .

Sfortunatamente, la soglia di ingresso all'argomento è molto alta. Il campo del MO stesso è già abbastanza vecchio e solo il numero di rami e metodi diversi tende già all'infinito.

E se non l'avete mai affrontato prima, potete annegare in questo mare di informazioni). E non voglio prendere pezzi e bocconi, allo stesso modo è necessario un approccio sistematico allo strumento.

Ma non ho trovato finora nessuna informazione sistematica coerente.

 
SanSanych Fomenko:


Per me l'errore di previsione non è il problema principale. Per me il problema principale è la riqualificazione del modello. O ho una prova anche debole che il modello NON viene riqualificato, o il modello non è affatto necessario.

Ho scritto molte volte in questo thread (e anche in altri) sulla diagnosi di overfitting e sugli strumenti per affrontare l'overfitting. In breve, si tratta di ripulire i predittori di input dal rumore, e il modello stesso è di secondaria importanza.

Tutto il resto non mi interessa, perché qualsiasi risultato senza considerazioni sul sovrallenamento è solo così così, ora, forse domani, e dopo domani la depo è prosciugata.

Se hai un buon RPM nel test (fuori dal campione di allenamento) allora tutto è a posto. La sovralimentazione non può essere evitata in un certo senso, può solo essere ridotta a un livello accettabile.


PS: il signor Mihail Marchukajtes siè offerto di provare che il classificatore Reshetov è forte, puoi anche provarlo, mi chiedo se qualcuno sarà in grado di ottenere più del 65% di precisione da questi dati)) )

 
Leinformazioni:

Beh, la sovralimentazione è quando i misuratori sul lern e sul test sono diversi, se hai un buon misuratore sul test (fuori dal campione di allenamento) allora è tutto ok. In un certo senso l'alimentazione eccessiva non può essere evitata del tutto, può solo essere ridotta a un livello accettabile.


PS: il signor Mihail Marchukajtes siè offerto di provare la ripidità del classificatore Reshetov, si può anche provare, mi chiedo se qualcuno sarà in grado di ottenere più del 65% di precisione da questi dati)))


Un tester è un lavoro di rifinitura. E avete bisogno di intervalli di confidenza delle prestazioni di TC.
Yuriy Asaulenko:

Purtroppo la soglia d'ingresso in questa materia è molto alta. Il campo del MO è abbastanza vecchio e solo il numero di rami e metodi diversi tende già all'infinito.

E se non l'avete mai affrontato prima, potreste annegare in questo mare di informazioni). E non voglio raccogliere pezzi, poiché è necessario un approccio sistematico al proiettile.

Ma non ho trovato finora nessuna informazione sistematizzante coerente.


Non è così.

La sistematicità è l'uso di TUTTO: preparazione dei dati iniziali, adattamento del/i modello/i e valutazione di quel modello.

In prima approssimazione tutto questo dà un rantolo - si può vedere e giocare con esso. Se prendete il mio articolo, l'input di lavoro è minimo (un paio d'ore per tutto) perché non dà solo istruzioni, ma anche dati per gli esercizi.

 
Yuriy Asaulenko:

Sfortunatamente, la soglia di ingresso all'argomento è molto alta. Il campo del MO stesso è già abbastanza vecchio e solo il numero di rami e metodi diversi tende già all'infinito.

E se non l'hai mai affrontato prima, puoi annegare in questo mare di informazioni). E non voglio prendere pezzi e bocconi, allo stesso modo è necessario un approccio sistematico allo strumento.

Ma non ho trovato finora nessuna informazione sistematica coerente.

Il nostro mondo è strutturato in modo tale che la redditività dell'argomento è una funzione monotona dell'altezza della soglia di entrata nell'argomento. Più alta è la soglia di entrata (non necessariamente la complessità concettuale, può essere per denaro, connessioni sociali, posizione geografica, ecc.


Ciò che è facile per molti, di regola, costa poco e non è nemmeno in grado di nutrire un adulto, per non parlare di ogni tipo di stravaganza.

 
Più ne fai, più la passerai liscia:

Il modo in cui funziona il nostro mondo è che la redditività di un argomento è una funzione monotona dell'altezza della soglia di ingresso all'argomento. Più alta è la soglia di ingresso (non necessariamente di complessità concettuale, può essere anche in termini di denaro, connessioni sociali, posizione geografica, ecc.

Ciò che è facile per molti, di solito costa poco e non è nemmeno in grado di nutrire un adulto, per non parlare di tutti gli eccessi.

Questo è certamente vero. Ma un'alta soglia d'ingresso aumenta anche tutti i tipi di rischi. Non necessariamente finanziario.
 
Il:

Ciò che è facile per molte persone, di solito costa poco e non è nemmeno in grado di nutrire un adulto....

++

o, più precisamente, un non-perseguito a tutti

 
Guardo il ramo in questo modo e mi rendo conto che è sparito...
 
mytarmailS:
Sto guardando il thread in questo modo e mi rendo conto che è sparito...

Il fatto stesso della sua esistenza è sorprendente)))

È il tipo di argomento di cui è malsano parlare ad alta voce, in grande dettaglio, quindi...

 
SanSanych Fomenko:

Non lo è.

La sistematicità consiste nell'usare TUTTO: preparare i dati grezzi, adattare il modello (o i modelli) e valutare quel modello.

In prima approssimazione tutto questo dà un rantolo - si può vedere e giocare con esso. Se prendete il mio articolo, l'input di lavoro è minimo (un paio d'ore per tutto) perché non solo ha istruzioni, ma anche dati per gli esercizi.

Per approccio sistematico, però, intendo capire cosa state facendo e quindi essere in grado di pianificare e prevedere i risultati delle vostre azioni.

Grazie per l'articolo. Non ho familiarità con nessun software particolare, quindi è perfetto per un principiante - semplice e chiaro. Ma non capisco quale metodo viene usato, la regressione o la classificazione?
Naturalmente, ho iniziato immediatamente a provarlo sui miei sistemi. Se qualche domanda è difficile, Dio non voglia, si scoprirà nel corso dell'opera.

1. Non uso candele per entrare e uscire - solo un flusso di quotazioni, e candele solo sulla storia dalla candela precedente. Mentre posso lasciare che impari per candela, è ancora un mistero come fare in modo che Rattle ingoi il flusso di citazioni all'interno della candela corrente. Il flusso della candela deve essere analizzato in qualche modo.

2. Cosa fare con i predittori ricostruibili? Per esempio, con linee di regressione e sigma. Non si può nemmeno incollarli nella storia (per l'apprendimento), abbiamo bisogno di funzioni che li calcolino al volo e rimuovano i loro disegni precedenti dalla storia.

Allo stesso modo, ci sono predittori scintillanti che non sempre esistono e sono costruiti a partire da alcuni punti della serie, e in generale possono anche essere ricostruiti nel corso del gioco.

4 La questione della normalizzazione dei predittori per i punti 2 e 3 - è fondamentalmente impossibile.

E la storia sui predittori dovrebbe essere calcolata nel corso della formazione e del lavoro.

Finora, siamo rimasti con molte incomprensioni.