L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1909

 
Mihail Marchukajtes:

Ho un file sporco di 7700 colonne dove prendo 24 leghe, quindi non continuate, ma guardate qui. Ecco il tuo file.

Ed ecco il mio.

Qual è la differenza???? Non vi terrò in sospeso. Nell'analisi delle componenti principali, quando ogni colonna è il proprio sistema di coordinate, è importante che possano essere raggruppate in modo che i punti di colonne diverse possano essere tracciati sullo stesso sistema di coordinate. L'interpretazione è semplice. Più sono i vettori verticali e orizzontali, più è freddo. Quello che avete è una macchia smussata e uniforme.

Se volete comprimere le informazioni, controllate prima l'autocorrelazione, e potete tranquillamente lasciare solo 1 ingresso, ma la rete non funzionerà, perché non c'è memoria.

 
Rorschach:

Se volete comprimere le informazioni, allora controllate prima l'autocorrelazione, e potete tranquillamente lasciare solo 1 ingresso, solo che la rete non funzionerà perché non c'è memoria.

La memoria non è la cosa più importante per una rete - sono i ritardi che la forniscono - ma la qualità del partizionamento delle classi (se stiamo parlando di classificazione) è molto importante. È necessario ottenere un set di dati che non abbia incoerenze e che le classi siano raggruppate. Tutto questo porta alla separazione qualitativa. Ho eseguito il tuo file in Rattle (shell grafica in P) c'è un metodo di vettori di riferimento e il risultato è stato il 65% di ridondanza. Cioè, se il set di dati è un semplice G, allora non ci saranno pesci in esso. Ma questi metodi non richiedono grandi serie di dati. Forse state usando una tale configurazione di IA che usando l'intero set potete ottenere un alto punteggio di apprendimento, ma di solito è un po' inverosimile, niente di più.
 
Mihail Marchukajtes:

Bene e in aggiunta le stime del modello.

I predittori indicano il numero di colonne nel file

258 numero totale di vettori. Ho tolto la classe 0 e ho lasciato la classe 2 rinominata a zero, poiché erano in equilibrio numerico con la classe 1, 19.60 è l'errore quadratico, o meglio la differenza tra lineare dritto e quadratico dovrebbe tendere a zero, 79.141 è la capacità di generalizzazione generale, quando si arriva a 100 la differenza tra gli errori diminuisce, 69.767 è la spicificazione. Il lotto di controllo totale è di 75 con una generalizzabilità generale di 70. La risposta è NON SAPERE abbiamo ottenuto 77 vettori del campione totale dove la trama di controllo ne aveva 17.

Infatti, ho ottenuto risultati peggiori nell'allenamento ma molto migliori nella trama di controllo. Inoltre, non era un sito di prova, come il vostro, ma un sito di controllo, quello che la rete non aveva visto affatto. Quella di prova è quando si allena su quella di addestramento in modo che funzioni bene su quella di prova, cioè potenzialmente la rete vede la sezione di prova durante l'addestramento. Il test non lo fa. Domande????

Adabust mi ha dato 79 su 79

 
Maxim Dmitrievsky:

Adabust mi ha dato 79 per 79

Puoi scambiare il mio modello con OOS?
 
Mihail Marchukajtes:
Forse stai usando una configurazione AI che può ottenere un alto punteggio di apprendimento usando l'intero set

È esattamente quello che è. Lasciatemi provare a spiegarlo in un altro modo. Supponiamo di avere un sistema classico su Ma(100) e prezzo. Incrocio verso l'alto comprare, incrocio verso il basso vendere. Di solito alimentiamo il Ma e il prezzo all'ingresso e i segnali del sistema all'uscita. Questo si traduce in un'economia degli input, poiché la ma è calcolata in anticipo e alimentata alla rete nella forma pronta. In alternativa, è possibile alimentare la rete non con il ma, ma con 100 ritardi del prezzo (perché la rete si calcoli da sola) in ingresso e i segnali del sistema in uscita. In questa forma, le reti non possono essere alimentate con meno di 100 ritardi di prezzo.

 
Rorschach:

Questo è quanto. Lasciatemi provare a spiegarlo in modo diverso. Diciamo che c'è un sistema classico su ma(100) e prezzo. Acquisto al rialzo, vendita al ribasso. Di solito alimentiamo il Ma e il prezzo all'ingresso e i segnali del sistema all'uscita. Questo si traduce in un'economia degli input, poiché la ma è calcolata in anticipo e alimentata alla rete nella forma pronta. In alternativa, è possibile alimentare la rete non con il ma, ma con 100 ritardi del prezzo (perché la rete si calcoli da sola) in ingresso e i segnali del sistema in uscita. In questa forma la rete non può essere alimentata con meno di 100 ritardi del prezzo.

Pensieri primitivi e prima te ne liberi, prima salterai fuori dal pozzo delle tue illusioni. Stai infrangendo una delle regole principali della preparazione dei modelli. Ricorda che siamo qui una volta con Alexey Vyazemsky era attivo sui giochi olimpici, così come un segno di gratitudine ho podnakil lui circa i ritardi e l'effetto che sono stato sorpreso. Sono un praticante e poi un teorico. Permettetemi di citare una parte della mia corrispondenza in cui si rivela l'essenza di lag

Citazione:

Ahem, ahem... divertente. Beh, non ti annoierò, sei stato buono con me, quindi te lo dirò. Sono un praticante e spesso mi imbatto in vari fenomeni, che poi cerco di spiegare in teoria o di elaborare in dettaglio gli effetti che ho scoperto. Ma la parte più interessante è ottenere le risposte alle mie domande. Quindi abbiamo avuto una domanda. Come dotare il classificatore di dati storici invece di dati attuali quando lo si addestra. Quando si costruisce un modello predittivo basato sulla regressione, l'ordine dei dati è molto importante, cioè, se un file di allenamento è stato formato dalla storia, allora in nessun caso dovrebbero essere scambiati o mescolati. È la sequenza dei dati (andando in ordine stretto) che permette ai modelli predittivi di vedere l'intera storia del campione di allenamento e come ho detto i primissimi dati del campione di allenamento influenzano gli ultimi dati a causa dell'ordinamento. Questo va dal passato al futuro e non dovrebbero mai essere confusi. Ricorda che Max ci ha provato una volta ma il risultato è stato deludente. Perché la miscelazione non è applicabile alla regressione. La classificazione è un'altra questione, quando il metodo di mescolare casualmente il set di allenamento è necessario per evitare l'overtraining. In altre parole, otteniamo una stima reale della qualità dell'addestramento, non una stima gonfiata perché i dati sono stati mescolati con successo. Ruotiamo attraverso 10 epoche, mischiamo il set, lo ruotiamo di nuovo, lo mischiamo di nuovo. In questo caso, non ci sono connessioni tra i vettori di allenamento ed essenzialmente ogni vettore va per conto suo.
2020.07.02 22:47
Così mi sono chiesto come fornire al NS non solo i valori degli indicatori per il segnale corrente ma anche la storia. Infine, ho un'idea. È molto semplice. Salviamo gli indicatori al momento del segnale, poi prendiamo i valori dell'indicatore precedente per il segnale attuale, poi un altro per il segnale precedente ecc. Di conseguenza, per il segnale corrente non solo i suoi indicatori ma anche gli indicatori dei segnali precedenti vengono salvati. Al momento prendo un ritardo di 24 segnali. Cioè, per il segnale attuale, salvo i valori degli indicatori per 24 segnali fa. Ricordo di aver detto sul forum che il file di allenamento contiene 7500 colonne per 50 linee, ma nessuno è stato in grado di indovinare come ci sono arrivate. Problema dell'area MO, siamo tutti troppo intelligenti qui :-)
2020.07.02 22:52
Ora arriviamo al punto:
Come avrete notato salvo i dati di 15 strumenti e uso questi dati per costruire diversi indicatori. Prendo la funzione stocastica. Prendo la deviazione standard cumulativa e basta. Come risultato, ho 307 barre di ingresso uniche che sono primarie per il segnale corrente. Di conseguenza, prendo queste 307 barre per il segnale attuale e vi aggiungo (il segnale) 307 barre dei 24 segnali precedenti. Il significato di questo decreto all'apparizione del segnale di presentare i dati al NS immediatamente per gli ultimi 24 segnali. Questa è la trasformazione che permette alla classificazione di guardare in profondità nella storia del segnale corrente. È essenzialmente un ritardo a 24 di profondità
2020.07.02 22:59
MA ho lasciato la parte più interessante per l'ultimo paragrafo: Sono sicuro che avete sentito parlare dell'addon vtreat per P. Quindi questa bestia esegue la pre-elaborazione dei dati identificando colonne significative per la variabile di uscita. Di regola dopo la sua elaborazione ci sono 130-180 colonne realmente significative. Ma il paradosso è che i valori attuali degli indicatori per il segnale attuale molto raramente rientrano in questo campione. Molto raramente. Lo stesso ritardo di 24 anni non è un ospite infrequente nel file post-elaborato. In altre parole, i valori degli indicatori che erano disponibili 24 ritardi fa sono critici per la funzione obiettivo. Fondamentalmente, l'idea è semplice come un 5 copechi. Salvate un campione abbastanza grande, poi moltiplicate le colonne per una cella di Excel e post-processatele. Questo è il profitto!


La citazione è completa:

La rete non può fare nulla da sola. Ciò che si dà come input è ciò che si ottiene come risultato. Non tutti i ritardi sono buoni come dimostra la pratica, e nel tuo set non c'è una sola colonna che aiuterebbe NS a ottenere in qualche modo un modello adeguato..... Buona fortuna!!!!!

Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
  • www.mql5.com
При создании графического объекта функцией ObjectCreate() необходимо указать тип создаваемого объекта, который может принимать одно из значений перечисления ENUM_OBJECT. Дальнейшие уточнения свойств созданного объекта возможно с помощью функций по работе с графическими объектами.
 

E se fatto correttamente, il modello funziona così.....


 
Valeriy Yastremskiy:

Sì, sbagliato) Apparentemente sono tutti glitch nel parsing, o sui dati letti.

È improbabile che la normalizzazione sia conveniente. La cosa buona è che abbiamo bisogno di dati di notizie d'archivio nel terminale, una capacità regolare di scaricarli e un servizio per lavorare con loro. Non credo che non ci siano archivi) Ma a giudicare dalla posizione dei creatori, finché gli utenti non diranno la loro parola, quello che vogliono, non inizierà, e se inizia, prima di tutto in una versione a pagamento).

Beh, sì, il calendario libero e buono non è quasi per niente possibile).

 
Aleksey Nikolayev:

Sì, beh, un calendario libero e buono è difficilmente possibile)

Sì, si può fare un calendario cattivo, lungo e preciso) nell'archivio) è un servizio di menta) su ora parsing da soli)
 
Mihail Marchukajtes:

Grazie, è interessante, non mi sarebbe venuto in mente di usare i segnali precedenti. Questo porta alla domanda: forse la rete è un collegamento inutile?

Questo è ciò che trovo la rete interessante, per non abbattere le caratteristiche. Altrimenti sarebbe più facile fare un sistema classico.

Dovrò preoccuparmi di più esperimenti, prenderò un numero molto grande di esempi del sistema sul polso, in modo che nell'addestramento non ci fosse una sola ripetizione e fosse possibile inserirla in un'epoca.