L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3083

 
Maxim Dmitrievsky #:

Per trasformare i parametri di disturbo in funzioni, si possono utilizzare i valori di uscita di RF o di qualsiasi algoritmo di base, come nell'articolo. Per i non informati: sostituire i valori dei parametri selezionati con i valori delle funzioni. A quel punto la regressione lineare (o qualsiasi altro algoritmo) sarà il meta-lerner attraverso cui valutare l'effetto del tritolo. Perché e come funziona tutto questo: imparate la matematica.

Per capirlo, è sufficiente iniziare a pensare con la propria testa. Ma Sanych ricomincerà a dire sciocchezze, perché vuole solo dire qualcosa senza pensare. Sanych, la tua mancanza di comprensione è così grande che citi i parametri RF come una sorta di prova, il che è assolutamente incredibile. Te l'ho scritto tre volte: lascia perdere la radiofrequenza. Per l'ultima volta: studia l'argomento, poi sproloquia. Altrimenti le stesse persone non istruite ti crederanno ciecamente.

E non risponda ai miei post con l'aplomb di chi sa tutto (che è fastidioso), perché non sa nulla e sembra il vaneggiamento di un ptuschnik.

Tutti i riferimenti alle fonti sono riportati nell'articolo. Avete bisogno di essere punzecchiati ad ogni parola come gattini ciechi? O siete adulti, dopotutto?

Stavo discutendo dell'articolo, non della cifra che avete in tasca e che, a mio avviso, è molto alta, stando all'elenco della letteratura a cui fate riferimento.

Se hai un desiderio così ardente di continuare la discussione sull'articolo che hai postato, allora sono pronto a continuare, ma: solo l'articolo e solo i miei argomenti, e in una forma che escluda la maleducazione proibitiva da parte tua.


L'articolo parlava di RF. Non ho visto altre funzioni che calcolassero l'errore di adattamento e l'adattamento stesso. Quindi, per favore, sia così gentile da prendere il testo dell'articolo e fornire una citazione specifica che confuti questa idea.

 
Lilita Bogachkova #:

Ho una domanda per gli esperti di apprendimento automatico. Se utilizzo i dati di un personaggio per l'addestramento, i dati di un altro personaggio per la convalida e i dati di un terzo personaggio per il test, è una buona pratica?

Inoltre, dai dati di test ottengo i seguenti risultati: le celle verdi sono molto buone, quelle gialle sono buone, quelle rosse sono medie.


Ho anche una domanda sulla modifica dei dati per addestrare il modello. Ho notato che il modello ha difficoltà a trovare gli estremi, nel mio caso valori superiori a 60 e inferiori a 40.
Quindi trovo valori superiori a 60 e inferiori a 40 nei dati di addestramento, che aggiungo nuovamente ai dati di addestramento prima di inserirli nel modello, quindi la domanda è: posso migliorare la precisione del modello aumentando i dati di addestramento contenenti informazioni sugli estremi?

Se non si riesce a capire la differenza tra gli strumenti, si può farlo. Oppure portarli forzatamente a tale stato sottraendo la differenza.

Per quanto riguarda la seconda domanda, probabilmente non è possibile. Sarà più sbagliato in altri punti, perché tirerà il gradiente verso di sé. Ma è tutto individuale.
 
Maxim Dmitrievsky #:
Se non riuscite a distinguere gli strumenti, potete farlo. Oppure costringerli a questo stato sottraendo la differenza.

Per quanto riguarda la seconda domanda, no, probabilmente non è possibile. Sarà più sbagliato in altri punti, perché tirerà il gradiente verso di sé.

Al momento sembra proprio così.


Tuttavia, prima di abbandonare l'idea, vedrò cosa otterrò addestrando il modello mescolando insieme diversi strumenti (simboli) e creando dati contenenti solo valori estremi.

 
Lilita Bogachkova #:

A questo punto, la situazione è davvero questa.


Tuttavia, prima di abbandonare l'idea, vedrò cosa si ottiene addestrando il modello mescolando insieme diversi strumenti (caratteri) e creando dati contenenti solo valori estremi.

Fate una prova. Non ho notato alcuna differenza tra uno e più di uno.
 
Maxim Dmitrievsky #:
Se non riuscite a distinguere gli strumenti, potete farlo. O forzarli a questo stato sottraendo la differenza.

La pratica con simboli diversi per l'addestramento, la convalida e il test consente oggi di migliorare l'accuratezza della previsione. Un vantaggio di questa pratica è che non c'è limite alla dimensione dei dati: se ne possono fornire quanti se ne vogliono o sono necessari per la convalida o l'addestramento.

Quando si esegue il test con un terzo simbolo, è possibile vedere immediatamente se il modello è in grado di trovare modelli universali, piuttosto che rimanere intrappolati in eventi di mercato ristretti e specifici di un particolare simbolo.

 
Lilita Bogachkova #:

La pratica di utilizzare simboli diversi per l'addestramento, la convalida e il test consente oggi di migliorare l'accuratezza della previsione. Come punto a favore di questa pratica posso citare il fatto che non c'è limite alla dimensione dei dati, si possono fornire tutti quelli che si desiderano o di cui si ha bisogno per la convalida o l'addestramento.

Quando si esegue il test con il terzo simbolo, è possibile vedere immediatamente se il modello è in grado di trovare modelli universali piuttosto che essere guidato da eventi di mercato ristretti.

Se i dati non presentano grandi distorsioni. Simboli diversi hanno una diversa dispersione dei segni e il modello può andare alla deriva su di essi o rimanere fermo su una posizione. Se almeno i segni non cambiano le loro proprietà da simbolo a simbolo, è possibile.
 
Vorrei sentire le opinioni su come correggere i dati di allenamento rimuovendo i valori che si ripetono più volte di seguito, come ad esempio i valori che si ripetono più di 4 volte di seguito.
seq = remove_repeating_values(seq, 5)
Per quanto ne so, tali valori uguali tendono a raggiungere diverse decine in caso di mercato piatto. Il che, a mio parere, ostacola l'addestramento del modello.
 
Lilita Bogachkova #:
Vorrei sentire le opinioni su come correggere i dati di allenamento eliminando i valori che si ripetono più volte di seguito, come ad esempio i valori che si ripetono più di 4 volte di seguito.
Per quanto ne so, tali valori uguali tendono a raggiungere diverse decine in caso di mercato piatto. A mio parere, questo ostacola l'addestramento del modello.
Di solito i modelli estraggono i valori in modo casuale, non in fila. E mescolare il campione è un segno di buon giudizio :) L'lstm può essere scartato e i campioni possono essere mescolati.
 
Maxim Dmitrievsky #:
Di solito i modelli randomizzano i valori, non in fila.

Sì,

X_train, X_val, y_train, y_val = train_test_split(inputs_unique, outputs_unique, test_size=test_size_value,
                                                    random_state=random_state_value)

ma il gran numero di valori uguali mi fa dubitare della qualità complessiva dei dati.
Esempio: seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5,5,5,5,5,5,5][5]....
Non vedo il motivo di fornire al modello tali dati di addestramento;

Quindi sto ancora setacciando tutti i dati che non sono unici.

inputs_unique, indices = np.unique(inputs, axis=0, return_index=True)
outputs_unique = outputs[indices]

Potrei sbagliarmi, ma mi sembra sbagliato fornire al modello anche i seguenti dati di addestramento:

[1,2,3,4,5] [5];

[1,2,3,4,5] [6];

[1,2,3,4,5] [7];

[1,2,3,4,5] [8];

...

 

Salve a tutti. Sto cercando di addestrare degli Expert Advisor tratti da una nutrita serie di articoli sulle reti neurali presenti su questo sito. Ho l'impressione che non siano addestrabili. Ho provato a fare domande all'autore sotto gli articoli, ma purtroppo non risponde in modo pratico...(

Di conseguenza, una domanda ai membri del forum - per favore ditemi quanto allenare una rete neurale in modo che inizi a dare qualche risultato (non casuale)?

Ho provato tutti gli EA dall'articolo 27 all'ultimo - il risultato è lo stesso - casuale. Sono passato da 300 a 1000 epoche di allenamento, come indicato dall'autore. Se l'Expert Advisor è solo con le iterazioni, ho fatto da 100 000 a 20 000 000 iterazioni e così via per 2-3 approcci, sempre casuali.

Quanto dovrebbe essere allenato? Qual è la dimensione di un campione di allenamento sufficiente (se è precostituito)?

PS: Informazioni semplici sulle reti neurali in google read, in generale con le reti neurali sono familiari. Tutti scrivono circa 100-200 epoche e ci dovrebbe essere già un risultato (su immagini, figure, classificazioni).