Rete neurale - pagina 5

 
gpwr писал(а) >> Non ci capiamo.

In effetti, avete scritto tutto correttamente. Siamo solo in disaccordo sulle definizioni.

gpwr ha scritto (a) >> Tutti i libri di testo dicono che l'addestramento di una rete con un insegnante è fatto dividendo i dati in un campione di allenamento e un campione di test. La rete impara minimizzando l'errore sul campione di allenamento mentre osserva l'errore sul campione di prova (test o verifica fuori campione). L'apprendimento si ferma quando l'errore sul campione di prova smette di diminuire (mostrato con una linea tratteggiata sotto). E l'errore sul campione di allenamento può continuare a diminuire come mostrato in questa figura

Con tutta questa ricerca molte persone dimenticano la cosa più importante: il profitto. Ecco perché c'è un "ma" che non è scritto nei libri di testo. È che raggiungere il minimo errore su OOS non garantisce il profitto. Perché? Perché l'errore minimo e il profitto sono due cose diverse. Potrebbero non essere in alcun modo collegati. Perché? Perché la rete non ha bisogno di ripetere il mercato sull'OOS e reale - è sufficiente in certi momenti per dare i corretti segnali di acquisto o vendita - cioè superare una certa soglia di trigger. Tra questi momenti (segnali) la rete può comportarsi come vuole - l'importante è non superare questa soglia. Ecco perché con un grande errore sull'OOS il profitto può essere grande.

muallch ha scritto >>.

All'inizio c'è un out-of-sample - per impostare la rete. E poi non ci sarà più - il vero futuro è davanti, bisogna prevederlo. Qual è il criterio per fermare l'addestramento - un certo errore o il numero di corse di addestramento? O qualcos'altro?

E naturalmente la questione del futuro è decisamente aperta, perché anche l'OOS è un futuro conosciuto dove possiamo controllare il profitto, mentre stiamo facendo trading in un futuro che ci è sconosciuto e la cosa principale lì non è ottenere il minimo errore, ma ottenere il massimo profitto. E che tipo di errore ci sarà - non importa.
 
muallch писал(а) >>

Prima c'è l'out-of-sample - per impostare la griglia. E poi non c'è nessun out-of-sample - il vero futuro è davanti a noi e deve essere previsto. Qual è il criterio per fermare l'addestramento - un certo errore o il numero di corse di addestramento? O qualcos'altro?

Per esempio 100 epoche senza aggiornare l'errore minimo sul campione di controllo.

 
LeoV писал(а) >>

E naturalmente la questione del futuro è decisamente aperta, perché anche l'OOS è un futuro conosciuto dove possiamo controllare il profitto, mentre stiamo facendo trading in un futuro che ci è sconosciuto e la cosa principale lì non è ottenere il minimo errore, ma ottenere il massimo profitto. Che tipo di errore sarà - non importa.

Si può pensare in questo modo, dato che non si sono mai avuti risultati veramente stabili. L'errore e il profitto sono correlati, in linea di principio per ogni compito è possibile determinare quale errore deve essere raggiunto per ottenere un TC accettabile...
 
StatBars писал(а) >>
Probabilmente la pensi così perché non hai mai avuto risultati veramente stabili. L'errore e il profitto sono correlati, in linea di principio per ogni compito si può definire quale errore è necessario raggiungere per ottenere prestazioni accettabili di TC...

Cosa significa per te "risultati davvero stabili"?

 
StatBars писал(а) >> L'errore e il profitto sono correlati

Possono o non possono essere collegati - questa è la grande domanda. Ma è certo che il minimo errore su OOS non significa e non porta al massimo profitto sul conto reale. Così come il massimo profitto sul conto reale non significa il minimo errore su di esso.

 
gpwr >> :

Lei ha frainteso l'essenza del mio ragionamento. Non ho parlato della relazione tra una rete "non addestrata" e i risultati del trading. È scritto ovunque che la rete deve essere addestrata fino a quando l'errore nel campione in esame cessa di diminuire. Sono d'accordo con questo e non voglio discuterne. L'essenza del mio ragionamento era di mostrare come una struttura di rete parallela porta a difficoltà nella sua ottimizzazione e come un modello non lineare basato su una serie di potenza è in grado di raggiungere lo stesso obiettivo di una rete neurale, ma con un apparato matematico molto più semplice e un processo di apprendimento veloce che porta a un risultato unico.

Eh, quante opinioni sono state espresse qui ;-). Aggiungerò i miei 5 kopeck.

Anche lei mi ha frainteso. Non volevo dire che la rete è "non addestrata". Intendevo dire che non bisogna aspettarsi miracoli dalla rete. Non è una panacea e se darà una percentuale di vittoria, è molto piccola, ed è per questo che abbiamo bisogno di comitati. La configurazione della rete per il comitato e la struttura dei dati di input/output può essere ricercata a lungo e duramente. Imho, sei stato troppo veloce a scontare le griglie, senza effettivamente provare nemmeno il 10% di ciò che sarebbe stato utile (solo a giudicare dal tempo in cui hai iniziato a lavorare direttamente sul tuo progetto). In virtù del tuo background matematico, hai delle opzioni su cosa provare a sostituire la griglia ;-). Siete invitati a provare. Ma mi sembra che criticando la griglia si stia concentrando l'attenzione sui punti sbagliati. In particolare, che differenza fa quale sinapsi impara a quale fattore di input in una particolare istanza della rete? Hai bisogno di saperlo? Non lo fa davvero. Questa incertezza intrinseca della griglia di distribuzione del segnale attraverso i neuroni si suppone che sia "by design". Ma se formate una dozzina di maglie e le rendete sottili, vedrete che lo schema delle connessioni - la serie molto non lineare che avete menzionato - si è formato da solo, ed è vicino o uguale a uno e lo stesso. Se stai facendo un analogico manuale, come matematico sai quali metodi usare e quanto sono laboriosi, al fine di rivelare le dipendenze rivelate dalla rete nel flusso di dati e solo dopo aver rivelato queste dipendenze puoi creare la tua serie di potenza.

Quello che vorrei dire sui comitati è che non sono scelti sul semplice principio di N reti, ma solo, diciamo, le prime 10 reti sulle cento ricevute. Se continuiamo con l'esempio delle riunioni di persone, solo coloro che sono più o meno capaci di ascoltarsi saranno ascoltati. Inoltre, avete apparentemente dimenticato che abbiamo più di 2 risultati. Sono infatti: successo, insuccesso, perdita, fallimento. Quindi, la probabilità deve essere calcolata (semplifico intenzionalmente): no-loss(1)*no-loss(2)=0.4*0.4=0.02. Cioè la configurazione migliore non è quella con la massima probabilità di profitto, ma quella con la minima probabilità di perdita. Per analogia, guardiamo il rapporto di drawdown. Non ha senso prendere impostazioni super redditizie, se il drawdown per loro è già del 50%, perché praticamente garantisce una perdita.

 

Di nuovo.

joo писал(а) >>

Con un insegnante, è possibile allenare una griglia solo su una funzione che già conosciamo, come un'onda sinusoidale. Qui, possiamo, in buona coscienza, alimentare la rete al punto successivo per essere addestrato come insegnante.

del punto addestrato come insegnante. Questo non funzionerà sul mercato.


Perché sappiamo sempre in anticipo quale punto sarà il prossimo sulla sinusoide. Conosciamo il futuro dell'onda sinusoidale!

Quindi è valido insegnare su dati storici (sinusoidali), cioè insegnare con un insegnante.

Ma non conosciamo il futuro del mercato, quindi insegnare con un insegnante diventa un processo inutile.

 
LeoV писал(а) >>

Cosa significa per te "risultati davvero stabili"?

Per esempio un Expert Advisor è ottimizzato su 2 mesi di storia con solo 3 parametri, l'80% dei risultati positivi sono redditizi su tutta la storia.

È lo stesso con le reti...

 
LeoV писал(а) >>

Possono o non possono essere collegati - questa è la grande domanda. Ma è certo che il minimo errore su OOS non significa e non porta al massimo profitto sul conto reale. Inoltre, il massimo profitto sul conto reale non significa un errore minimo su di esso.

Generalmente si parla di stabilità dei risultati, non di errore, se la rete riconosce o predice stabilmente qualcosa e questa previsione è sufficiente per il profitto, avremo un profitto sia in avanti che reale.

Se l'errore è soddisfacentemente piccolo, allora conduce. Cosa significa "in modo soddisfacente"? Per ogni problema questa condizione è impostata separatamente, conosco solo il modo empirico.

 
joo писал(а) >>

Lo dirò di nuovo.

Perché sappiamo sempre in anticipo quale sarà il prossimo punto della sinusoide. Conosciamo il futuro dell'onda sinusoidale!

Ecco perché è legittimo allenarsi su dati storici (sinusoidali), cioè insegnare con un insegnante.

Ma non conosciamo il futuro del mercato, ed è per questo che imparare con un insegnante è un processo inutile.

Se conosciamo l'onda sinusoidale e quindi possiamo prevederla con le reti, allora create una formula più complessa, la notazione analitica vi sarà nota, quindi possiamo prevederla anche noi. Il mercato è la stessa formula, solo ancora più complicato e non è noto a NOI...