L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2837

 

Inoltre, perché si introducono le derivate di una funzione per risolvere problemi come l'esempio precedente? Per rendere la superficie della funzione più liscia.

Un altro esempio, abbastanza vicino alla pratica. c'è un problema con 10 domande, la rete deve rispondere a 10 domande. contiamo il numero di risposte. il massimo in questo caso sarà 10. cioè, la funzione di questo problema è discreta. con molti estremi locali. perché? guardiamo qui:

Contiamo le risposte giuste e sbagliate. 0 è sbagliato, 1 è giusto.

0 1 1 0 0 0 0 0 0 1 0 0 1 : 4 corrette.

1 1 1 0 0 0 0 0 0 0 0 1 : 4 corrette.

0 1 0 1 0 1 0 0 0 1 1 0 0 : 4 corretto.

0 0 0 0 0 0 1 0 0 0 1 1 : 4 corretto

0 1 1 1 1 0 0 0 0 0 0 0 0 0 : 4 corretto

.......................................

vediamo che la rete fornisce scelte di risposta con un punteggio di 4. Questo è un esempio di come la rete sia bloccata. non vede un'ulteriore crescita. rimescolando le risposte non si possono ottenere più punti.

Come rendere la rete più efficiente? Per farlo, la funzione di risposta originale viene convertita in una funzione di errore. in questo modo, minimizzando l'errore totale su tutte le risposte, la rete troverà tutte le risposte corrette. in questo caso, il problema si riduce alla minimizzazione dell'errore, il minimo è lo 0 globale, la funzione ha molti estremi, ma ora è liscia, il gioco si riduce a freddo, più caldo, caldo, caldo, che è molto più "liscio" del semplice sì o no.

Purtroppo, però, non sempre è possibile trasformare la funzione problematica in una funzione liscia. le funzioni presentate negli articoli e devono essere considerate come già trasformate, mentre quelle originali hanno una topografia molto più complessa. l'efficienza degli algoritmi di ottimizzazione risiede quindi nella capacità di trovare l'estremo della derivata della funzione.

 

Se fossi su un altro sito, allora non ci sarebbe nulla di sorprendente, ma discutere degli estremi con persone che hanno visto milioni di risultati di tester - è impossibile trovare le parole. Un'idea è che siano divorziati.

Ancora una volta: non ci sono estremi! No, li vediamo, anche ordinati per profitto o altro, ma non ci sono estremi. Così come non c'è un'aquila su una moneta caduta con l'aquila verso l'alto, perché non è un'aquila, ma la probabilità di un'aquila. Tutti gli estremi sono probabilità di estremi. Si potrebbe parlare del valore di un estremo nel senso dell'aspettativa matematica e dell'intervallo di confidenza, ma è impossibile parlarne, perché non c'è un'aspettativa matematica perché il valore dell'estremo non è stazionario!


L'avete visto milioni di volte: quando ottimizzate un Expert Advisor su un intervallo, ottenete una serie di parametri con una serie di risultati ottimali. Se si prende un altro intervallo, spesso semplicemente aumentandolo, si ottiene un'altra serie di parametri con risultati diversi e si può avere una perdita. Cosa? Nessuno di voi ha visto questo? E non ha nulla a che fare con l'algoritmo di ottimizzazione. Si può fare genetica, si può completare il sovracampionamento, che può migliorare la genetica, ma al di fuori del campione di ottimizzazione il risultato sarà uno, molto probabilmente triste.

 
СанСаныч Фоменко #:

L'avrete visto milioni di volte: quando si ottimizza un Expert Advisor su un intervallo, si ottiene una serie di parametri con una serie di risultati ottimali. Se si prende un altro intervallo, spesso semplicemente aumentandolo, si ottiene un'altra serie di parametri con risultati diversi e si può ottenere una perdita. Cosa? Nessuno di voi ha visto questo? E non ha nulla a che fare con l'algoritmo di ottimizzazione. Si può fare genetica, si può completare il sovracampionamento, che può migliorare la genetica, ma al di fuori del campione di ottimizzazione il risultato sarà uno, molto probabilmente triste.

questo è un esempio di come fare inutile))) quindi idea sbagliata di quali estremi stiamo parlando.

Questo è un esempio con risposte a griglia. riducete il problema dell'ottimizzazione non alla risposta sintetica "massimo saldo", ma ad esempio alla deviazione quadratica dalla differenza diretta dei saldi di ogni operazione. questo è un esempio di come convertire il problema originale in una derivata. il risultato sarà una funzione liscia, non discreta in termini di saldo. il saldo finale che avrete è come 10 nel mio esempio.

 
Andrey Dik gruppo di varianti di percorso con caratteristiche simili di angolo*lunghezza che soddisfano i requisiti di sicurezza.

È così, in generale. Non tutti gli algoritmi sono in grado di trovare una strada "sicura". sia le proprietà di ricerca che la convergenza e la velocità di convergenza sono importanti.

Nel caso più semplice si tratterà di una curva a spirale intorno alla montagna che sale verso la cima. è ovvio che, poiché la montagna non è liscia, esistono almeno diverse varianti di costruzione della strada - si tratta di un plateau di soluzioni che soddisfano determinati criteri, e non di un plateau sotto forma di un'area da qualche parte sulla superficie della montagna. un plateau sulla montagna non è una soluzione ottimale. un plateau di soluzioni è una soluzione ottimale.

A proposito, tester ha un criterio di ottimizzazione complesso, è una funzione più fluida rispetto al semplice equilibrio, al fattore di profitto e ad altri criteri separatamente. è ancora possibile creare un criterio personalizzato, cercando di rendere più fluida la funzione di ottimizzazione.

 

https://habr.com/ru/post/318970/

Gli algoritmi specifici per l'apprendimento delle reti sono diversi dagli algoritmi generici, più interessante sarà fare test comparativi tra entrambi.
Методы оптимизации нейронных сетей
Методы оптимизации нейронных сетей
  • 2017.01.04
  • habr.com
В подавляющем большинстве источников информации о нейронных сетях под «а теперь давайте обучим нашу сеть» понимается «скормим целевую функцию оптимизатору» лишь с минимальной настройкой скорости обучения. Иногда говорится, что обновлять веса сети можно не только стохастическим градиентным спуском, но безо всякого объяснения, чем же...
 
Il criterio di complessità è stato rimosso nelle ultime versioni per qualche motivo :)
 
СанСаныч Фоменко #:

Ancora una volta: gli estremi non hanno alcun valore: un punto instabile, che tra l'altro non esiste, dato che abbiamo a che fare con processi casuali e per di più non stazionari.

Dobbiamo cercare un plateau, anche quello mostrato in figura, purché sia redditizio, anche se si trova al di sopra del minimo locale e globale. Tale plateau mostrerà teoricamente il limite superiore di redditività del TS. E gli estremi trovati non sono affatto nulla: non sono sicuramente nel futuro, ma c'è speranza per un plateau.

Questo èesattamente ciò che sto cercando di realizzare, solo a un livello più tecnico....

Al posto di un plateau ho un segnale reale, al posto di un estremo ho del rumore...

Se diamo per scontato che la superficie di ottimizzazione è rumorosa, allora dobbiamo evitare il rumore e cercare gli estremi reali, che dovrebbero essere molto più robusti ai nuovi dati.... Perché logicamente un segnale lento cambia più lentamente nel tempo rispetto a un rumore veloce.

 
Maxim Dmitrievsky #:
Il criterio complesso è stato rimosso per qualche motivo nelle ultime versioni :)

sembra esserci)))


 
Evgeni Gavrilovi #:

Infine, ha una propria funzione di perdita, la derivata, rappresentata come prodotto di Sharpe, errore e pesi.

is_max_optimal=False indica che il valore è decrescente, ma poiché ho anche moltiplicato per -1, è vero il contrario.

C'è un modo per alimentare il bilanciamento o qualcos'altro attraverso il gradiente nel boost.....


Ecco lo schema:

contrassegniamo il grafico con trade perfetti (all'estremo in basso compriamo, all'estremo in alto vendiamo) e creiamo un falso trade perfetto.

Lo chiamerò equilibrio perfetto


Calcoliamo quindi la bilancia commerciale a partire dalla spinta

poi nella funzione obiettivo calcoliamo semplicemente l'errore della bilancia commerciale del boost con la bilancia ideale.

sqrt(sum((баланс буста - идеальный баланс) ^ 2)

otteniamo un aggiustamento dell'equilibrio ideale, cioè non si tratta della ricerca di un massimo di profitto astratto, ma di un aggiustamento del commercio ideale espresso nell'equilibrio dei profitti.


Il blu è l'equilibrio ideale, il nero è una traccia e un test del modello.

 
Andrey Dik #:

Credo di sì).

Ah, ora si presenta così