L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1517
Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Domanda 01.
I seguenti indicatori hanno solo un parametro di ingresso esterno
Ho scelto questi indicatori proprio per i parametri minimi di input esterni.
È possibile riprodurre i loro algoritmi con l'aiuto di metodi MO. Cioè, prendere qualsiasi storia, eseguire gli indicatori con qualsiasi parametro e darli in pasto al MO. È possibile ottenere l'algoritmo indicatore appropriato nell'output?
La domanda riguarda l'impostazione del compito per il MO, cioè dovremmo marcare la storia, penso che lo stesso PriceChannel sia facile da insegnare, ZZ potrebbe essere secondo in complessità ma Ekponential Smoothing - non è classificazione ma regressione, probabilmente, potrebbe essere lo stesso ma non ho lavorato con la regressione.
Domanda 03.
Ho incontrato queste situazioni nella pratica diverse volte. TS mostra il profitto sull'intervallo di prova. Quando eseguo OOS per più volte, mostra lo stesso profitto. Una volta che ho scommesso sul conto reale il profitto rimane lo stesso per diversi mesi.
E ad un certo momento il sistema che cade. Nessuna riottimizzazione della stessa ST non dà risultati positivi. Nel migliore dei casi rallenta il crollo.
Dopo un po' il programmatore capisce che tutto fa schifo e lascia l'account reale. Si osserva per diversi mesi come la TS sta perdendo nel tester.
E improvvisamente, due settimane di profitto, un mese di profitto, mese OOS - profitto. Questo è lo stesso TS. Lo metti sul reale e ottieni tutto come descritto nel primo paragrafo.
Questa non è una situazione ipotetica, ma un caso pratico. In questo caso la ST ha dimostrato la sua graalità solo su un piccolo numero di simboli. Su altri è stato un drenaggio per tutto l'anno.
E, naturalmente, il TS non ha bisogno di commerciare ventiquattro ore al giorno. Potrebbe esserci stato un intervallo di trading intraday.
In termini di pratiche comuni di applicazione del MO, è stato possibile ottenere una ST con caratteristiche simili?
Domanda 02.
Lasciamo che il TS con quattro parametri di input esegua migliaia di scambi su un certo intervallo. Aggiungiamo due parametri di input con un basso numero di varianti possibili come filtro. Nell'output abbiamo un grafico a linea retta con circa mille scambi. E tutti sono più o meno uniformemente distribuiti su tutta l'area di prova.
Qual è la ragione dell'alta probabilità di perdere il 5% dell'intervallo iniziale su OOS? Un intervallo enorme e solo sei ingressi hanno dato un up diretto su un numero davvero grande di scambi. E quello che è venuto fuori è stato un attacco a viso scoperto.
Significa che ci sono più di sei parametri? Una sorta di riferimento alla prima domanda, gli algoritmi che per noi sono semplici non sono in realtà complessi per natura?
E perché non dovrebbe esserci una prugna? Qual è la somiglianza nei dati storici - questa è una domanda separata per valutare la correttezza del modello.
E poi cosa è stato dato come input, come la storia è stata segnata per la formazione, cosa è stato insegnato - ci sono un sacco di sfumature qui.
Domanda 03.
Ho incontrato queste situazioni nella pratica diverse volte. TS mostra il profitto sull'intervallo di prova. Quando eseguo OOS per più volte, mostra lo stesso profitto. Una volta che ho scommesso sul conto reale il profitto rimane lo stesso per diversi mesi.
E ad un certo momento il sistema che cade. Nessuna riottimizzazione della stessa ST non dà risultati positivi. Nel migliore dei casi rallenta il crollo.
Dopo un po' il programmatore capisce che tutto fa schifo e lascia l'account reale. Si osserva per diversi mesi come la TS sta perdendo nel tester.
E improvvisamente, due settimane di profitto, un mese di profitto, mese OOS - profitto. Questo è lo stesso TS. Lo metti sul reale e ottieni tutto come descritto nel primo paragrafo.
Questa non è una situazione ipotetica, ma un caso pratico. In questo caso la ST ha dimostrato la sua graalità solo su un piccolo numero di simboli. Su altri è stato un drenaggio per tutto l'anno.
E, naturalmente, il TS non ha bisogno di commerciare ventiquattro ore al giorno. Potrebbe esserci stato un intervallo di trading intraday.
In termini di pratiche comuni di applicazione del MO, è stato possibile ottenere una ST con caratteristiche simili?
Quindi questa è di nuovo una domanda legata alle fasi del mercato e a ciò che il TS/modello MO ha imparato. Per esempio ho addestrato il modello su CatBoost - tutto bene sulla storia fuori dal training, l'ho messo sul reale e il silenzio per 3 mesi il modello era silenzioso - l'ho tolto e per l'ultimo mese attraverso i test vedo che ho perso un sacco di trade profittevoli (il mese scorso), ma poi apparentemente il modello stesso ha preso in considerazione qualcosa e non ha fatto trading, perché il mercato era davvero molto piatto, e il modello è impostato su trend (sui minuti).
Perché non dovrebbe esserci uno scarico? Qual è la somiglianza nei dati storici - questa è una domanda separata per valutare la correttezza del modello.
E poi, cosa è stato dato come input, come la storia è stata segnata per la formazione, cosa è stato insegnato - ci sono un sacco di sfumature qui.
Quale formazione? Un semplice Expert Advisor classico con sei parametri ottimizzabili. Il GA regolare mostra ottimi risultati sull'intervallo.
Non mi interessa la risposta "perché ti aspettavi che fallisse su OOS? E qual è la ragione per cui è ragionevole perdere su OOS anche con mille trade?
Il mio ragionamento amatoriale è il seguente.
Il TC ha pochissimi gradi di libertà. Quindi la probabilità di aggiustamento diminuisce.
Migliaia di scambi distribuiti uniformemente sull'intervallo - significa che il "pattern" di lunga durata su questo intervallo è stato rilevato. Soprattutto perché il grafico dell'equilibrio è quasi una linea retta.
Cosa c'è di sbagliato in questo ragionamento? Presumo che in realtà i parametri di input non siano sei, ma convenzionalmente un milione. Questo è il numero di parametri di ingresso della macchina universale che riproduce l'algoritmo TC. Cioè l'algoritmo stesso è un certo insieme di parametri di input.
Quale addestramento?! Un EA classico regolare con sei parametri ottimizzabili. Il GA regolare produce ottimi risultati sull'intervallo.
Non mi interessa la risposta "cosa ti aspettavi, certo che sto perdendo su OOS". E qual è il motivo per cui si perde su OOS anche con mille trade?
E qual è l'intervallo di apprendimento? 1000 trade possono essere su una tendenza globale dove l'apertura di posizioni sul suo vettore darà un vantaggio in sé.
Per esempio, alleno Si futures sulla storia di 5 anni per avere più situazioni diverse. Dal 2008 al 2016 ho ottimizzato gli EAs per il forex su 15 min, sono sufficientemente sopravvissuti per la media.
E in sostanza l'ottimizzazione è lo stesso metodo MO, quindi tutto ciò che è stato detto prima è vero.
Il mio ragionamento amatoriale è il seguente.
Ci sono pochissimi gradi di libertà in TC. Quindi la probabilità di aggiustamento diminuisce.
Migliaia di scambi distribuiti uniformemente sull'intervallo - significa che il "pattern" di lunga durata su questo intervallo è stato rilevato. Soprattutto perché il grafico dell'equilibrio è quasi una linea retta.
Perché non vuoi pensare a valutare la somiglianza dei mercati - io per esempio vedo che nel Forex la volatilità è scesa notevolmente negli ultimi anni, anche quest'anno - ero abituato a guadagnare 3-4 volte di più al mese, e ora proprio nessun movimento e nessun affare sul mio TS sul forex.
E poi, tutto deve essere guardato con obiettività, cercare di capire cosa fa il TS, se è davvero semplice e pensare se le sue azioni sono ragionevoli o se è una questione di caso.
Cosa c'è di veramente sbagliato in questo ragionamento?
Un ragionamento errato, perché presuppone la stazionarietà del mercato, che non è lo stesso...
Presumo che in realtà i parametri di input non siano sei, ma convenzionalmente un milione. Questo è il numero di parametri di ingresso della macchina universale che riproduce l'algoritmo TS. Cioè l'algoritmo stesso è un certo insieme di parametri di input.
Se stiamo parlando di indicatori, ci sono molti più parametri, perché dovremmo considerare la logica dell'indicatore stesso, quasi ogni if nel codice dell'indicatore come una condizione separata e questo, naturalmente, genererà un numero infinito di combinazioni. Tuttavia, personalmente penso che al contrario, l'uso di indicatori sia un approccio sensato, perché presumo che molti partecipanti al mercato li usino, il che significa che c'è una probabilità di catturare un po' della logica del TS di un partecipante con il denaro.
Domanda 01.
I seguenti indicatori hanno solo un parametro di ingresso esterno
Ho scelto questi indicatori proprio per i parametri minimi di input esterni.
È possibile riprodurre i loro algoritmi con l'aiuto di metodi MO. Cioè, prendere qualsiasi storia, eseguire gli indicatori con qualsiasi parametro e darli in pasto al MO. È possibile ottenere l'algoritmo dell'indicatore corrispondente nell'uscita?
Lo smoothing tipo EMA può essere ottenuto esattamente, spero che tu intenda il risultato e non l'"algoritmo" sotto forma di codice :)
Non sono così sicuro di PriceChannel e ZZ, sono sicuro che saranno imperfetti. In generale, il compito è interessante, grazie:)
Domanda 02.
Supponiamo che il TS con quattro parametri di input su un certo intervallo esegua migliaia di operazioni. Aggiungere come filtro due parametri di input con un basso numero di varianti possibili. L'output sarà un grafico a linea retta con circa mille scambi. E tutti sono più o meno uniformemente distribuiti su tutta l'area di prova.
Qual è la ragione dell'alta probabilità di perdere il 5% dell'intervallo iniziale su OOS? Un intervallo enorme e solo sei ingressi hanno dato un up diretto su un numero davvero grande di scambi. E quello che è venuto fuori è stato un attacco a viso scoperto.
Significa che ci sono più di sei parametri? È una specie di riferimento alla prima domanda- gli algoritmi semplici non sono complicati per loro natura?
È più una questione di tipo di algoritmo di strategia e di MM che di previsione. Se non sapete che tipo di errore potete incontrare nella vostra stima, potete calcolare la probabilità di errore usando uno dei parametri, potete calcolare il valore massimo della previsione matematica.
Domanda 03.
Ho affrontato tali situazioni diverse volte nella pratica. Il TS mostra il profitto sull'intervallo di prova. Quando si apre OOS per diverse volte di più, il profitto rimane lo stesso. Scommetti su un conto reale e mostra lo stesso profitto per diversi mesi.
E ad un certo momento il sistema che cade. Nessuna riottimizzazione della stessa ST non dà risultati positivi. Nel migliore dei casi rallenta il crollo.
Dopo un po' il programmatore capisce che tutto fa schifo e lascia l'account reale. Si osserva per diversi mesi come la TS sta perdendo nel tester.
E improvvisamente, due settimane di profitto, un mese di profitto, mese OOS - profitto. Questo è lo stesso TS. Lo metti sul reale e ottieni tutto come descritto nel primo paragrafo.
Questa non è una situazione ipotetica, ma un caso pratico. In questo caso la ST ha dimostrato la sua graalità solo su un piccolo numero di simboli. Su altri è stato un drenaggio per tutto l'anno.
E, naturalmente, il TS non ha bisogno di commerciare ventiquattro ore al giorno. Potrebbe esserci stato un intervallo di trading intraday.
In termini di pratiche comuni di applicazione del MO, è stato possibile ottenere una ST con tali caratteristiche?
Non credo che nessuno possa commentare tali caratteristiche "con le mani sul cuore". In generale non si dovrebbe pensare di usare MoD come una cosa separata, MoD è solo un'estensione della statistica, un algoritmo generale è MoD, anche l'ottimizzazione delle mesh è MoD, quindi c'è sempre stato MoD nel trading algoritmico:)
C'è la tendenza dei pigri a sperare nella completa automatizzazione della ricerca di TC e lasciare che IR faccia tutto per loro, per fortuna non succederà per molto tempo, e quando succederà non avrà senso economico, ma nel frattempo IR classico è brutto cercare segni sensati e "profondo" è molto capriccioso in tutti gli aspetti, lavorarci è doloroso e i risultati sono nebulosi.
Il mio ragionamento amatoriale è così.
Ci sono pochissimi gradi di libertà nel TC. Quindi la probabilità di adattamento cade.
Migliaia di scambi distribuiti uniformemente sull'intervallo - significa che il "modello" di lungo periodo su questo intervallo è rivelato. Soprattutto perché il grafico dell'equilibrio è quasi una linea retta.
Cosa c'è di sbagliato in questo ragionamento? Presumo che in realtà i parametri di input non siano sei, ma convenzionalmente un milione. Questo è il numero di parametri di ingresso della macchina universale che riproduce l'algoritmo TC. Cioè l'algoritmo stesso è un insieme di parametri di input.
Ciò che è sbagliato è che quando si stima una serie temporale (non importa se è un prezzo, una sequenza di lanci di dadi o numeri della "ruota della fortuna"... o anche un grafico di temperatura)
Voi (e noi tutti partecipanti di questo forum) supponiamo che la serie temporale debba comportarsi in futuro in questo modo - ci abbiamo provato! Sfortunatamente il fit è sempre presente, e più usiamo i dati di input, maggiore è il fit e la nostra fiducia
leggi la prima parte dell'articolo sull'hubrahttps://habr.com/ru/company/ods/blog/322716/
prima del grafico
mi è piaciuta molto la presentazione
bene e riguardo alla tua domanda con MO, il mio ragionamento da dilettante:
problema di preparare i dati di input per la formazione, con ZigZag in generale un problema - la cosa più semplice è alimentare i prezzi di ZZ kinks - formati, testati - non funziona, perché? - perché è strettamente legato a dati specifici, non ci sono tali prezzi in futuro, NS è un polinomio regolare y = ax+bx+cx+dx+ex..... il numero di polinomi è il numero di neuroni, più neuroni, la migliore qualità (errore NS), ma più veloce ri-formazione si verifica.... l'overlearning si combatte inventando nuovi tipi di NS, ma ci sono anche dove è meglio dove è peggio....
ma con le funzioni periodiche NS funzionerà, infatti, perfettamente - un grafico di seno/coseno a qualsiasi scala e con dati minimi per l'apprendimento - perché tali funzioni possono essere scritte usando l'espansione in serie di Taylor? (non riesco già a ricordare) - e sarebbero cinque polinomi y = ax+bx+cx+dx+ex
ZS: con le serie di prezzi nessuno è riuscito a inventare una formula polinomiale - ecco perché NS non funziona perfettamente... Forse solo una formula non esiste )))
È più una questione di tipo di algoritmo di strategia e di MM che di previsione. Direi che la maggior parte dei graal dei tester sono reversibili con la media e a volte seduti troppo a lungo, utilizzando tali configurazioni è molto facile ottenere un "graal" con un parametro, si dovrebbe rimuovere la media per ottenere un quadro più oggettivo, anche se non è sufficiente, IMHO l'aspettativa delle previsioni dovrebbe essere misurata correttamente (tendenze/giri), perché si può barare molto non solo gli altri ma anche se stessi.
Stasera stavo girando qualcosa. Come risposta non quotata, penso che sarà interessante da leggere per gli altri.
https://www.mql5.com/ru/blogs/post/728196
1. Sì, con una certa precisione (errore di approssimazione)
2. Prendi un polinomio di 3° grado (solo 3 termini liberi) e adattalo a un pezzo di grafico lungo un chilometro. Significa che funzionerà sull'OOS? Certo che no. Le curve inizieranno a divergere quasi immediatamente, ma a volte si può essere fortunati con la direzione. Se il modello è sconosciuto (teoricamente, concettualmente, fondamentalmente - qualunque cosa) che viene sfruttato, allora la domanda può essere respinta, in quanto è sempre una misura per SB
3. in termini di MoD si può ottenere tutto ciò che si vuole. Fondamentalmente queste trame saranno con certe tendenze, se sono simili allora funzionerà. Cioè in questo caso è la tendenza globale che cambia, molto probabilmente, o di nuovo il mercato diventa simile a quello che era, a medio termine. Ecco perché funziona/non funziona.
Tutti questi problemi sono risolti in econometria a livello concettuale: la tendenza lineare è la componente principale, è prevista per prima. Poi fluttuazioni non lineari intorno al bastone dritto, a condizione che la tendenza persista. La tendenza più grande non può essere prevista a causa della mancanza di iterazione, cioè tutta l'incertezza sarà dal piano a lungo termine. Solo alcuni termini liberi, di solito non più di 3, descrivono qualsiasi curva di mercato. Il MOS può già essere adattato ai residui di ciò che è rimasto imprevisto.