L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 388

 
Maxim Dmitrievsky:


Ho già dei predittori, per quanto possa sembrare strano. Ho un bot già pronto, che ho costruito in meno di un mese. La cosa più importante sono i predittori, è fuori questione, sì. Beh, è chi ha esperienza in cosa... Per esempio, con la mia immaginazione infiammata i predittori possono essere raccolti in poco tempo, ho lavorato come analista per 5 anni :) Secondo me, la selezione dei predittori non è un compito così difficile come studiare le architetture NS, la cosa principale è sedersi e selezionare, ci vogliono 2-3 settimane :)



E in numeri?

Sul campione di allenamento, sul campione di prova e sul campione di convalida.

Soprattutto: su un nuovo file che era originariamente separato dai tre precedenti.

Tutti questi quattro valori non dovrebbero differire troppo l'uno dall'altro. Se differiscono di più del 10% di errore (30% di deviazione e 35% di deviazione, per esempio), allora scartalo.


E quello che ho sul conto reale non ha alcuna importanza - i segnali muoiono dopo un anno o anche dopo due anni.

 
SanSanych Fomenko:

Che dire del fatto che gli incrementi non indicano in alcun modo le tendenze?

Sì, lo fanno.

O il modello predice l'incremento o la direzione - è a questo che servono i modelli di classificazione.

Non sono a conoscenza di alcun modello di classificazione che riconosca i movimenti sulle notizie. E per GARCH questo è il punto del modello - per elaborare il movimento avvenuto. Code grasse - questo è il movimento sulle notizie quando le tendenze si rompono e si verificano brusche inversioni.


Bene, potete osservare l'aumento su diversi timeframe.

Ci sono interessanti modelli GARCH per diversi timeframe. Il significato è il seguente.

Supponiamo di prevedere l'incremento su H1. Il modello richiede dati di input che caratterizzano la distribuzione. Come dati di input (di solito la volatilità) non prendiamo l'ora precedente, ma i minuti dell'ora corrente.

Secondo me, è importante dividere l'intera storia in intervalli con lo stesso comportamento. Per esempio, ecco un'immagine del prezzo di chiusura di EURUSD per 5 anni, si può vedere che c'era una tendenza fino a circa 2Q14, poi il resto del 14 e l'inizio del 15 è un'altra, e dopo che la terza è iniziata e sta ancora andando avanti. Cercare di ottenere la temperatura media in ospedale e usarla per diagnosticare le condizioni di un singolo paziente è sbagliato, imho.


Se prendiamo, per esempio, la tendenza attuale da qualche parte dall'inizio del XV secolo a oggi, e almeno isoliamo/estrapoliamo le tendenze, la periodicità, otteniamo un risultato abbastanza credibile, imho. Ecco l'immagine, in verde è la previsione del prezzo di chiusura per le prossime due settimane.


 
SanSanych Fomenko:


E in numeri?

Sul campione di allenamento, sul campione di prova e sul campione di convalida.

Soprattutto: su un nuovo file che era originariamente separato dai tre precedenti.

Tutti questi quattro valori non dovrebbero differire troppo l'uno dall'altro. Se differiscono di più del 10% di errore (30% di deviazione e 35% di deviazione, per esempio), fregatene.


Se differiscono di più del 10% (deviazione del 30% e 25%, per esempio, allora fottili.) Ciò che vale il denaro reale - non è niente, i segnali muoiono dopo un anno o anche due anni.


Non ho bisogno di tanti campioni inutili, c'è abbastanza allenamento e test, scelgo i parametri tramite GA, poi scelgo i risultati che sono al massimo simili al back and forward. Non allenerai mai un modello per l'intera storia delle quotazioni, in più offrirai 3 periodi indipendenti, e il trading sul 4° non ha senso in caso di trading sul mercato, poiché il mercato cambia durante questo periodo. Quindi, basta assicurarsi che il modello non sia overfitted, sulla sezione al di fuori del campione di allenamento, e questo è tutto.

Mi alleno ogni settimana, finora la seconda settimana è a +35%. Di cosa si tratta, sono soldi veri )

 
SanSanych Fomenko:

E ciò che vale il denaro reale non è niente, ci sono segnali che muoiono in un anno o anche due ...

Vuole seriamente creare un modello di mercato per gli anni a venire...?
 
Maxim Dmitrievsky:


Ho già i predecessori, stranamente. C'è già un bot pronto, che sta sul reale, scritto in meno di un mese. La cosa più importante sono i predittori, il che è fuori questione, sì. Per esempio, con la mia immaginazione infiammata i predittori possono essere raccolti sul posto, ho lavorato come analista per 5 anni :) Secondo me, la selezione dei predittori non è un compito così difficile come studiare le architetture NS, la cosa principale è sedersi e selezionare, ci vogliono 2-3 settimane :)

Per favore, quali predittori usate?
 
Maxim Dmitrievsky:


In numeri allenorm, non c'è bisogno di tanti campioni inutili, allenamento e test questo è sufficiente, attraverso GA scelgo i parametri, poi scelgo i risultati che sono il più simile possibile a indietro e avanti. Non allenerai mai un modello per l'intera cronologia delle quotazioni, in più offrirai 3 periodi indipendenti, e il trading sul 4° non ha senso quando si fa trading sul mercato, poiché il mercato cambia durante quel periodo. Quindi, basta assicurarsi che il modello non sia overfitted, su una sezione al di fuori del campione di allenamento, e questo è tutto.

Mi alleno ogni settimana, finora la seconda settimana è a +35%. Ho capito di cosa si tratta, questi sono soldi veri).

Tu conosci meglio i campioni.
 
panturale:
Per favore, ditemi quali predittori usate?
Uno che ho già descritto qui è il valore della pendenza della linea di regressione e anche un esempio di bot, gli altri sono un segreto :)
 
Ivan Negreshniy:
Vuole seriamente creare un modello di mercato per gli anni a venire...?

No, certo che no.

Sono impegnato a ottenere alcune garanzie per il futuro.

 
Maxim Dmitrievsky:


In numeri allenorm, non c'è bisogno di tanti campioni inutili, allenamento e test questo è sufficiente, attraverso GA scelgo i parametri, poi scelgo i risultati che sono il più simile possibile a indietro e avanti. Non allenerai mai un modello per l'intera cronologia delle quotazioni, in più offrirai 3 periodi indipendenti, e il trading sul 4° non ha senso quando si fa trading sul mercato, poiché il mercato cambia durante quel periodo. Quindi, basta assicurarsi che il modello non sia overfitted, su una sezione al di fuori del campione di allenamento, e questo è tutto.

Mi alleno ogni settimana, finora la seconda settimana è a +35%. Cosa c'è sul reale è circa, è denaro reale )

Anch'io ho due trame.

La prima trama: tre campioni sono presi a caso da essa e appresi-controllati-controllati. L'ultima sezione, che segue la prima, è una corsa sequenziale, preferibilmente con un tester.

Completamente dimenticato, anche se l'ho già scritto molte volte.

Il passo descritto sopra è il secondo passo.

Il primo passo è la selezione dei predittori "rilevanti" per la variabile obiettivo. Posso dimostrare che si ottengono ottimi risultati con quegli insiemi di predittori in cui prevalgono predittori che non hanno nulla a che fare con la variabile obiettivo - il rumore. I risultati della formazione sono molto buoni sul rumore. E sono riuscito a ottenere un errore inferiore al 10% su tutte e tre le parti menzionate sopra, fino al 3%! E poi ho avuto un errore completamente casuale sulla seconda parte.

Se iniziate a estirpare i predittori di rumore, l'errore aumenta durante l'addestramento, ma diminuisce nella seconda sezione. Se ci sbarazziamo dei predittori di rumore, otteniamo circa lo stesso valore di errore. Sul mio set di predittori è un po' meno del 30%.

 
Non c'è bisogno di addestrare macchine, bisogna prima avere nervi di ferro e connessioni nelle alte sfere del potere per commerciare con profitto