L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 79

 
Dr.Trader:

Ho usato il metodo "repeatedcv" in trainControl, con una divisione predefinita. Recentemente ho scritto io stesso il codice per la convalida incrociata, ho provato la convalida incrociata sia con barre prese a caso che con pezzi presi consecutivamente senza interruzioni. Non ho visto alcuna differenza sul fronttest, ha dato circa lo stesso risultato in entrambi i casi. Ho diviso i dati per la formazione/convalida incrociata 50%/50%, forse a quel rapporto non ha più importanza.
Sperimenterò con questo in caret...

Ricordo che in quell'articolo che hai postato un po' di tempo fa, il confronto principale era alberi potenziati con il metodo di Platt (qualcosa del genere). Tutto quello che ho trovato su google su questo metodo è che devi passare l'output del modello a sigmoid e prendere il suo risultato. Gbm o xgboost possono farlo? Questo approccio sembra essere migliore della foresta, della neuronica e di una specie di "alberi insaccati" che vengono al secondo posto.

Gbm e xgboost sono alberi potenziati. Per una migliore convergenza in grpdient ogni nuovo albero è costruito su osservazioni ponderate basate sui risultati dell'apprendimento dell'albero precedente. Sia i modelli lineari che quelli non lineari possono essere potenziati...

Al secondo posto c'è la foresta casuale. Questo è il bagarinaggio come lo intendo io. I risultati medi di diversi modelli costruiti su dati diversi.

Leggi su Gradient boosting. È difficile trovarne uno migliore per la classificazione. Io, per esempio, classifico sulla base dei risultati dei predittori di regressione.
 
Riguardo al CV. L'impostazione predefinita è il partizionamento casuale... Per le serie temporali, la separabilità temporale è importante... In caret questo può essere fatto. Caret CV serie temporali personalizzate pieghe... cercatelo. Nel mio codice che ho postato prima. È implementato in traincontrol lì.
 
Alexey Burnakov:
Informazioni sul CV. Il default è il partizionamento casuale... Per le serie temporali, la separabilità temporale è importante... si può fare in caret. Caret CV serie temporali personalizzate pieghe... cercatelo. Nel mio codice che ho postato prima. È implementato in traincontrol.

Ti guardo e sono stupito... Si vuole ottenere qualcosa dal nulla. Cioè, si vuole ottenere un risultato di 0,00000000000000000000000000000000000000000000 da zero. Non posso più guardarlo, quindi ti darò una mano. In realtà, la topologia della rete è secondaria. Nel machine learning, nel forex e oltre, i dati vengono prima di tutto. Cioè, la cosa più importante nella progettazione di reti neurali non è la topologia della rete o il metodo di allenamento. Sono dati di ingresso e dati di uscita. Se i dati sono rilevanti per il mercato - qualsiasi anche piccolo perseptron risolverà il vostro problema di classificazione e funzionerà bene in futuro, per una semplice ragione, perché i dati di input sono rilevanti per il mercato e questi dati sono in grado di prevederlo. E quello che state cercando di fare è di grattare la superficie di informazioni irrilevanti. Mi dispiace, ma il risultato sarà anche irrilevante.... Per quanto riguarda il mercato, nel forex, la cosa principale è il volume, e poi la reazione del mercato ad esso. E non il volume che è in MT (tick), ma il volume effettivo dei futures, lo stesso euro. Usate il delta del cluster per aiutarvi. Ci sono molte informazioni utili. Quindi, utilizzando il volume degli scambi, aumenterà significativamente le prestazioni di qualsiasi rete, anche il più semplice perseptron. Ha anche un delta, che è anche estremamente utile. Ma state cercando di costruire un modello sulla base di indicatori che sono secondari, direi terziari dopo il prezzo e vi aspettate un miracolo da esso. Non ci sarà nessun miracolo, ve lo assicuro.....

P.S., pensi solo a chi sta cercando di correre contro... Le corporazioni con i team di programmatori più fighi, con più potenza di elaborazione del vostro quad-core. Con i soldi investiti nello sviluppo di nuovi metodi, ecc. E qui Alexey dalla semplice campagna russa ha deciso di hackerare il mercato in 5 anni e ottenere il graal. Scendi dal cielo e togliti gli occhiali rosa........

 
Mihail Marchukajtes:

Nel machine learning, nel forex e oltre, i dati vengono prima di tutto. Cioè, la cosa più importante quando si progettano le reti neurali non è la topologia della rete o il metodo di allenamento. Sono dati di ingresso e dati di uscita. Se i dati sono rilevanti per il mercato, qualsiasi perseptron anche piccolo risolverà il vostro problema di classificazione e funzionerà bene in futuro, per una semplice ragione, perché i dati di input sono rilevanti per il mercato e questi dati sono in grado di prevederlo.

Non ho nemmeno niente da ridire, è corretto. Lo sappiamo anche noi, e stiamo discutendo non solo di modelli di classificazione, ma anche di metodi di selezione dei predittori (dati di input), leggete prima questo thread.

Suppongo che tu speri di selezionare manualmente una dozzina di input, costruire un modello, scambiare per una settimana, iniziare a perdere, iniziare a scegliere di nuovo gli input. L'ho fatto anch'io, a volte ho strategie divertenti come "prendi un certo grano per inizializzare il neurone, allenalo esattamente 7777 iterazioni, tutto andrà bene, ma ogni altro martedì devi fare trading contro il suo segnale. Ottimizzare la rete su nuovi dati ogni due giorni". Tali strategie sono reali, ma ci vuole molto tempo per scegliere qualcosa del genere e fa profitto solo per un paio di settimane. Tutto perché una tale strategia si basa su qualche modello a breve termine.

Invece, scelgo un algoritmo per la selezione automatica delle voci. È semplice, ci sono circa 100 entrate ad ogni barra e un algoritmo che seleziona una tale combinazione di entrate che insieme danno stabilmente un valido segnale di acquisto/vendita durante tutto l'anno. Non è come l'ottimizzazione degli Expert Advisors in mt5, dove un EA può ottenere grandi risultati e fallire al fronttest, ma è più complicato, con valutazioni incrociate e diversi criteri di stima del risultato. Una volta selezionavo un centinaio di voci, ora è più piccolo, solo un paio di dozzine. Ottengo il 60%-70% di precisione sul fronttest, ma è ancora instabile, ho bisogno di sbarazzarmi dei gradi di libertà in tutto il processo di selezione e formazione per ottenere circa gli stessi risultati anche partendo da zero ogni volta.

Mihail Marchukajtes:

P.S., pensa solo a chi stai cercando di affrontare... Le corporazioni con i team di programmatori più fighi, con più potenza di elaborazione del tuo quad-core. Con i soldi investiti nello sviluppo di nuovi metodi, ecc. E qui Alexey dalla semplice campagna russa ha deciso di hackerare il mercato in 5 anni e ottenere il graal. Scendi dal cielo e togliti gli occhiali rosa........

Le corporazioni con le loro strutture e i loro programmatori usano lo stesso software di analisi dei dati e di modellazione a nostra disposizione. Diciamo che allenano il modello perfetto e ottengono il 100% di profitto al mese. Ho meno potere, con gli stessi dati potrò costruire un modello più debole con, diciamo, solo il 50% di profitto. Questo sarà sufficiente per me.

 
Mihail Marchukajtes:

Ti guardo ed è incredibile... Si vuole ottenere qualcosa dal nulla. Cioè, da zero, si vuole ottenere un risultato di 0,00000000000000000000000000000000000000000000000000000000000000000000. Non posso più assistere a tutto questo, quindi ti darò una mano. In realtà, la topologia della rete è secondaria. Nel machine learning, nel forex e oltre, i dati vengono prima di tutto. Cioè, la cosa più importante nella progettazione di reti neurali non è la topologia della rete o il metodo di allenamento. Sono dati di ingresso e dati di uscita. Se i dati sono rilevanti per il mercato - qualsiasi anche piccolo perseptron risolverà il vostro problema di classificazione e funzionerà bene in futuro, per una semplice ragione, perché i dati di input sono rilevanti per il mercato e questi dati sono in grado di prevederlo. E quello che state cercando di fare è di grattare la superficie di informazioni irrilevanti. Mi dispiace, ma il risultato sarà anche irrilevante.... Per quanto riguarda il mercato, nel forex, la cosa principale è il volume, e poi la reazione del mercato ad esso. E non il volume che è in MT (tick), ma il volume effettivo dei futures, lo stesso euro. Usate il delta del cluster per aiutarvi. Ci sono molte informazioni utili. Quindi, utilizzando il volume degli scambi, aumenterà significativamente le prestazioni di qualsiasi rete, anche il più semplice perseptron. Ha anche un delta, che è anche estremamente utile. Ma state cercando di costruire un modello sulla base di indicatori che sono secondari, direi terziari dopo il prezzo e vi aspettate un miracolo da esso. Non ci sarà nessun miracolo, ve lo assicuro.....

P.S., pensi solo a chi sta cercando di correre contro... Le corporazioni con i team di programmatori più fighi, con più potenza di elaborazione del vostro quad-core. Con i soldi investiti nello sviluppo di nuovi metodi, ecc. E qui Alexey dalla semplice campagna russa ha deciso di hackerare il mercato in 5 anni e ottenere il graal. Scendi dal cielo e togliti gli occhiali rosa........

Demagogo, ahi. Era ora che te ne andassi. Costruire una casa.

"Il cane abbaia, la carovana va". С

 
Dr. Trader:

Non ho nemmeno niente da discutere, è vero. Lo sappiamo anche noi, e stiamo discutendo non solo di modelli di classificazione, ma anche di metodi di selezione dei predittori (input), leggete prima questo thread.

Suppongo che tu speri di selezionare manualmente una dozzina di input, costruire un modello, scambiare per una settimana, iniziare a perdere, iniziare a scegliere di nuovo gli input. L'ho fatto anch'io, a volte ho strategie divertenti come "prendi un certo grano per inizializzare il neurone, allenalo esattamente 7777 iterazioni, tutto andrà bene, ma ogni altro martedì devi fare trading contro il suo segnale. Ottimizzare la rete su nuovi dati ogni due giorni". Tali strategie sono reali, ma ci vuole molto tempo per scegliere qualcosa del genere e fa profitto solo per un paio di settimane. Tutto perché una tale strategia si basa su qualche modello a breve termine.

Invece, scelgo un algoritmo per la selezione automatica delle voci. Semplicemente, ho circa 100 entrate ad ogni barra e un algoritmo che seleziona una tale combinazione di entrate che tutte insieme danno costantemente un valido segnale di acquisto/vendita durante tutto l'anno. Non è come l'ottimizzazione degli Expert Advisors in mt5, dove un EA può ottenere grandi risultati e fallire al fronttest, ma è più complicato, con valutazioni incrociate e diversi criteri di stima del risultato. Una volta selezionavo un centinaio di voci, ora sono meno, solo un paio di dozzine. Ottengo il 60%-70% di precisione sul fronttest, ma è ancora instabile, ho bisogno di sbarazzarmi dei gradi di libertà in tutto il processo di selezione e formazione per ottenere circa gli stessi risultati anche partendo da zero ogni volta.

Le corporazioni con le loro strutture e i loro programmatori usano lo stesso software di analisi dei dati e di modellazione a nostra disposizione. Addestreranno un modello perfetto e otterranno il 100% di profitto al mese. Ho meno potere, con gli stessi dati posso costruire un modello più debole, con, diciamo, solo il 50% di profitto. Starò bene.

Mettiamola così. I migliori fondi mostrano un rendimento medio annuo del 40-50%. L'intelligente e l'eccellente possono lavorare anche lì. Non vedo nulla di strano se mi avvicino alla soglia del 50% all'anno e ho questo aumento.
 
Alexey Burnakov:
Mettiamola così. I migliori fondi mostrano un rendimento medio annuo del 40-50%. Ci possono lavorare sia persone intelligenti che eccellenti. Non vedo niente di strano che mi avvicini al 50% all'anno e che abbia questa crescita.

In primo luogo - i fondi mostrano un rendimento così miserabile per una sola ragione, la mancanza di liquidità nel mercato, è difficile mettere una grande quantità di denaro nella strategia, non si hanno tali problemi

In secondo luogo - Perché non puntare al 100% al mese, diciamo?

Sono completamente d'accordo conMihail Marchukajtes, per aumentare la qualità del riconoscimento dobbiamo aumentare la qualità dei segni, e i modelli.... la loro influenza +/- 5% sul risultato complessivo

 
mytarmailS:

In primo luogo - i fondi mostrano un rendimento così miserabile per una sola ragione, la mancanza di liquidità nel mercato, è difficile mettere una grande quantità di denaro nella strategia, non si hanno tali problemi

In secondo luogo - Perché non puntare al 100% al mese, diciamo?

Sono completamente d'accordo conMihail Marchukajtes, per aumentare la qualità del riconoscimento dobbiamo aumentare la qualità dei segni, e i modelli.... la loro influenza +/- 5% sul risultato finale

Lei è anche un demagogo. Bene, mostrateci gli input con questo grado di informazione. Perché prendiamo i modelli di punta? Per spremere i segnali dai dati rumorosi, se avessimo dati senza rumore, potremmo anche fare una formula in excel.

"100% al mese". Sforzarsi, mostrare i risultati, condividere le idee. Vi ascolteremo, come aumentare la vostra redditività di 20 volte e come non ritirarsi nel prossimo mese dal drawdown.

 
Alexey Burnakov:

Lei è anche un demagogo. Bene, mostrateci gli input con questo grado di informazione. Perché prendiamo i modelli di punta? Per spremere i segnali dai dati rumorosi, se avessimo dati senza rumore, potremmo fare la formula in Excel.

"100% al mese". Sforzarsi, mostrare i risultati, condividere le idee. Vi ascolteremo, come aumentare la vostra redditività di 20 volte e come non ritirarsi nel prossimo mese da un drawdown.

"long-livers" del forex. Più di 5 anni di commercio. Ordinati per FS. Sì, alcuni hanno ritorni cosmici, ma altre statistiche sono negative. Questa è la realtà. E Stabiliti sta passando di mano. Tutti gli altri mostrano FS di 3 e meno.

 
Alexey Burnakov:

Lei è anche un demagogo. Bene, mostrateci gli input con questo grado di informazione. Perché prendiamo i modelli di punta? Per spremere i segnali dai dati rumorosi, se avessimo dati senza rumore, potremmo fare la formula in Excel.

"100% al mese". Sforzarsi, mostrare i risultati, condividere le idee. Sentiamo come aumentare il rendimento di 20 volte e come non perdersi nel prossimo mese da un drawdown.

Siamo tutti demagoghi qui, solo tu sei d'artagnan, è già chiaro, bene che almeno non sei un troll.... ciao..... :)


Non credo che sia una vera strategia di trading, ma ho imparato che è un profondo praticante e non ho domande sul mercato che non abbiano avuto risposta... Voglio ringraziarlo per questo.

Quest'uomo è Ph. D. in scienze tecniche, ha difeso la sua dissertazione su "AI" molto tempo fa (circa 20 anni fa) Costruisce robot da oltre 20 anni e ha molta esperienza.

E dice che non si può prevedere il mercato da un approccio a scatola nera, ma è necessario identificare gli attributi che funzionano, capire come e perché funzionano e filtrare il più possibile i dati per lasciare solo ciò che funziona, ignorando il rumore.

Ha una rete di circa 100 segni (predittori), ogni tratto ha un'intera libreria o pacchetto come vuoi tu.

E ora confronta il divario di qualità tra un cartello che richiede un'intera biblioteca e una stupida cosa storta il cui nome è "SMA" , "MACD" , "RSI" ecc... Hanno lo 0,00000001% di informazioni utili, proprio come ha scrittoMihail Marchukajtes, ed è un fatto, altrimenti i modelli mostrerebbero esattamente le prestazioni che possono mostrare, cioè il 90% di risposte corrette

L'uomo consiglia di leggere "MSUA" e l'analisi spettrale in particolare Fourier

========================================================

Inoltre quali risultati ho "demagogico" hanno raggiunto, ma in realtà molto modesto, buone idee come penso molto, la mia ricerca sta andando in molte direzioni contemporaneamente e vi è una mancanza enorme di conoscenza in vari campi, perché spesso chiedere aiuto ai partecipanti del forum, ma soprattutto per aiutare e nessuno vuole, dicono che si impara da soli, e poi..... solo se io stesso ho imparato tutto allora perché faccio questa comunicazione, come senza logica, mi distraggo.


Ecco la cosa migliore sul dan. Mamma. che sono riuscito a spremere da RF sui nuovi dati è il 50% al mese per 2 mesi di fila, ma tutto è ancora molto instabile, ho provato a riempire le immagini 10 volte, ma non ottenere (ottenuto)

ww

www

La linea di fondo è che non dovresti limitarti con modelli come il 30% all'anno è cool, non è cool, è una cornice per la mente e la creatività