L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 221

 
Andrey Dik:
Probabilmente l'opinione più sensata e obiettiva di R che ho visto ultimamente. Il pensiero convenzionale è quello di cui soffrono i vecchi fan della R, chiunque tu prenda anche da questo forum, la pensano tutti allo stesso modo, puoi anche confonderli tra di loro se non per guardare i nickname, ragionano allo stesso modo.

Quando si discute di R è impossibile fare a meno di voi, anche se non è affatto chiaro COSA stiate facendo qui.

Ma visto che sei qui, sul tuo esempio.

Avete sviluppato un algoritmo genetico, sapete come, forse meglio di chiunque altro al mondo.

Non so come scrivere algoritmi genetici. E questo non perché non posso farlo, ma perché non ne ho bisogno.

Lasciatemi spiegare.

In un sistema di trading reale uso la funzione rfe (backtesting dei predittori da caret). Dà risultati non molto buoni. Devo usare il tuo algoritmo genetico? Cento volte no, perché lo stesso caret ha la funzione gaf (selezione dei predittori tramite algoritmo genetico). Ma oltre a questo caret ha un'altra funzione saf (selezione dei predittori per robustezza simulata - annealing), che è molto più efficace nel MIO PROBLEMA, che l'ALGORITMO GENETICO. Il problema nei miei sistemi di trading è uno, e gli strumenti sono tre, con la laboriosità di sostituire uno con l'altro. Inoltre, e forse la cosa più importante: TUTTE LE TRE FUNZIONI SONO CONNESSE CON ALTRE FUNZIONI DI CUI HO BISOGNO.

Non ho affatto il problema di programmare un algoritmo genetico. Ma quando risolvo i miei problemi posso usare facilmente vari algoritmi, compreso quello genetico. In realtà il problema è la selezione dei predittori, è un problema computazionalmente capiente e per risolverlo oltre all'elencato R ci sono un gran numero di strumenti che sono programmati NON in R.

 
J.B:

Dipende da che tipo di ricerca, se la ricerca dello studente è per passare la tesina, allora sì, è molto più facile prendere una funzione dallo scaffale, eseguirla, e ottenere un rapporto standard con bei grafici, nessuna domanda qui.

Se la ricerca di un ingegnere quantistico, in un ufficio finanziario che prende soldi dal mercato, non solo attraverso commissioni, o tecnologia vicina al mercato, la situazione è diversa. Di regola, negli uffici giusti, in 5 anni si costruisce la propria infrastruttura di trading, dove ci sono il 95% di tutti gli strumenti necessari, che sono convenientemente avvolti e si possono usare non molto più complicati che in R..........

Sì, è tutto chiaro e sono d'accordo con te, ma stai parlando di produzione, ma non ci sono quoni qui, e non ci sono persone con infrastrutture che sono state fatte per 5 anni... e prima che si facesse questa infrastruttura c'era la ricerca iniziale, è lì che si trova la maggior parte della gente, si cercano idee, si parla di produzione...

per come la vedo io, lo schema è

1) ricerca di un'idea di lavoro

2) alla ricerca di un'idea di lavoro

3) ricerca di un'idea di lavoro

4) fare vendite e altre infrastrutture per l'idea (produzione)

Ora stai contrapponendo il primo punto al quarto - ed è un po' una farsa, sai cosa intendo?

Beh, per il primo punto, quando hai bisogno di passare rapidamente attraverso un mucchio di idee R è una cosa, per il quarto punto è c++ naturalmente.

 

SanSanych Fomenko:

Non so come scrivere algoritmi genetici. E non perché non possa farlo, ma perché non ne ho bisogno.

Me lo sono ricordato perché al prescreening mi è stato chiesto di scrivere una bolla di selezione o più velocemente, senza cercare su internet ovviamente, l'ho scritto, sembrava un compito infantile, ma poi mi è stato detto che il 70% delle persone non lo sa fare. Penso che questo sia corretto, c'è un certo insieme di algoritmi di base che dovrebbe sapere come 2+2=4 specialista in questo o quel settore, come aumenta notevolmente, almeno la capacità di usarli efficacemente, per non parlare che per modificare e creare analoghi più efficaci. Quantum dovrebbe essere in grado di scrivere MLP, baes, Knn, forest, ecc. senza sbirciare. Questo è 2+2=4 per i quanti.

SanSanych Fomenko:

Uso la funzione rfe (selezione posteriore dei predittori dal caret). Dà risultati non molto buoni. C'è una funzione gaf...

Beh, sì, questo è proprio il tipo di discorso che fanno i consumatori con "decine di migliaia di funzioni" che non capiscono ma ci provano. Purtroppo tutto quello che ti danno è già provato e non c'è "nessun pesce lì", soprattutto per quanto riguarda l'algotrading, tutta questa ricchezza di funzioni è illusoria, l'algotrading nella sua essenza non può essere papavero, bisogna saper e amare inventare una bicicletta di nuova generazione, altrimenti ti portano in una "macchina di lusso" solo in una discarica o al cimitero, non stai guidando)))

 
mytarmailS:

Sì, è tutto chiaro e sono d'accordo con te, ma stai parlando di produzione, ma non ci sono quoni qui, e non ci sono persone con l'infrastruttura che è stata fatta per 5 anni... e prima che si facesse questa infrastruttura c'era la ricerca iniziale, è lì che si trova la maggior parte della gente, si cercano idee, si parla di produzione...

per come la vedo io, lo schema è

1) ricerca di un'idea di lavoro

2) alla ricerca di un'idea di lavoro

3) ricerca di un'idea di lavoro

4) fare vendite e altre infrastrutture per l'idea (produzione)

Ora stai contrapponendo il primo punto al quarto - ed è un po' una farsa, sai cosa intendo?

Beh, per il primo punto, quando hai bisogno di passare rapidamente attraverso un mucchio di idee R è una cosa, sul quarto punto è c++ naturalmente.

Schema sbagliato, come in algotrading molti processi sono intrecciati e interdipendenti. Non si può cercare un'idea isolatamente dai dati e da una profonda comprensione degli algoritmi che li elaborano. Così, per esempio "cercando idee" sui candelieri minuti di una coppia di valute, è.... Niente"uno", sull'order book del mercato russo è un altro, sull'order book di decine di borse leader mondiali e fornitori di dati macroeconomici è un altro, ecc. Lo stesso vale per l'elaborazione, l'idea e gli strumenti sono strettamente correlati, l'approccio incrementale ha senso, ma non quello "a vuoto", quando un'idea viene cercata come un cavallo sferico e implementata con C++. Per esempio, come pensi che l'idea dimodellare le dinamiche del book di ordini a limite ad alta frequenza con le macchine vettoriali di supporto sarà conveniente nell'implementazione? Provatelo e poi ditemi. Posso solo dire che nell'articolo è anche 2+2+4 ma in realtà è molto più complicato.

 
J.B:

Una volta ha lavorato in un ufficio gamediver un anno, mi sono ricordato questo, come ci al colloquio preliminare ha chiesto di scrivere una bolla di ordinamento o più veloce, senza guardare a Internet, naturalmente, ho scritto, ho pensato che era infantile TOR, ma poi sono stato illuminato che il 70% delle persone non può farlo. Penso che questo sia corretto, c'è un certo insieme di algoritmi di base che dovrebbe sapere come 2+2=4 specialista in questo o quel settore, come aumenta notevolmente, almeno la capacità di usarli efficacemente, per non parlare che per modificare e creare analoghi più efficaci. Quantum dovrebbe essere in grado di scrivere MLP, baes, Knn, forest, ecc. senza sbirciare. Questo è 2+2=4 per i quanti.

Non voglio sembrare un non-detective, ma è un po' strano che un professionista come te, e anche lavorando alla fondazione quantistica quest'anno, non sappia cosa sia la correlazione incrociatahttps://www.mql5.com/ru/forum/71816

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B:

Non è lo schema giusto, perché nel trading algoritmico molti processi sono intrecciati e interdipendenti. Non si può cercare un'idea isolatamente dai dati e da una profonda comprensione degli algoritmi per elaborarli. Così, per esempio "cercando idee" sui candelieri minuti di una coppia di valute, è.... Niente"uno", sul libro degli ordini del mercato russo è un altro, sui libri degli ordini di decine di borse leader mondiali e fornitori di dati macroeconomici è un altro, ecc. Lo stesso vale per l'elaborazione, l'idea e gli strumenti sono strettamente correlati, l'approccio incrementale ha senso, ma non quello "a vuoto", quando un'idea viene cercata come un cavallo sferico e implementata con C++. Per esempio, come pensi che l'idea dimodellare le dinamiche del book di ordini a limite ad alta frequenza con le macchine vettoriali di supporto sarà conveniente nell'implementazione? Provatelo e poi ditemelo. Posso solo dire che anche nell'articolo è 2+2+4, nella realtà è tutto molto più complicato.

Sono d'accordo su hft, ma non capisco perché lo citate sempre come esempio, non potete fare a meno di sapere che tali date non sono disponibili per nessuno, nessuno dei presenti qui ha soldi per comprare portaordini dall'Occidente e canali veloci.

Perché parlarne e farne un esempio?

 
mytarmailS:

Non voglio sembrare un detective, ma è strano che un professionista come te, che lavora in un fondo quantistico, non sappia cos'è la cross-correlazione quest'annohttps://www.mql5.com/ru/forum/71816

Oh, andiamo... Stavo risolvendo un problema abbastanza complesso allora, ed ero seduto a casa, malato, non era conveniente chiedere ai colleghi, avevo un mese per trovare un lavoro, poi ho capito da solo, e dopo un po' Rev. Combinator ha chiamato esattamente la stessa soluzione. L'altra questione è che se aveste affrontato un tale problema, probabilmente non l'avreste risolto, perché qui è necessario sapere come la correlazione incrociata tra le righe è implementata a bassi livelli e indovinare come usarla, R non ha una tale funzione "lagging row", e soprattutto, semplicemente non avreste impostato un tale problema)))) Quindi non sei un quant in un hedge fund.

 

SanSanych Fomenko:


Quando si promuove il linguaggio R come mezzo per risolvere efficacemente i compiti di trading, si menziona costantemente la facilità di utilizzo dei suoi strumenti e la vasta gamma delle sue capacità. Nessuno lo mette in dubbio. Ma le sue affermazioni mostrano chiaramente la sua ignoranza dei principi di questa lingua.

Certamente sei un buon navigatore delle sue funzioni, e sai quali di esse sono necessarie per risolvere i tuoi compiti, ma ovviamente sei completamente ignorante dei meccanismi nascosti dietro questi nomi. Non sapete come funzionano. Per di più, non vuoi saperlo e dissuadi gli altri dal farlo.

Sei un utente di R. Ti piace questo strumento perché è facile da usare, ma non per l'efficienza nel risolvere compiti concreti di cui non sai nulla e non aspiri a sapere.

Capire che uno sviluppatore differisce da un utente proprio nel suo desiderio di capire il meccanismo e raggiungere la massima efficienza del suo funzionamento.

Questo obiettivo può essere raggiunto solo con una conoscenza assoluta della materia. La facilità di creare qualcosa non è rilevante qui.

In effetti, state invitando gli sviluppatori a dimenticare il loro lavoro e a diventare semplici utenti. Godetevi la facilità d'uso degli strumenti che fornite e dimenticate completamente di indagare i principi del loro lavoro.

Con un tale approccio, l'efficienza può essere dimenticata, e gli sviluppatori non possono dimenticarla.

Se si comincia a capire il funzionamento dei meccanismi velati in R, si può scoprire che non sono così perfetti come possono sembrare a un dilettante entusiasta.

Con questo post sto cercando di articolare un punto di vista che si oppone a voi, ma potrei sbagliarmi su altri. Tuttavia, è così che vedo il problema.

 
mytarmailS:

Sono d'accordo su hft, ma non capisco perché lo citate sempre come esempio, sapete che tali date non sono disponibili per nessuno, nessuno qui ha i soldi per comprare i raccoglitori di ordini dall'ovest e i canali veloci.

Perché parlarne e darne l'esempio?

Non generalizzare. Si può iniziare con l'OL del mercato russo. E HFT come funziona solo. HFT e insider.
 
J.B:

Andiamo... Stavo risolvendo un problema abbastanza complesso in quel momento, ed ero seduto a casa, malato, non era conveniente chiedere ai colleghi, avevo un mese per trovare un lavoro, poi ho capito da solo, e dopo un po' il signor Kombinator ha detto esattamente la stessa soluzione. Combinator ha chiamato esattamente la stessa soluzione. L'altra questione è che se aveste affrontato un tale problema, probabilmente non l'avreste risolto, perché qui è necessario sapere come la correlazione incrociata tra le righe è implementata a bassi livelli e indovinare come usarla, R non ha una tale funzione "lagging row", e soprattutto, semplicemente non avreste impostato un tale problema)))) Quindi non sei un quant in un hedge fund.

Non sono così stupido come pensi, nota la parola correlazione incrociata, l'ho detto nel tuo ramo, ma è quello che hai fatto tu, quando ho imparato per la prima volta la correlazione incrociata ho avuto la tua stessa idea sul confronto delle serie(quindi non sei solo e non sei unico in questo) e questo era molto prima del tuo ramo, ma non ci ho mai messo mano...

J.B:
Non generalizzare. Si può iniziare con l'OL sul mercato russo. E HFT come funziona solo. HFT e insider.

potresti avere ragione.... ma mi sembra che gli OL disponibili siano scritti a velocità più elevate rispetto a plaza, e ottenere che testato su uno e la realtà sarà diversa, posso essere sbagliato ma questa è l'impressione che ho avuto