L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 387

 
Ildottor Trader:

E questo denaro può essere ritirato?
 
Ildottor Trader:

che un modo per fare soldi.

Se vuoi fare soldi, i numerae hanno in un certo senso lanciato la loro criptovaluta. I suoi possessori hanno in un certo senso la possibilità di partecipare indirettamente all'investimento.

Non posso dire altri dettagli, voglio scoprirlo, ma non posso farlo.

 
Ildottor Trader:

È interessante notare che il logloss 0.690 - 0.691 sui dati di convalida ha quasi tutti mostrato un buon risultato sui nuovi dati, non ho idea di cosa sia questo.

Molto probabilmente non avido, non troppo complicato il modello e quindi non overfit, anche se c'era come un ragazzo con ~0.65 in qualche tour, che in diretta ~0.68 +.

Sono più confuso nei loro dati mescolati campioni, "era" con id sconosciuto non può riprodurre i loro calcoli sui tour passati. Quindi non so cosa diavolo c'è nel training set, sarebbe bello se dagli ultimi round i campioni LIVE fossero disposti e sarebbe possibile allenare un modello per questo dataset di test, almeno per capire perché va così diverso. IMHO è come se accumulassero punti da molto tempo e poi dessero un sottoinsieme casuale come treno, gli id non riflettono la cronologia dell'accumulo del dataset, e poi i punti vivi, che servivano per l'avanguardia, non vengono dati separatamente per correggere i modelli e ottenere un "dito nel cielo" frugando nella natura, a caso.

Spero che lo sistemino :)

 
Qualcuno può confermare che è meglio usare le foreste casuali per la classificazione binaria? Nel caso generale, o è possibile prendere una rete neurale nel caso speciale che darà un errore leggermente inferiore?


 
panturale:
E questo denaro può essere ritirato?

Sì, ritiro istantaneo in bitcoins al tasso attuale.


Combinatore:

Se vuoi fare soldi, i numerae hanno in un certo senso rilasciato la loro criptovaluta. I suoi possessori hanno in un certo senso la possibilità di partecipare indirettamente all'investimento.

Non dirò altri dettagli, voglio scoprirlo, ma non riesco a trovarlo.

Sì, ora danno le loro crypto ai vincitori insieme ai dollari. Per esempio ho 300 NMR (Numeraire), ma non possono ritirarli o farci qualcosa in questo momento. In generale non hanno davvero iniziato un turnover, lo danno solo finora.

NMR stesso è ethereum crypto token(https://github.com/ethereum/EIPs/issues/20), e investire ciò che offrono è basato sulle possibilità di ethereum pure. Più precisamente, non è nemmeno un investimento, ma un'opportunità di mettere soldi sulle loro previsioni. Tu carichi le tue previsioni, fai una scommessa in NMR, e poi l'algoritmo in ethereum nel tempo definisce i vincitori e distribuisce i premi(https://numer.ai/whitepaper.pdf). Casinò, in breve.


Maxim Dmitrievsky:
Qualcuno può confermare che è meglio usare le foreste casuali per la classificazione binaria? Nel caso generale o posso prendere neuronet nel caso speciale che darà un po' meno errori?
In articoli postati qui ho letto che il mondo della classificazione è governato dal gradient binning (tipo speciale di foresta), nel pacchetto R gbm per esempio.
 
Ildottor Trader:

Sì, ritiro istantaneo in bitcoins al tasso attuale.

Hmmm... strano.

La domanda sorge spontanea: perché gli hedge-fund americani, con il patrocinio dello zio di Renaissance, dove come i quants più cool della Terra, con stipendi in $200-300k e bonus a sei cifre, questi prediches da ML fan mondo (Russia, India, Cina...), per il prezzo degli stipendi di un programmatore medio di Mosca per tutta la folla (>300 persone) ?????

Come se non avessero i loro quants per questo? Oppure i quants di Harvard non vogliono farlo, comunicano solo con gli investitori ed esternalizzano i modelli....

Hmmm... come possono non pagare per tale mancanza di lungimiranza...

 
Ildottor Trader:


Ho letto in articoli postati qui che il mondo della classificazione è governato dal gradient boosting (un tipo speciale di foresta), nel pacchetto R gbm per esempio.

Dicono che anche loro si adattano troppo... ma leggerò di più... Comunque, meglio di MLP. A proposito, gli alberi decisionali potenziati danno un errore leggermente peggiore degli alberi decisionali semplici in studio
 
Maxim Dmitrievsky:

Dicono che anche loro si nutrono troppo... Ma darò un'occhiata... Almeno meglio di MLP. A proposito, gli alberi decisionali potenziati producono un errore un po' peggiore degli alberi decisionali semplici nel


ada è un po' meglio di randomforest. Ma caret ha qualche problema con l'ada (non ricordo quale), quindi non vale la pena.

la più promettente è la selezione dei predittori. Sono tutti nostri.

Questo thread ha utilizzato un gran numero di predittori, ma tutti derivati da una singola coppia di valute.

Perché un paio e non molti?

E perché una coppia di valute e non i predittori?

E dove sono finiti i dati macroeconomici?


Finora il mio errore sul nuovo file è poco meno del 30%. Il 20% non è raggiungibile con nessun trucco, sostituire i modelli non porta da nessuna parte.

Ma non ho la forza di provare a rispondere alle domande di cui sopra.

 
SanSanych Fomenko:


ada è leggermente migliore di randomforest. Ma in caret ci sono alcune cose strane con ada (non ricordo quali), quindi non ne vale la pena.

la più promettente è la selezione dei predittori. È tutto nostro.

Questo thread ha utilizzato un gran numero di predittori, ma tutti derivati da una singola coppia di valute.

Perché un paio e non molti?

E perché una coppia di valute e non i predittori?

E dove sono finiti i dati macroeconomici?


Finora il mio errore sul nuovo file è poco meno del 30%. Il 20% non è raggiungibile con nessun trucco, la sostituzione dei modelli non porta da nessuna parte.

Ma non ho la forza di provare a rispondere alle domande di cui sopra.


Ho già dei predittori, stranamente. Ho un bot pronto, che si basa su uno reale, l'ho scritto in meno di un mese. La cosa più importante - i predittori, è fuori questione. Per esempio, con la mia immaginazione infiammata i predittori possono essere raccolti in poco tempo, ho lavorato come analista per 5 anni :) Penso che la selezione dei predittori non sia un compito così difficile come studiare le architetture NS, la cosa principale è sedersi e sceglierne uno, ci vogliono 2-3 settimane :)

In particolare, l'ultima cosa popolare ora è LSTM, sono molto esigenti sulla potenza di calcolo, ma danno risultati impressionanti. Sto pensando di prendere un PC da gioco potente ora, almeno per i calcoli della scheda video, al massimo per la tesla NVidia.

Dall'esperienza con i ns piccoli - hanno bisogno di essere riqualificati su automatico o di essere riqualificati, questo è un processo obbligatorio. L'uso di GA per selezionare i parametri degli stessi predittori per NS è anche un must. Tutto questo richiede energia, ma ne vale davvero la pena. Abbiamo già una parvenza di IA che tiene conto di queste 3 componenti. Sovrallenamento+genetica+poteri

 

SanSanych Fomenko:

A partire da oggi ho un errore sul nuovo file di poco meno del 30%. Il 20% non è raggiungibile con nessun trucco, sostituire i modelli non porta a nulla.

Risultato molto alto anche per HFT, potresti controllare il dataset in csv, che ha dato tali risultati, voglio essere sicuro che non sia overfitting.

dall'alto e lontano a volte ha fatto eco che anche il minuto rinascimentale predice la precisione non più di 65-70%, dato che sono addestrati da migliaia di caratteristiche impensabili, tra cui caratteristiche da elaborazione di immagini satellitari e dati di attività di infrastrutture urbane di megalopoli in tutto il mondo, tutto ciò che fa la natura e le folle di persone sul pianeta - i dati.