L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 92

 
Vizard_:
OK)))) ma leggete attentamente le condizioni -
"post risultati in % (casi predetti con successo) per entrambi i campioni (treno = xx%, test = xx%). Non c'è bisogno di specificare metodi e modelli, solo numeri".
Stiamo aspettando altri risultati. Mi chiedo quali conclusioni trarrà Mihail Marchukajtes.

il mio risultato (se volete, vi darò anche il metodo):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56% in formazione:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

52% al test:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
Comunque, il livello massimo di generalizzazione è di circa il 53%, quindi..... Occasionalmente viene fuori Garbage in Garbage Out, cioè garbage.... Non c'è modo di testarlo, perché Excel non supporta le formule lunghe. Non voglio scrivere per questo in MKUL, se il modello fosse di qualità normale lo proverei, ma con tale percentuale di generalizzazione, penso che il risultato non sarà molto buono nel test...
 
mytarmailS:
Non capisco come si calcola questa "prevedibilità" e se ha un senso se non si tiene conto dell'obiettivo

Ci sono formule per stimare quanto è rumoroso il segnale, o viceversa. Come e cosa calcolano queste formule lo sa solo l'autore, possiamo solo confidare che sappia cosa sta facendo.
La linea di fondo è abbastanza semplice - se i predittori stessi non sono "rumore", è più facile prevedere qualcosa con loro. E se li elaborate in qualche modo, potete ottenere un segnale ancora più stabile. Un segnale stabile è una buona base per una previsione.

Puoi anche stimare rapidamente i predittori da solo usando la funzione Omega() di questo pacchetto e applicare i valori di qualche particolare predittore (una colonna della tabella di allenamento). Il risultato è 0% - rumore e il predittore è inutile. 100% - tutto è buono, il predittore può essere usato.
Suppongo che non dovremmo inserire nella funzione i valori puri dell'indicatore, ma il loro incremento, ad esempio per una media mobile - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], ecc.)

Riguardo ai valori target - sì, non sono usati nel pacchetto. Questo pacchetto non può prevedere nulla. Determina solo in qualche modo quali predittori possono essere attendibili e quali no, e ne crea altri nuovi sulla base di essi. La selezione della variabile target e l'addestramento del modello predittivo devono essere gestiti in modo diverso. È logico che alcune variabili target possono essere previste meglio e altre peggio.
La variabile di destinazione è un problema per qualsiasi pacchetto. Non è certo che la variabile obiettivo utilizzata possa essere prevista con i predittori disponibili. Per esempio, posso usare "aumento/diminuzione del prezzo sulla prossima barra" o "aumento/diminuzione a zig zag" per la variabile target. Vorrei imparare come creare nuove variabili target in modo che si adattino meglio ai predittori disponibili. Chissà, forse potrei prevedere perfettamente un appartamento con i miei predittori, ma non lo saprò mai perché non l'ho provato.

 
Da quanto ho capito nessuno legge i termini e le condizioni (qualsiasi manipolazione di dati è permessa), quindi non torturerò. In effetti, tutto è semplice.
Ho solo bisogno di prendere i ritardi da A6, applicare una semplice formula sette meno del quinto e ottenere il 100% su entrambi i campioni. Grazie a tutti. Buona fortuna...
 
Vizard_:
Da quanto ho capito nessuno legge i termini e le condizioni (qualsiasi manipolazione dei dati è permessa), quindi non torturerò. In effetti, tutto è semplice.
Basta prendere i ritardi da A6, applicare una semplice formula settima meno del quinto e ottenere il 100% su entrambi i campioni. Grazie a tutti. Buona fortuna...
Allora, qual è la fregatura? Anch'io posso codificare una variabile di uscita in un mucchio di spazzatura di input come quello. Non si direbbe mai. Non so ancora quale sia il senso di tutto questo.
 
Mihail Marchukajtes:
Che divertimento c'è? Posso anche codificare una variabile di uscita in un mucchio di spazzatura di input. Non sarete in grado di indovinare. Non so ancora quale fosse il senso di tutto ciò.
Ha richiamato la nostra attenzione sul fatto che la quantità di dati utilizzati non è sempre sufficiente per la previsione. Per esempio, limitandoci a 9 barre potremmo perdere informazioni importanti da barre più lontane. E anche che non possiamo valutare un predittore senza tener conto delle sue interazioni con altri predittori.
 
Mihail Marchukajtes:
Che divertimento c'è? Posso anche codificare una variabile di uscita in un mucchio di spazzatura di input. Non sarete in grado di indovinare. Continuo a non capire il senso di tutto questo.
Che non si può vedere il gopher, ma si può).
Dai, proviamo. Solo una semplice.
 
Vizard_:
Nel senso che non si può vedere il gopher, ma è lì)))
Dai, facciamo una prova. Solo una semplice.
Andiamo, penserò a qualcosa....
 
Per esempio, questo file. Il treno Chitso non ha bisogno di fare alcun test. L'ottimizzatore di Reshetov mostra spazzatura o 56%, ma il gopher è anche lì. Chi può trovare....?? Davvero non vedo il punto di questi giochi quando l'uscita è fatta dalla trasformazione dell'ingresso, qui e la rete non sarà necessario.... quindi questo è tutto....
 
Mihail Marchukajtes:
Beh, per esempio questo file. Il treno Chitso non ha bisogno di fare alcun test. L'ottimizzatore di Reshetov mostra spazzatura o 56%, ma il gopher è anche lì. Chi può trovare....?? Davvero non vedo il punto di questi giochi quando l'uscita è fatta dalla trasformazione dell'ingresso, qui e la rete non sarà necessario.... so....
Fa incazzare questo forum che un semplice archivio rar non può essere allegato .... È patetico in una parola....
File: