L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2380

 
Aleksey Vyazmikin:

Ho pensato erroneamente che si trattasse di colonne.

Ancora, non possiamo fare tutto l'addestramento sul file di esempio e il controllo su un file diverso?

Alexei , puoi fare tutto!!!

Ma non mi interessa.

Impara R! È un linguaggio affascinante, specialmente per il...
 
mytarmailS:

Alexei, tutto è possibile!

Ma non mi interessa.

Impara R! È un linguaggio affascinante, specialmente per il...

Grazie per l'aiuto.

L'accuratezza (Precision) e la completezza (Recall) sono risultate significativamente migliori di CatBoost.

Ho unito tutti i campioni in un unico file.

Quindi, possiamo ancora pensare in questa direzione?

 
Aleksey Vyazmikin:

Grazie per il vostro aiuto.

L'accuratezza (Precision) e la completezza (Recall) sono significativamente migliori di CatBoost.

Ho unito tutti i campioni in un unico file.

Quindi, possiamo ancora pensare in questa direzione?

È meglio su dati nuovi o su dati di allenamento?

Che numeri ci sono sia lì che lì?

 
elibrarius:

È meglio su dati nuovi o su dati di allenamento?

Quali sono i numeri di entrambi?

Ahimè, mi sbagliavo, la precisione è peggiore, non migliore.



Tuttavia, questo è un campione difficile - non posso allenarmi adeguatamente su di esso - domani ne proverò un altro, dove i buoni modelli di CatBoost'a risultano. Beh, anche nei parametri del modello non capisco, quindi forse il confronto non è molto e giusto.

A spese di un grande Recall da questo modello è possibile fare il predittore separato in generale. Ma non so come caricarlo in un file :)

 
Maxim Dmitrievsky:

È una situazione talmente paradossale che, anche se per caso ci azzecchi, nessuno lo apprezza.

perché non ci sono criteri di valutazione)

No, non ho affatto bisogno di apprezzamenti e riconoscimenti - perché poi di certo non scenderanno).

Piuttosto, lo prendo come una sorta di esercizio o puzzle, quando si cerca di trovare il senso comune in qualsiasi idea del forum)

In questo caso particolare, sembra essere abbastanza applicabile se la regressione logistica viene utilizzata per la classificazione.

 

Provato su un altro campione - allegato


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
La domanda è come ottenere il modello e come salvare la classificazione in un file per iniziare.
File:
xxx.zip  482 kb
 
Aleksey Vyazmikin:

L'ho provato su un altro campione - qui


La domanda è come ottenere il modello e come salvare la classificazione in un file per iniziare.

catbust ha una regolarizzazione piuttosto forte, inoltre, se le caratteristiche sono categoriche, dovrebbero essere dichiarate come tali nel boost

 
Maxim Dmitrievsky:

catbust ha una regolarizzazione piuttosto forte, specialmente se le caratteristiche sono categoriche, dovreste dichiararle come tali nel boost

Per quelli binari, non importa se sono categorici o no.

Potresti provare a ridurre la regolarizzazione - buona idea - grazie.

Finora Lasso ha mostrato risultati migliori sulla parte d'esame del campione.

 
Maxim Dmitrievsky:

Cioè segnare i trade su qualche forma d'onda con un periodo di 5 o una differenza di prezzo e vedere cosa succede

i segni saranno anche smussati durante l'allenamento


prova allo stesso modo. L'ho ottenuto bene nel tester personalizzato, ho un problema quando si esporta il modello, cercherò l'errore più tardi.

 
Aleksey Vyazmikin:

Per quelli binari non importa se sono categorici o no.

Potresti provare a ridurre la regolarizzazione - buona idea - grazie.

Finora Lasso si è comportato meglio sulla parte d'esame del campione.

Forse è solo un pezzo fortunato del campione d'esame. E si fa un fit per esso, scegliendo il modello con i migliori parametri per esso.

Ora ho sempre crossvalidato (o convalidato con valving-forward), non c'è un adattamento a una piccola porzione, ma a tutti i dati in una volta, penso che questa sia la migliore opzione di formazione.
Doc ha anche consigliato di usarlo prima di scomparire dal forum.