Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2380

 
Aleksey Vyazmikin:

Ich dachte fälschlicherweise, es ginge um Spalten.

Können wir nicht trotzdem das gesamte Training mit der Beispieldatei und die Prüfung mit einer anderen Datei durchführen?

Alexej, du kannst alles schaffen!!!

Aber ich bin nicht daran interessiert.

Lernen Sie R! Es ist eine faszinierende Sprache, besonders für Traynig...
 
mytarmailS:

Alexej, alles ist möglich!

Aber ich bin nicht daran interessiert.

Lernen Sie R! Es ist eine faszinierende Sprache, besonders für Traynig...

Vielen Dank für die Hilfe.

Die Genauigkeit (Precision) und Vollständigkeit (Recall) fielen deutlich besser aus als bei CatBoost.

Ich habe alle Proben in einer Datei zusammengefasst.

Können wir also noch in diese Richtung denken?

 
Aleksey Vyazmikin:

Ich danke Ihnen für Ihre Hilfe.

Die Genauigkeit (Precision) und Vollständigkeit (Recall) sind deutlich besser als bei CatBoost.

Ich habe alle Proben in einer Datei zusammengefasst.

Können wir also noch in diese Richtung denken?

Ist es besser mit neuen Daten oder mit Trainingsdaten?

Welche Zahlen sind sowohl dort als auch dort?

 
elibrarius:

Ist es besser mit neuen Daten oder mit Trainingsdaten?

Wie lauten die Zahlen für beide?

Leider habe ich mich geirrt, die Genauigkeit ist schlechter, nicht besser.



Allerdings ist dies eine schwierige Probe - ich kann nicht richtig darauf trainieren - morgen werde ich versuchen, eine andere, wo gute Modelle von CatBoost'a ausfallen. Nun, auch in den Parametern des Modells, die ich nicht verstehe, so dass vielleicht der Vergleich ist nicht sehr und fair.

Auf Kosten der großen Recall von diesem Modell ist es möglich, die separate Prädiktor im Allgemeinen zu machen. Aber ich weiß nicht, wie man es in eine Datei hochlädt :)

 
Maxim Dmitrievsky:

Es ist eine so paradoxe Situation, dass selbst wenn man es aus Versehen richtig macht, niemand es zu schätzen weiß.

weil es keine Bewertungskriterien gibt )

Nein, ich brauche überhaupt keine Wertschätzung und Anerkennung - denn dann werden sie sicher nicht aussteigen).

Vielmehr betrachte ich es als eine Art Übung oder Rätsel, wenn ich versuche, den gesunden Menschenverstand in jeder Idee des Forums zu finden)

In diesem speziellen Fall scheint es durchaus anwendbar zu sein, wenn die logistische Regression für die Klassifizierung verwendet wird.

 

Ich habe es an einer anderen Probe ausprobiert - im Anhang


X <- read.csv2("F:\\FX\\Открытие Брокер_Demo\\MQL5\\Files\\ZZ_Po_Vektoru_TP4_SL4_Si_QMini_02_Bi\\Si_cQq\\Setup\\xxx.csv")
Y <- X$Target_100
X <- as.matrix(within(X, rm("Time","Target_P","Target_100",
                            "Target_100_Buy","Target_100_Sell")))
library(glmnet)
tr <- 1:14112 #  train idx
best_lam <- cv.glmnet(x = X[tr,], 
                      y = Y[tr],alpha = 1, 
                      lambda = 10^seq(2, -2, by = -.1), 
                      nfolds = 5)$lambda.min

lasso_best <- glmnet(x = X[tr,], y = Y[tr], alpha = 1, lambda = best_lam)
pred <- predict(lasso_best, s = best_lam, newx = X[-tr,])

sma <- TTR::SMA(pred,20)
pred2 <- c(pred-sma) ; pred2[pred2>0] <- 1 ; pred2[pred2<=0] <- 0

yy <- tail(Y[-tr] ,3528)
pp <- tail(pred2 ,3528)
caret::confusionMatrix(as.factor(yy),as.factor(pp))
    Reference
Prediction    0    1
         0 1063  860
         1  567 1019
Die Frage ist, wie man das Modell erhält und wie man die Klassifizierung zunächst in einer Datei speichert.
Dateien:
xxx.zip  482 kb
 
Aleksey Vyazmikin:

Ich habe es an einer anderen Probe ausprobiert - hier


Die Frage ist, wie man das Modell erhält und wie man die Klassifizierung zunächst in einer Datei speichert.

catbust hat eine ziemlich starke Regularisierung, außerdem sollten Merkmale, die kategorisch sind, im Boost als solche deklariert werden

 
Maxim Dmitrievsky:

catbust hat eine ziemlich starke Regularisierung, besonders wenn die Merkmale kategorisch sind, sollten Sie sie als solche im Boost deklarieren

Bei binären Variablen spielt es keine Rolle, ob sie kategorisch sind oder nicht.

Sie könnten versuchen, die Regularisierung zu reduzieren - gute Idee - danke.

Bislang zeigt Lasso bessere Ergebnisse bei der Prüfung eines Teils der Stichprobe.

 
Maxim Dmitrievsky:

D.h. markieren Sie Trades auf einer Wellenform mit einer Periode von 5 oder einer Preisdifferenz und sehen Sie, was passiert

die Zeichen werden auch während der Ausbildung geglättet


versuchen Sie es auf die gleiche Weise. Ich habe es gut in der benutzerdefinierten Tester, ich habe ein Problem beim Exportieren des Modells, ich werde für den Fehler später suchen.

 
Aleksey Vyazmikin:

Bei binären Angaben spielt es keine Rolle, ob sie kategorisch sind oder nicht.

Sie könnten versuchen, die Regularisierung zu reduzieren - gute Idee - danke.

Bislang hat Lasso im Prüfungsteil der Stichprobe besser abgeschnitten.

Vielleicht ist es nur ein glücklicher Teil der Prüfungsprobe. Und Sie passen die Daten an, indem Sie das Modell mit den besten Parametern auswählen.

Ich führe jetzt immer eine Kreuzvalidierung (oder eine Validierung mit Valving-Forward) durch, d. h., ich passe nicht nur einen kleinen Teil der Daten an, sondern alle Daten auf einmal, was meiner Meinung nach die beste Trainingsoption ist.
Der Arzt riet auch dazu, es zu benutzen, bevor er aus dem Forum verschwindet.