Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 22

 
Ich bin selbst nicht glücklich darüber, es ist nur vorübergehend. Wenn ich lerne, die Indikatorparameter auszuwählen, werde ich von D1 auf kleinere Zeiträume umstellen und viel mehr Beobachtungen in demselben Zeitintervall machen können.
 
Hallo zusammen, wenn jemand Interesse hat, erzähle ich euch von meiner Forschung...

Was die Idee des Clusterns angeht, so kam nichts dabei heraus, beim Kleben von Stücken aus einem Cluster wurde keine Homogenität beobachtet, warum weiß ich nicht...Ich denke, ich muss Spektralanalyse mit Frequenzen, Amplituden und Phasen studieren, ich denke, Fourier wird ausreichen, also, wenn es jemanden gibt, der das Thema kennt, werde ich mich freuen, zu kommunizieren, nicht so! Ich suche einen Lehrer!!! Also, das Thema ist so weit verlangsamt

====================================

Der nächste Schritt in der RF-Forschung.

Ich habe mit den Einstellungen des RF-Modells gespielt, d. h. mit der Anzahl der Splits und Kol. Aber ich beschloss, das gleiche Modell mit den gleichen Parametern neu zu trainieren, ich hatte nicht genug Intelligenz, um das erste gute Modell zu speichern (also trainierte ich das Modell neu und erhielt ein sehr durchschnittliches Ergebnis, dann trainierte ich den ganzen Abend das Modell neu (etwa 100 Mal) in der Hoffnung, die gleichen Parameter zu finden, aber leider ist das meiste, was ich bekommen konnte, ein Drittel der Ergebnisse des ersten Modells

Frage: Was war es? Umschulung zufällig oder das Modell hat eine starke Korrelation in den Daten gefangen, wie man es im Allgemeinen beziehen, in Ihrer Erfahrung?Können diese Parameter auf irgendeine Weise abgerufen werden?

Alle von mir genannten Ergebnisse wurden mit neuen Daten erzielt, die dem Modell vorher nicht bekannt waren.

Gesamtdaten 55.000
Ausbildung bei 35.000
Kontrolle bei 20 000
RTS-Futures-Daten, TF - 5 Minuten
 
mytarmailS:

====================================

Weiter geht es mit der Forschung mit RF .


Frage: Woran lag das? War es zufälliges Übertraining oder hat das Modell eine starke Korrelation in den Daten erkannt, wie sollte es Ihrer Erfahrung nach behandelt werden? Auf welche Weisekönnen diese Parameter abgerufen werden?

Vergessen Sie nicht nur diese Daten, sondern rennen Sie, wenn so etwas auftaucht, so weit wie möglich weg.

PS.

Wir müssen den ursprünglichen Satz von Prädiktoren vom Rauschen befreien.

Dr. Trader hat die wichtigsten Komponenten ausprobiert, aber er hat nur wenige Beobachtungen gemacht. Versuchen Sie es. Links oben, auch der Code ist gepostet

 
SanSanych Fomenko:

Vergessen Sie nicht nur diese Daten, sondern rennen Sie so weit wie möglich weg, wenn so etwas auftaucht.


warum? argumentieren
 
mytarmailS:
Hallo zusammen, wenn jemand Interesse hat, erzähle ich euch von meiner Forschung...

Was die Idee des Clusterns angeht, so kam nichts dabei heraus, beim Kleben von Stücken aus einem Cluster wurde keine Homogenität beobachtet, warum weiß ich nicht...Ich denke, ich muss Spektralanalyse mit Frequenzen, Amplituden und Phasen studieren, ich denke, Fourier wird reichen, also wenn es jemanden gibt, der das Thema kennt, werde ich gerne kommunizieren, nicht so! Ich suche einen Lehrer!!! Also, das Thema ist so weit verlangsamt

====================================

Der nächste Schritt in der RF-Forschung.

Ich habe mit den Einstellungen des RF-Modells gespielt, d. h. mit der Anzahl der Splits und Kol. Aber ich beschloss, das gleiche Modell mit den gleichen Parametern neu zu trainieren, ich hatte nicht genug Intelligenz, um das erste gute Modell zu speichern (also trainierte ich das Modell neu und erhielt ein sehr durchschnittliches Ergebnis, dann trainierte ich den ganzen Abend das Modell neu (etwa 100 Mal) in der Hoffnung, die gleichen Parameter zu finden, aber leider ist das meiste, was ich bekommen konnte, ein Drittel der Ergebnisse des ersten Modells

Frage: Was war es? Umschulung zufällig oder das Modell hat eine starke Korrelation in den Daten gefangen, wie man es im Allgemeinen beziehen, in Ihrer Erfahrung?Können diese Parameter auf irgendeine Weise abgerufen werden?

Alle von mir genannten Ergebnisse wurden mit neuen Daten erzielt, die dem Modell vorher nicht bekannt waren.

Gesamtdaten 55.000
Ausbildung bei 35.000
Kontrolle bei 20 000
RTS-Futures-Daten, TF - 5 Minuten.

es war eine Art Fehler.

Um dies zu vermeiden, führen Sie das Versuchsprotokoll in einer Tabelle: alle Trainingsparameter, wenn es eine Auswahl von Eingaben gibt, dann die besten Eingaben, das Ergebnis des Trainings, das Ergebnis der Validierung. Und du wirst glücklich sein.

 
mytarmailS:
warum? argumentieren
Unten und argumentiert
 

Leute, bitte helft uns mit Code-Beispielen

Nehmen wir an, wir haben drei Vektoren "A", "B" , "С"

Wir müssen alle Arten von Unterschieden zwischen ihnen automatisch aufbauen, weil es so viele Variablen gibt...

mögen:

x1 = A - B

x2 = A - C

x3 = C - B

und schreiben Sie x1,x2,x3 als Spalten in den Datenrahmen

Zeigen Sie mir den Code, wenn Sie können

 
mytarmailS:

Leute, bitte helft uns mit Code-Beispielen

Nehmen wir an, wir haben drei Vektoren "A", "B" , "С"

Wir müssen alle Arten von Unterschieden zwischen ihnen automatisch aufbauen, weil es so viele Variablen gibt...

mögen:

x1 = A - B

x2 = A - C

x3 = C - B

und schreiben Sie x1,x2,x3 als Spalten in den Datenrahmen

Bitte zeigen Sie den Code, wenn Sie können.

Eine funktionierende Variante. Das ist vielleicht nicht optimal:

sampleA <- as.data.frame(matrix(round(runif(n = 51000, min = 0, max = 1)), ncol = 51))


n <- ncol(sampleA) #your columns

differences <- list()
counter <- 1
for (i in 1:n){
        for (j in 1:n){
                differences[[counter]] <-       sampleA[, i] - sampleA[, j]
                counter <- counter + 1
        }
}

diff_data <- as.matrix(do.call(rbind.data.frame, differences))

diff_data_frame <- as.data.frame(t(diff_data))
 
Alexey Burnakov:

Arbeitsmöglichkeit. Vielleicht nicht optimal:

Vielen Dank, beim Schreiben aller möglichen Kombinationen mit drei Candlesticks und vier OHLC-Preisen bin ich dreimal ins Schwitzen gekommen, so viel Code
 
mytarmailS:
Vielen Dank, während ich alle möglichen Kombinationen mit drei Candlesticks und 4 ihrer OHLC-Kurse schrieb, kam ich dreimal ins Schwitzen, so viel Code

Wie kann ich erreichen, dass der Code keine zusätzlichen Spalten erzeugt? 3 Spalten in einer Funktion ergeben beispielsweise 9 Kombinationen, obwohl drei eigentlich ausreichen, wie in meinem Beispiel oben

es macht keinen Sinn, erst A/B und dann B/A zu machen