Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2819

 
Maxim Dmitrievsky #:
Jedes Clustering oder jeder Klassifikator hat eine Matrix von Wahrscheinlichkeiten, Übergängen oder Abständen. So genannte Rohwerte. Und es gibt Klassen-/Clusterbezeichnungen. Es werden unterschiedliche Dinge verglichen.

Ja, aber das ist nicht ganz genau. So beschreibe ich lieber den aktuellen Zustand und sage die Zukunft voraus. Diese Aufgaben sind im Wesentlichen die gleichen. Eine Zustandsänderung ist eine Vorhersage, wenn auch eine Beschreibung des gegenwärtigen Zustands))))

 
Valeriy Yastremskiy #:

Ja, aber das ist nicht ganz richtig. Ich ziehe es vor, den aktuellen Zustand zu beschreiben und die Zukunft vorherzusagen. Diese Aufgaben sind im Wesentlichen dieselben. Eine Zustandsänderung ist eine Vorhersage, wenn auch eine Beschreibung des gegenwärtigen Zustands))))

Dies ist absolut eindeutig. Solange ein Opa mit einem Finger verglichen wird, werde ich mich nicht mehr an dem Dialog beteiligen. Außerdem habe ich ihn nicht begonnen.
 
Maxim Dmitrievsky #:
Das ist unmissverständlich. Solange ein Opa mit einem Finger verglichen wird, werde ich mich nicht mehr an dem Dialog beteiligen. Außerdem habe ich ihn nicht begonnen.

Im Grunde sind Zukunftswahrscheinlichkeit und Zustandsclusterung dasselbe, was ist der Unterschied?

 
Valeriy Yastremskiy #:

Im Grunde genommen sind Zukunftswahrscheinlichkeit und Zustandsclusterung dasselbe, worin besteht der Unterschied?

Es wird schwierig, nicht wahr? Rohwahrscheinlichkeiten ohne Schwellenwert vs. Cluster bereits mit Schwellenwert

Anhand seiner Bilder können Sie sehen, dass er diskrete mit kontinuierlichen Werten vergleicht. Und er zieht den Schwellenwert aus dem Nichts. Und er benutzt diesen Hut als Beweis.

Warum hat er diese Linie nicht in das Diagramm gezeichnet? Es ist die gleiche

Die Werte sind bei beiden Methoden identisch, wenn der Schwellenwert bei der zweiten Methode richtig berechnet wird.

 
Maxim Dmitrievsky #:
Es wird schwierig, nicht wahr? Rohwahrscheinlichkeiten ohne Schwellenwert im Vergleich zu Clustern, die bereits einen Schwellenwert haben

Anhand seiner Bilder können Sie sehen, dass er diskrete mit kontinuierlichen Daten vergleicht. Und er zieht den Schwellenwert aus dem Nichts. Und er benutzt diesen Hut als Beweis.

Warum hat er diese Linie nicht in das Diagramm gezeichnet? Es ist die gleiche

In der Tat, es gibt eine Ähnlichkeit, eine Linie ist ein Durchschnitt von Mustern, ja, mehr ist weniger, und wie kann man die Bewegung charakterisieren? Nur durch die zurückgelegte Strecke, und die Strecke ist nur durch die kleinste Entfernung, d. h. ein Gitter. Ja, diskrete Einheiten sind komplizierter als kontinuierliche, aber wir arbeiten mit dem, was wir haben)).

 
Maxim Dmitrievsky #:

Ich würde lieber ein Spielzeug streamen, was soll man sonst an einem Samstag machen?

https://www.twitch.tv/gamearbuser

Ich habe ein Kind, das in Teilzeit als Kommentator bei Comp-Rennen arbeitet)))). Naja, und im wirklichen Leben auch auf dem Kart und Skates selbst))))))

 
Valeriy Yastremskiy #:

Ich habe ein Kind, das arbeitet Teilzeit als Kommentator bei comp races)))). Nun, und im wirklichen Leben auch auf dem Kart und selbst auf Skates)))))

Lassen Sie ihn streamen, wie er skatet) er wird später Spenden sammeln.

 
mytarmailS #:

Stichtag

die ersten 10 Kursinformationen, wenn Sie neue Merkmale erstellen wollen, wenn nicht, sollten sie aus dem Training entfernt werden.

letzte Zeile - Ziel

Teilen Sie die Auswahl für Training und Test in zwei Hälften


auf dem Forrest ohne Tuning erhalte ich auf die neuen Daten

auf hgbusta mit den neuen Funktionen erhielt ich Akurashi 0,83.


Ich frage mich, ob es möglich ist, 0,9 Akurasi zu erreichen?

mytarmailS #:
Niemand hat es überhaupt angefasst? (


Ich habe es nur zum Spaß angefasst.)
Verwendeter Random Forest.


Nicht verwendete Variablen:
X_OI
X_PER
X_TICKER

Wie gewünscht, Treyne und Test in der Hälfte.
r1


Ich habe die maximale Anzahl der Bäume auf 500 begrenzt.

MSE bei Trainee für 500 gewachsene Bäume
t1


MSE im Test für 500 gewachsene Bäume
t2


Die sich ergebende Metrik auf Traine (OOB) und auf Test.
Hier weiß ich nicht, wie man die Genauigkeit von 0 ,77 Random Forest auf diese Metrik überträgt.
Wahrscheinlich sollte man die MSE von
1abziehen ,
1- 0,16 = 0,84
Dann erhält man die Genauigkeit, die man bei XGBoost hat )).

r2


Nun, und die Variablen, die zum Training beitragen.
r3


Dies ist die Art von Analyse, die ich erhalten habe )

 
Roman #:

Ich habe es nur zum Spaß angefasst)
Verwendeter Zufallswald.


Nicht verwendete Variablen:
X_OI
X_PER
X_TICKER

Wie gewünscht, Track und Test in der Hälfte.

Nun OHLC absolute Preise sollten wohl auch rausgeschmissen werden ) wie ich schrieb )

Roman #:

MSE auf trayne für 500 gewachsene Bäume

MSE auf Test für 500 gewachsene Bäume

Die resultierende Metrik auf Trainee (OOB) und auf Test.
Hier weiß ich nicht, wie Sie Ihre Genauigkeit 0 ,77 Random Forest zu dieser Metrik zu bringen .
Wahrscheinlich MSE sollte von
einemsubtrahiert werden ,

Sie machen Regression, Sie machen Klassifikation! Sie haben alles falsch gemacht.

 
mytarmailS #:

Nun, die absoluten Preise von OHLC sollten wahrscheinlich auch rausgeschmissen werden), während ich dies schreibe

Sie machen Regression, Sie sollten Klassifikation machen! Sie haben das völlig falsch verstanden.

Hier ist die Klassifizierung, ohne OHLC.

Die Genauigkeit beträgt 0,79.
k1

ROC-Test.
k2

Konfusionsmatrix.
k4

Beeinflussende Variablen
k3