Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2512

 
Aleksey Vyazmikin #:

Wie kommt das? Ich denke auf die gleiche Weise über die Suche durch ein Raster nach und bin daher an einer bereits implementierten Methode interessiert.

Manchmal kann sie als Krücke eine Strategie in die Nähe einer negativen mathematischen Erwartung ziehen.

Mir geht es um Metriken, manchmal wird ein Modell nicht nach dem Gewinn, sondern nach der Dynamik der korrekten Klassenvorhersagen bewertet. Das Gleichgewicht ist im Wesentlichen dasselbe, aber das Wechselgeld ist festgelegt. Der Punkt ist, dass die Strategie nicht nur durch die Klassifizierungsgenauigkeit, sondern auch durch Schwankungen der Marktvolatilität beeinflusst werden kann, und wir müssen die Dynamik der Klassifizierungsgenauigkeit ohne monetären Ausdruck betrachten.

Ich habe gerade alle meine Ziele und Attribute gesammelt. Die Designvariablen waren die Attributparameter, das Ziel. Ich bildete ein Trio aus 2 Indikatoren + einem Zielindikator und trainierte es mit einer Katbust. Ich wählte sie anhand der maximalen Lerngenauigkeit bei der Teststichprobe aus. Ich filterte die ausgewählten Trios nach der Möglichkeit, dass das Zieltrio angemessene Handelssignale liefert.

Als Ergebnis habe ich 5 Zeichentrios + ein Ziel gefunden. Aber wie ich bereits gezeigt habe, sind 93% Vorhersagegenauigkeit für ein Ziel, das ein gutes Handelssignal gibt, nicht genug. Übrigens habe ich versucht, mit Datensätzen auf den gefundenen Trios, voll verbundenen neuronalen Netzen verschiedener Konfiguration, Random Forest zu trainieren und erhielt +- die gleiche Trainingsgenauigkeit auf einem Testmuster und die gleichen Testergebnisse.

Gute Idee, danke, ich werde versuchen, es zu Ende zu bringen.

 
Aleksey Vyazmikin #:

Ich handele mit Minuten, einem schnellen Markt, daher weiß ich, dass der Preis in einer Sekunde mehr steigen kann, als ich mathematisch erwartet habe.

Ich weiß nicht, wie man mit Minuten handeln kann... Das Bild ist stark verrauscht, und wenn man das Mittelungsfenster vergrößert, um das Rauschen zu glätten, erhält man ein Bild, das eher einem größeren Zeitrahmen entspricht.

Können Sie uns einen Hinweis geben, was der Sinn des Handels auf 1-Minuten-Zeitrahmen ist? Vielleicht verstehe ich etwas nicht?

 
iwelimorn #:

Kurzum, alles umsonst, mit MO kann der Markt nicht getäuscht werden.

Sie haben die Merkmale und das Ziel gefunden, deren Klassenverteilung in der ersten Abbildung dargestellt ist.

Die Genauigkeit der mit diesem Datensatz trainierten Test- und Trainings-Katbust-Modelle betrug 93 %.

Die zweite Abbildung zeigt das Diagramm für den Saldo und das Eigenkapital des Zielgeschäfts:

Die dritte Abbildung zeigt das Gleichgewichts- und Eigenkapitaldiagramm des Handels mit den Signalen des trainierten katbusta-Modells:

Also, meine Damen und Herren, gehen Sie auseinander.

Die Arbeit, die Sie leisten, liegt mir sehr am Herzen.

Könnten Sie Folgendes tun?

  • jedes Merkmal im Verhältnis zur Anzahl der Klassen in mehrere Vektoren aufteilen, d. h. wenn es 2 Klassen gibt, erhält man 2 Vektoren
  • ein kombiniertes Histogramm der Vektoren, die zu demselben Prädiktor gehören, auf derselben Achse in derselben Abbildung zeichnen.



 
Übrigens verhält sich das Gradient Boosting aus irgendeinem Grund unregelmäßig. Höchstwahrscheinlich übertrainieren sie, weil sie versuchen, auf Kosten der Leistungssteigerung perfekt zu werden.
 
SanSanych Fomenko #:
Übrigens, Gradient Boosting verhält sich aus irgendeinem Grund erratisch. Höchstwahrscheinlich wurde er umgeschult, weil er auf Kosten der Förderung versuchte, perfekt zu werden.
Ja, sie trainieren alle neu, wir haben fast zufälligen Input.
 
iwelimorn #:

Ich habe gerade alle meine Zielattribute gesammelt. Die Designvariablen waren die Merkmalsparameter, das Ziel. Ich habe ein Trio aus 2 Attributen + einem Zielattribut gebildet und sie mit einem Catbust trainiert. Ich wählte sie anhand der maximalen Lerngenauigkeit bei der Teststichprobe aus. Ich filterte die ausgewählten Trios nach der Möglichkeit, dass das Zieltrio angemessene Handelssignale liefert.

Als Ergebnis habe ich 5 Zeichentrios + ein Ziel gefunden. Aber wie ich bereits gezeigt habe, ist 93% Vorhersagegenauigkeit für ein Ziel, das ein gutes Signal für den Handel gibt, nicht genug. Übrigens habe ich versucht, Full-Link neuronale Netze unterschiedlicher Konfiguration durch die gefundenen Trios, Random Forest zu trainieren und erhielt +- die gleiche Trainingsgenauigkeit auf einem Testmuster und die gleichen Testergebnisse.

Sind Sie sicher, dass es richtig ist, verschiedene Ziele in derselben Probe zu trainieren? Schließlich müssen die Signale vergleichbar sein, z. B. legen eine Trendumkehr und der Einstieg in den Trend aus einer flachen Position unterschiedliche Indikatorensätze für die Prädiktoren nahe.

Es gibt Fragen zur Katbüste:

- Verwenden Sie nur zwei Proben, verwenden Sie die Untersuchung nicht auf einmal?

- Wie viele Bäume gibt es in dem Modell?

- Verwenden Sie das Halting-Verfahren für das Lernen aus einer Testprobe?

- Wie hoch ist die Lernrate?

- Ist Klasse 1 für die Eingangsrichtung zuständig oder für das Signal, dessen Richtung bereits festgelegt ist?

iwelimorn #:

Gute Idee, danke, ich werde versuchen, sie zu verwirklichen.

Gern geschehen :) Es ist auch nützlich, den Gewinn und die Genauigkeit nach Wahrscheinlichkeitsverteilung zu betrachten.


iwelimorn #:

Ich kann mir nicht vorstellen, wie man mit Minuten arbeiten kann... Und wenn man das Mittelungsfenster vergrößert, um das Rauschen zu glätten, erhält man ein Bild, das einem größeren Zeitrahmen nahe kommt.

Können Sie uns einen Hinweis geben, was der Sinn des Handels auf 1-Minuten-Zeitrahmen ist? Vielleicht verstehe ich etwas nicht?

Ich handele mit Si - dort geht alles ganz technisch, und es gibt mehr Signale zu lernen.

Grundsätzlich verwende ich Informationen aus mehreren TFs, viele horizontale Ebenen in Prädiktoren, und die Minuten ermöglichen einfach eine schnellere Reaktion auf ein Ereignis, das den Preis in meinem Kopf beeinflusst.

 
SanSanych Fomenko #:
Übrigens, Gradient Boosting verhält sich aus irgendeinem Grund erratisch. Wahrscheinlich überanstrengt er sich, weil er versucht, ein Ideal auf Kosten der Leistungssteigerung zu erreichen.

Hier wurde gerade ein Experiment zu diesem Thema durchgeführt, bisher mit einer Stichprobe, aber der Punkt ist, dass eine Erhöhung der Lernrate sich positiv auf das Ergebnis auswirkt, da es mehr Verallgemeinerung gibt, was, wenn es keine richtige Antwort auf alle Fragen gibt und wenn die Stichprobe nicht repräsentativ ist, effektiver ist als die Anpassung an die Geschichte für jedes Beispiel.

 
Aleksey Vyazmikin #:

Im Wesentlichen verwende ich Informationen aus mehreren TFs, viele horizontale Ebenen in Prädiktoren,

Wie verwenden Sie horizontale Ebenen? Der Abstand vom aktuellen Preis zum nächsten Hunderter, 500er, 1000er?

 
elibrarius #:

Wie verwenden Sie horizontale Ebenen? Entfernung vom Preis auf das nächste Hundertstel, 500, 1000?

Ich versuche, keine Punkte zu verwenden - ich verwende Prozentsätze. Wenn ich ein Raster für den Tag habe (z.B. ATR), setze ich die Prädiktoren und den offenen Preis des aktuellen Balkens hinein, damit ich weiß, wo der Preis im Verhältnis zum Level steht, vorzugsweise markiere ich die Ereignisse der Levelüberschreitung, wie lange es her ist...

 
elibrarius #:
Sie sind alle übertrainiert, wir sind fast zufällig bei der Eingabe.

Kovarianz und Korrelation sind immer noch vorhanden... (scheint zufällig zu sein).

Wir wissen zwar nicht, wie viele Grundbestandteile wir in der Praxis einhalten müssen, aber es gelten einige Faustregeln.

Schließlich ist es nur

Was ist prädiktive Modellierung: Prädiktive Modellierung ist ein probabilistischer Prozess, der es uns ermöglicht, Ergebnisse auf der Grundlage bestimmter Prädiktoren vorherzusagen. Diese Prädiktoren sind im Grunde die Funktionen, die bei der Bestimmung des Endergebnisses, d. h. des Ergebnisses des Modells, ins Spiel kommen.

Es ist eine Frage des persönlichen Geschmacks, welche Prädiktoren und Labels wir wählen und welchen Algorithmus wir verwenden... - wenn wir das System zunächst weiter fassen als den endgültigen Bull/Bear/Hold-on...

Deshalb ist die Beschreibung der Simulationsmöglichkeiten durch

Maxim Dmitrijewski

ist immer Gold wert!

1. Zunächst wird der Suchbereich definiert: Empirisch oder auf der Grundlage von Annahmen werden statistische Tests durchgeführt. Dann wird ein MO-Algorithmus ausgewählt,

Option 2.

2. Suchstrategie für jeden Klassifikator, Analyse seiner internen Struktur (Bedeutung der Merkmale, Shap-Werte und verschiedene Metriken).

- Nur "in der Hoffnung"..."durch ein Polynom"... + nützliche Datentransformationen (unabhängig von MO) zu erkennen, ist in der Tat eine Kunst!!! Sie KÖNNEN bei der Analyse von Daten NICHT gleich sein (wie einige "Gurels" hier) - zumindest bei der linearen und quadratischen Programmierung sind beide Funktionen unterschiedlich und die Ergebnisse und ihre Interpretation sind unterschiedlich!


Введение в уменьшение размерности | Портал информатики для гиков
  • 2019.12.30
  • espressocode.top
Машинное обучение. Как обсуждалось в этой статье , машинное обучение — это не что иное, как область обучения, которая позволяет компьютерам «учиться», как люди, без необходимости явного программирования. Что такое прогнозирующее моделирование: прогнозирующее моделирование — это вероятностный процесс, который позволяет нам прогнозировать...