Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2031

 
mytarmailS:

wir können versuchen, das Ziel auf komplexere Weise in Form von gleich 4 Parametern auszudrücken


Nehmen wir an, wir entscheiden uns für den Kauf...

und das Netz sagt uns nicht nur, dass wir kaufen oder verkaufen sollen

es sagt uns

zu welchem Preis zu kaufen, zu welchem Preis zu schließen, nach welcher Zeit zu kaufen und nach welcher Zeit zu schließen

Sie können auch einen Stop-Loss hinzufügen

Solche präzisen und weitreichenden Vorhersagen scheinen mir schwer zu lernen...

Für Takeoffs sollten wir meiner Meinung nach verschiedene Varianten der Gewinnmitnahme klassifizieren und das Modell sollte die profitabelste auswählen. Es ist ähnlich wie ZZ, aber das Modell sollte ab einem bestimmten Punkt auf jedem Bar arbeiten, aber dieser Punkt wird nicht bei jeder Preisbewegung ab der offenen Position erscheinen.

Ein guter Einstiegsort ist dort, wo der geringste Verlust erzielt werden kann, d.h. es ist wichtig, sofort den für die Einstellung des SL geeigneten Ausstiegspunkt zu kennen, wenn der SL an einen Level-Indikator gebunden ist, dann sind die Einstiegspunkte recht einfach zu finden und auszusieben, sie sind ähnlich, und daher sollte die Ausbildung besser sein.

Die Frage ist also, wie man solche Punkte findet...

 
Aleksey Vyazmikin:

Ein Wunsch für den Erfolg ist da :)

Brauchen Sie also eine Regression? Ich habe nicht viel Erfahrung mit solchen Modellen.

Ich bin mit diesem Konzept vertraut - es gibt Leute, die das machen - die Frage ist, wie man Strategien entwickelt - im Motor selbst...

Dann für die Klassifizierung tun das Ziel? Ich werde den ersten Teil der Tabelle, die über die Eingabe, SL, TP und die letzte Spalte +-1 als das Ergebnis des Handels ist verlassen. Wenn ich zum Beispiel einen Ausgang habe, sollte die letzte Spalte +-1 sein.

Von welchem Motor ist die Rede? Zum Beispiel bei der einheimischen Brachialgewalt oder der Genetik.

 
Rorschach:

Dann das Ziel zu klassifizieren tun? Ich werde den ersten Teil der Tabelle, die über die Eingabe, SL, TP und die letzte Spalte +-1 als das Ergebnis des Handels ist verlassen. Ich glaube nicht, dass ich Informationen über den Ausgang geben sollte, denn es ist möglich, ihn auszuspionieren.

Von welchem Motor ist die Rede? Zum Beispiel bei der einheimischen Brachialgewalt oder der Genetik.

Man kann eine Regression durchführen, ein Modell kann erstellt werden, solange es sich nur um Forschung handelt, wie ich es verstehe. Aber um die Qualität zu bewerten gibt es komplizierter - müssen die Abweichung vom Plan zu bewerten, ich weiß nicht, ob Sie sofort den Vektor der Abweichung oder es modulo bewerten können - nicht beschäftigt.

Es geht um eine Maschine, die klugerweise die richtigen Daten nimmt, um nicht offensichtlich unsinnige Handelsbedingungen zu generieren - den Prozess der Strategiegenerierung selbst, und danach können wir über Genetik oder eine andere Möglichkeit zur Verbesserung des Modells nachdenken.

 
Aleksey Vyazmikin:

Es kann auch eine Regression durchgeführt werden, ein Modell kann erstellt werden, solange es sich nur um Forschung handelt, wie ich es verstehe. Aber bei der Qualitätsschätzung ist es komplizierter - wir müssen die Abweichung vom Plan schätzen, ich weiß nicht, ob es möglich ist, den Abweichungsvektor oder das Modulo zu schätzen - ich habe das nicht getan.

Über die Maschine, die klugerweise die notwendigen Daten nehmen wird, um nicht wissentlich sinnlose Handelsbedingungen zu erzeugen - der Prozess der Strategieerzeugung selbst, und danach können wir über Genetik oder etwas anderes nachdenken, um das Modell zu trainieren.

In der Tat ist es interessant zu sehen, wie die Daten gruppiert werden, ob es eine Logik gibt.

Wir können mit Martin, Anti-Martin und Overturn beginnen. Und dann ifelse: wenn der Handel im Minus geschlossen wurde, wird der nächste mit doppeltem Lot oder nur in entgegengesetzter Richtung oder beides eröffnet. Es ist schwer, sich etwas Komplizierteres von Grund auf auszudenken.

 
Rorschach:

Es ist wirklich interessant zu sehen, wie die Daten gruppiert werden und ob es dabei eine Logik gibt.

Für den Anfang können wir einen Martin, einen Anti-Martin und eine Umkehrung nehmen. Und dann ifelse: wenn ein Handel mit einem Verlust geschlossen wurde, dann wird der nächste mit doppeltem Lot oder nur in die entgegengesetzte Richtung oder beides eröffnet. Es ist schwer, sich etwas Komplizierteres von Grund auf auszudenken.

Ich kann Ressourcen bereitstellen, mehr kann ich im Moment nicht tun.

 
Aleksey Vyazmikin:

Ich kann Ressourcen bereitstellen, mehr kann ich im Moment nicht tun.

Catbust hat feature_importances, die Fähigkeit, Cluster zu betrachten, wie in Wäldern?

Wird Ihre Maschine Tabelle 14 für 180.000.000 verdauen?

 
Rorschach:

Verfügt catbust über feature_importances, die Möglichkeit, Cluster zu betrachten, wie in scaffolding?

Wird Ihre Maschine Tabelle 14 für 180.000.000 verdauen?

"Feature_importances" ist die Wichtigkeit von Features, was hat das mit Clustern zu tun? Oder übersehe ich etwas? Es gibt eine solche Funktion, aber ich benutze sie nicht oft, weil diese Bedeutung im Wesentlichen nach Baumwipfeln gezählt wird, was nicht in mein Konzept passt.

Ich habe Modelle auf 6-Gigabyte-Tabellen trainiert. Und es verbrauchte nicht mehr als 2x Gigabyte Speicher, wie ich mich jetzt erinnere.

 
Aleksey Vyazmikin:

"feature_importances" ist die Bedeutung von Merkmalen, was hat das mit Clustern zu tun? Oder übersehe ich etwas? Es gibt eine solche Funktion, aber ich benutze sie nicht oft, weil diese Bedeutung im Wesentlichen nach Baumwipfeln gezählt wird, was nicht in mein Konzept passt.

Ich habe Modelle auf 6-Gigabyte-Tabellen trainiert. Und es verbrauchte nicht mehr als 2 Gigabyte Speicher, wenn ich mich recht erinnere.

Für den Wald ist es möglich, die Bedeutung und die Cluster zu erkennen. In catbust ist es wahrscheinlich plot_tree.

Die Daten werden aufbereitet und veröffentlicht.

Ich habe eine Testversion für 6 Spalten erstellt, die 11 GB benötigt. Notepad++ konnte sie nicht öffnen, weil die Datei zu groß ist. Der BD Browser für SQLite hängt seit etwa 20 Minuten.
 
Rorschach:

Für einen Wald gibt es die Option, die Bedeutung und die Cluster zu betrachten. In catbust ist es wahrscheinlich plot_tree.

Ich werde die Daten vorbereiten und sie veröffentlichen.

Ich habe eine Testversion für 6 Spalten erstellt, die 11 GB benötigt. Notepad++ konnte sie nicht öffnen, weil die Datei zu groß ist. Der BD Browser für SQLite hängt seit etwa 20 Minuten.
Total Command Viewer nimmt große Dateien auf, was Notepad++ zum Hängen bringt
 
Aleksey Vyazmikin:

"feature_importances" ist die Bedeutung von Merkmalen, was hat das mit Clustern zu tun? Oder übersehe ich etwas? Es gibt eine solche Funktion, aber ich benutze sie nicht oft, weil diese Bedeutung im Wesentlichen nach Baumwipfeln gezählt wird, was nicht in mein Konzept passt.

Ich habe Modelle auf 6-Gigabyte-Tabellen trainiert. Und es verbrauchte nicht mehr als 2 Gigabyte Speicher, wenn ich mich recht erinnere.

Ich frage mich, wie sie Bäume trainieren, ohne alle Daten in den Speicher zu übernehmen. Wenn wir eine 6-Gigabyte-Tabelle haben, sollten auch etwa 6 Gigabyte Speicher verwendet werden. Ein Baum muss jede Spalte als Ganzes sortieren. Wenn wir nicht alles im Speicher ablegen, sondern jedes Mal Daten von der Festplatte lesen, wird es zu langsam.
Die einzige Variante besteht darin, die Daten im Speicher als Float statt als Double zu speichern, was jedoch zu einer geringeren Genauigkeit führt. Für uns mit einer Genauigkeit von 5 Stellen ist das vielleicht nicht so schlimm, aber Catbust ist eine universelle Software, ich denke, die physikalischen und mathematischen Probleme sollten mit doppelter Genauigkeit gelöst werden.