Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3371
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Zeigen Sie mir Ihr Handwerk.
Bei solchen Fragen wird jedem schwindelig.
Das ist wie in der Schule.
Man muss von ganz weit weg anfangen und einfache Fragen stellen.
Mit welchem Paar handeln Sie?
Und zeigen Sie den letzten Handel, Einstieg-Ausstieg mit allen Parametern.
Und dann, wie viele Trades Sie pro Tag machen, und an dieser Stelle gibt es eine Pause.
P.Z..
Sie sollten nicht mehr als zwei Fragen stellen.
Sie können Meister beleidigen. Und was, wenn Sie damit anfangen?
P.Z..
Ich unterstütze Spartak.
Sie missverstehen den Herd. Es sieht so aus, als hätten Sie sich nie den Code für die Baumstruktur angesehen: .... Dort gibt es überhaupt keine Operationen innerhalb einer einzelnen Zeile!!!, nur mit Mengen (vollständig oder in Stapeln).
Kurz gesagt:Ein zufälliger/vollständiger Satz von Zeilen, der zum Training übergeben wird, wird für jeden Prädiktor/jede Spalte einzeln sortiert. Es werden verschiedene Aufteilungen geprüft (Mitte/Perzentil/Zufall), die Statistiken für jede Aufteilung werden gezählt, und die beste Aufteilung wird für den gesamten Satz von Zeilen ausgewählt, nicht für eine/jede Zeile, wie Sie vorgeschlagen haben.
Entsprechend der besten Aufteilung wird die Menge der Strings in zwei Gruppen aufgeteilt, dann wird jede Gruppe erneut sortiert und die beste Aufteilung wird für jeden der Teile ausgewählt usw., bis die Stoppregel erreicht ist (nach Tiefe, Anzahl der Beispiele pro Zeile usw.)
Sie können weitere Details im Editor sehen, Sie haben die Datei:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
ClassifierSplit()-Funktion und diejenige, von der sie aufgerufen wird.
Sie werden es in ein paar Stunden verstehen und müssen nicht mehr über die Suche nach Prädiktoren in einer Zeile sprechen.
1. RegressionTree()-Klasse
Sie missverstehen den Herd. Es sieht so aus, als hätten Sie sich nie den Code für die Baumstruktur angesehen: .... Dort gibt es überhaupt keine Operationen innerhalb einer einzelnen Zeile!!!, nur mit Mengen (vollständig oder in Stapeln).
Kurz gesagt:Ein zufälliger/vollständiger Satz von Zeilen, der zum Training übergeben wird, wird für jeden Prädiktor/jede Spalte einzeln sortiert. Es werden verschiedene Aufteilungen geprüft (Mitte/Perzentil/Zufall), die Statistiken für jede Aufteilung werden gezählt, und die beste Aufteilung wird für den gesamten Satz von Zeilen ausgewählt, nicht für eine/jede Zeile, wie Sie vorgeschlagen haben.
Entsprechend der besten Aufteilung wird die Menge der Strings in zwei Gruppen aufgeteilt, dann wird jede Gruppe erneut sortiert und die beste Aufteilung wird für jeden der Teile ausgewählt usw., bis die Stoppregel erreicht ist (nach Tiefe, Anzahl der Beispiele pro Zeile usw.)
Sie können weitere Details im Editor sehen, Sie haben die Datei:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
ClassifierSplit()-Funktion und diejenige, von der sie aufgerufen wird.
Sie werden es in ein paar Stunden verstehen, und Sie müssen nicht über die Suche nach Prädiktoren in einer Zeile sprechen.
Sie haben Recht mit den vielen Zeilen.
Gehen wir zurück zum Anfang: Was ist ein Muster in einem Random Forest?
Es ist ein einzelner Baum. Hier ist ein Beispiel für einen solchen Baum aus RF:
Gesamtanzahl der Zeilen = 166+185! Alle haben nicht gepasst
Es gibt 150 solcher Bäume in meinem Modell
Sie haben Recht mit den vielen Zeilen.
Zurück zum Anfang: Was ist ein Muster in einem Random Forest?
Es ist ein einzelner Baum. Hier ist ein Beispiel für einen solchen Baum aus RF:
Zeilen insgesamt = 166+185! Keine von ihnen passt
Es gibt 150 solcher Bäume in meinem Modell
Betrachten Sie noch einmal den Pfad, der das Blatt bildet. In meinem obigen Beispiel gibt es 5 Teilungen. Ist dies nicht eine Beschreibung des Musters von 2 Scheitelpunkten mit einer Mulde? Beschreibung.
7 Splits können Kopf-Schulter usw. beschreiben.
Jedes Blatt eines Baumes beschreibt ein anderes Muster.
Der Wald ist die Meinung der Menge (derviews).
Der 1. Baum sagt: dieser String fällt in mein 18. Muster/Blatt und Antwort = 1
2.: derselbe String fällt in mein 215 Muster/Blatt und ergibt Antwort=0
3.: = 1
...
Wir bilden den Durchschnitt und erhalten die durchschnittliche Meinung von 150 Bäumen. Zum Beispiel = 0,78. Jeder hatte ein anderes aktiviertes Blatt/Muster.
Betrachten wir noch einmal das pfadbildende Blatt. In meinem obigen Beispiel gibt es 5 Spaltungen. Ist das nicht eine Beschreibung des Musters von 2 Tops mit einem Trog? Beschreibung.
7 Spaltungen können Kopf-Schulter usw. beschreiben.
Jedes Blatt eines Baumes beschreibt ein anderes Muster.
Ein Wald ist die Meinung einer Schar von Derviden.
Der 1. Baum sagt: diese Linie fällt in mein 18. Muster/Blatt und Antwort = 1
2.: dieselbe Linie fällt in mein 215 Muster/Blatt und gibt Antwort=0
3.: = 1
...
Wir bilden den Durchschnitt und erhalten die durchschnittliche Meinung von 150 Bäumen. Jeder hatte ein anderes aktiviertes Blatt/Muster.
Wir wissen nicht, wie viele Blätter.
Die Anzahl der Bäume ist ein Parameter, der geändert werden kann, um die minimale Stichprobengröße für das Training zu erhalten.
Wir sehen, dass 50 Bäume ausreichen, so dass es praktisch ist, einen Baum als ein Muster zu betrachten.
Wie viele Blätter es sind, ist nicht bekannt.
Die Anzahl der Bäume ist ein Parameter, der geändert werden kann, um die Mindeststichprobengröße für das Training zu erhalten.
Wir sehen, dass 50 Bäume ausreichen, also ist es praktisch, einen Baum als Muster zu betrachten.
Der Baum antwortet auf jede Situation/Zeile mit einem Blatt/Muster. In anderen Situationen wird die Antwort von anderen Blättern/Mustern kommen.
Es scheint, dass nicht nur das Blatt, sondern auch der Baum keine Lösung bietet.
Hier habe ich die Formel für den endgültigen Klassifikator gefunden
Wobei
Es ist auch erwähnenswert, dass wir bei der Klassifizierungsaufgabe die Lösung durch Mehrheitsabstimmung wählen, während wir bei der Regressionsaufgabe die Lösung durch den Mittelwert wählen.
Es scheint, dass nicht nur das Blatt, sondern auch der Baum keine Lösung bietet.
Hier ist die Formel für den endgültigen Klassifikator
Es ist auch erwähnenswert, dass wir bei der Klassifizierungsaufgabe die Lösung durch Mehrheitsentscheidung wählen, während wir bei der Regressionsaufgabe die Lösung durch den Durchschnitt wählen.
Warum wird sie nicht gelöst? Er trägt (1/150) zur endgültigen Antwort bei.
Von jedem Baum nimmt eines der aktivierten Blätter/Muster an der Abstimmung teil (Durchschnitt).
Die Antwort des Waldes ist der Durchschnitt der Antworten aller Bäume (oder aktivierten Blätter/Muster) - diese Formel zählt sie. Die Mehrheit für die binäre Klassifizierung ist, wenn der Durchschnitt >0,5 ist, dann 1, sonst 0.
Aber die 0,5-Grenze ist wahrscheinlich nicht die beste Option, wenn das Paket Zugriff auf den Wert des Durchschnitts gibt, können Sie mit verschiedenen Grenzen experimentieren.
Der Baum antwortet auf jede Situation/Zeile mit einem Blatt/Muster. In anderen Situationen wird die Antwort von anderen Blättern/Mustern kommen.
Es scheint, dass nicht nur das Blatt, sondern auch der Baum keine Lösung bietet.
Nicht nur ein Blatt, sondern alle Bäume sind für jede Situation verantwortlich, nur werden nicht alle von ihnen aktiviert, die Summe der Vorhersagen derjenigen, die aktiviert sind, ist die Vorhersage des Modells....
Wovon zum Teufel redet ihr, Baummodellexperten?
Nicht ein Blatt, sondern alle Bäume sind für die jeweilige Situation verantwortlich, nur werden nicht alle aktiviert, sondern die Summe der Prognosen der aktivierten Bäume ist die Prognose des Modells.
Wovon zum Teufel reden Sie, Baummodellexperten?