Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1038
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Was hat das mit der "Schwelle" für einen Random Forest zu tun?
Ich weiß nicht mehr, wie hoch der Schwellenwert ist, es muss Ihr Schwellenwert sein, um einen Handel einzugehen, oder so etwas wie 0,75 oder so (eine Art Wahrscheinlichkeitswert).
Was hat der "Schwellenwert" mit Random Forest zu tun?
Bei der Logit-Regression kann ich mir vorstellen, wie die Klassenzuordnungswahrscheinlichkeiten aussehen, bei der Forest-Regression leider nicht. Es handelt sich also höchstwahrscheinlich um Pseudowahrscheinlichkeiten, und so sollte es nicht funktionieren. Bei einem Schwellenwert von 0,75 sollte es nicht bedeuten, dass die Wahrscheinlichkeit der Zuordnung zu einer Klasse höher ist als beispielsweise bei 0,6.
Zumindest habe ich keine Informationen darüber gelesen.Und ich akzeptiere die "Wahrscheinlichkeit" als einen wichtigen Teil des Random-Forest-Algorithmus, weil die Formel zur Berechnung des Ergebnisses aller Bäume darauf basiert.
Ich habe sogar die Anzahl der Bäume mit dieser "Wahrscheinlichkeit" im Hinterkopf festgelegt.
Und ich akzeptiere die "Wahrscheinlichkeit" als einen wichtigen Teil des Random-Forest-Algorithmus, weil die Formel für die Zählung der Ergebnisse aller Bäume darauf aufbaut.
Ich habe sogar die Anzahl der Bäume mit dieser "Wahrscheinlichkeit" im Hinterkopf festgelegt.
Berücksichtigen Sie, wie viele Blätter sich auf der Probefläche befinden? Die Größe des Ausschusses, der tatsächlich über die Situation abstimmt, angesichts der hohen Wahrscheinlichkeit, dass jedes Blatt eines solchen Baumes zuständig ist?
Berücksichtigen Sie, wie viele Blätter auf der Probefläche liegen? Wie groß ist der Ausschuss, der tatsächlich über die Situation abstimmt, angesichts der hohen Wahrscheinlichkeit, dass jedes Blatt eines solchen Baumes zuständig ist?
Der letzte Zweig ist für mindestens 25 Varianten der trainierten Stichprobe zuständig. Sie wird in den Spark-Parametern festgelegt. Einen solchen Parameter gibt es in AlgLib nicht.
Vielleicht habe ich mich nicht so ausgedrückt.
Nehmen wir an, wir haben 100 Bäume, und jedes Baumblatt macht eine Klassifizierung (im einfachen Fall von 2 Wahlmöglichkeiten). Berücksichtigen wir also die Tatsache, dass die Abstimmung Bäume mit einer sehr großen Fehlermarge beinhalten kann - zum Beispiel 49/51, was die durchschnittliche Vorhersage erheblich verzerren würde. Vielleicht sollten wir solche Blätter ganz aus dem Wahlrecht streichen? Denn die mangelnde Vorhersagefähigkeit sagt mehr über ein schlechtes Baumblattmodell aus, wenn es um spezifische Daten geht.
Neue Einstufung von Programmiersprachen wie Python und R
Gutes Zeug. Aber Ihre eigenen Schlussfolgerungen über R und Python sind weit hergeholt. Man kann sie nach Ihren Kriterien überhaupt nicht vergleichen - es ist wie warm und weich.
Genauer gesagt?
Ich vergleiche den Referenzapparat der Sprachen.
Wie wollen Sie es haben?
Und ganz konkret?
Ich vergleiche den Referenzapparat der Sprachen.
Wie wollen Sie es haben?