Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1038

 
Roffild:
Was hat das mit der "Schwelle" für einen Random Forest zu tun?

Ich weiß nicht mehr, wie hoch der Schwellenwert ist, es muss Ihr Schwellenwert sein, um einen Handel einzugehen, oder so etwas wie 0,75 oder so (eine Art Wahrscheinlichkeitswert).

 
Roffild:
Was hat der "Schwellenwert" mit Random Forest zu tun?

Bei der Logit-Regression kann ich mir vorstellen, wie die Klassenzuordnungswahrscheinlichkeiten aussehen, bei der Forest-Regression leider nicht. Es handelt sich also höchstwahrscheinlich um Pseudowahrscheinlichkeiten, und so sollte es nicht funktionieren. Bei einem Schwellenwert von 0,75 sollte es nicht bedeuten, dass die Wahrscheinlichkeit der Zuordnung zu einer Klasse höher ist als beispielsweise bei 0,6.

Zumindest habe ich keine Informationen darüber gelesen.
 

Und ich akzeptiere die "Wahrscheinlichkeit" als einen wichtigen Teil des Random-Forest-Algorithmus, weil die Formel zur Berechnung des Ergebnisses aller Bäume darauf basiert.

Ich habe sogar die Anzahl der Bäume mit dieser "Wahrscheinlichkeit" im Hinterkopf festgelegt.

 
Roffild:

Und ich akzeptiere die "Wahrscheinlichkeit" als einen wichtigen Teil des Random-Forest-Algorithmus, weil die Formel für die Zählung der Ergebnisse aller Bäume darauf aufbaut.

Ich habe sogar die Anzahl der Bäume mit dieser "Wahrscheinlichkeit" im Hinterkopf festgelegt.

Berücksichtigen Sie, wie viele Blätter sich auf der Probefläche befinden? Die Größe des Ausschusses, der tatsächlich über die Situation abstimmt, angesichts der hohen Wahrscheinlichkeit, dass jedes Blatt eines solchen Baumes zuständig ist?

 
Aleksey Vyazmikin:

Berücksichtigen Sie, wie viele Blätter auf der Probefläche liegen? Wie groß ist der Ausschuss, der tatsächlich über die Situation abstimmt, angesichts der hohen Wahrscheinlichkeit, dass jedes Blatt eines solchen Baumes zuständig ist?

Der letzte Zweig ist für mindestens 25 Varianten der trainierten Stichprobe zuständig. Sie wird in den Parametern von Spark festgelegt. Einen solchen Parameter gibt es in AlgLib nicht.
 
Roffild:
Der letzte Zweig ist für mindestens 25 Varianten der trainierten Stichprobe zuständig. Sie wird in den Spark-Parametern festgelegt. Einen solchen Parameter gibt es in AlgLib nicht.

Vielleicht habe ich mich nicht so ausgedrückt.

Nehmen wir an, wir haben 100 Bäume, und jedes Baumblatt macht eine Klassifizierung (im einfachen Fall von 2 Wahlmöglichkeiten). Berücksichtigen wir also die Tatsache, dass die Abstimmung Bäume mit einer sehr großen Fehlermarge beinhalten kann - zum Beispiel 49/51, was die durchschnittliche Vorhersage erheblich verzerren würde. Vielleicht sollten wir solche Blätter ganz aus dem Wahlrecht streichen? Denn die mangelnde Vorhersagefähigkeit sagt mehr über ein schlechtes Baumblattmodell aus, wenn es um spezifische Daten geht.

 
Neue Einstufung von Programmiersprachen wie Python und R
 
SanSanych Fomenko:
Neue Einstufung von Programmiersprachen wie Python und R
Gutes Zeug. Aber Ihre eigenen Schlussfolgerungen über R und Python sind weit hergeholt. Sie lassen sich nach Ihren Kriterien überhaupt nicht vergleichen - es ist wie warm und weich.
 
Yuriy Asaulenko:
Gutes Zeug. Aber Ihre eigenen Schlussfolgerungen über R und Python sind weit hergeholt. Man kann sie nach Ihren Kriterien überhaupt nicht vergleichen - es ist wie warm und weich.

Genauer gesagt?

Ich vergleiche den Referenzapparat der Sprachen.

Wie wollen Sie es haben?

 
SanSanych Fomenko:

Und ganz konkret?

Ich vergleiche den Referenzapparat der Sprachen.

Wie wollen Sie es haben?

Quantitativ gesehen gibt es zwar mehr Kraftfahrzeuge als Traktoren, aber es ist unsinnig, sie miteinander zu vergleichen.
Was die Hilfe angeht, so sind beide sehr umfangreich. In Bezug auf die Module überschneiden sie sich teilweise.
Python hat eine Portierung in R, glaube ich, und R in Python.
Wenn Sie eine komplexe Aufgabe haben, müssen Sie etwas von außen portieren, wenn Sie in einer beliebigen Umgebung und in einer beliebigen Sprache arbeiten. Ob es Ihnen gefällt oder nicht, Sie müssen zusätzlich einen Lkw, einen Traktor und einen Bagger haben.