Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3385

 
Maxim Dmitrievsky #:
Wollten Sie nicht einen Artikel über Regeln schreiben, oder haben Sie Ihre Meinung geändert? Es ist wahrscheinlich ein interessantes Thema, interessanter als die Minimierung von Testfunktionen. Oder haben Sie Probleme mit deren Validierung auf OOS? Oder es gibt keine Probleme, sondern nur die Faulheit zu schreiben.
Ich weiß es nicht, es gibt nichts zu schreiben.
Ich werde schreiben, wie man ein Holzmodell in Regeln zerlegt, na und?
In meinem Beitrag steht eigentlich schon alles.

Oder beziehst du dich auf meinen alten Beitrag? Wenn ja, in der Spaltung fand ich keine super heilenden Eigenschaften, es gibt Pluspunkte, die das Modell nicht geben kann.

1. man kann die Dimensionalität des Modells drastisch reduzieren.



(2) Sie können die Statistiken der einzelnen Regeln kennen (das ist wirklich wichtig).

Wenn wir zum Beispiel ein Holzmodell mit 100 Regeln haben, wissen wir nie, ob jede Regel innerhalb von 100 Regeln einmal funktioniert hat (es gibt kein Muster) oder ob 10 Regeln 50 Mal funktioniert haben (es gibt ein Muster).
Wenn wir das Modell nicht zerbrechen, werden wir es nicht wissen und beide Modelle werden für uns gleich sein.

 
mytarmailS #:
Ich weiß nicht, ich habe nicht wirklich etwas zu schreiben.
Ich werde schreiben, wie man ein Holzmodell in Regeln zerlegt, na und?
Im Grunde hat mein Beitrag schon alles gezeigt.

Oder beziehst du dich auf meinen alten Beitrag? Wenn ja, bei der Spaltung habe ich keine super heilenden Eigenschaften gefunden, es gibt Pluspunkte, die das Modell nicht geben kann.

1. man kann die Dimensionalität des Modells drastisch reduzieren.



(2) Sie können die Statistiken der einzelnen Regeln kennen (das ist wirklich wichtig).

Wenn wir zum Beispiel ein Holzmodell mit 100 Regeln haben, wissen wir nie, ob jede Regel innerhalb von 100 Regeln einmal funktioniert hat (es gibt kein Muster) oder ob 10 Regeln 50 Mal funktioniert haben (es gibt ein Muster).
Wenn wir das Modell nicht brechen, werden wir es nicht wissen und beide Modelle werden für uns gleich sein.

Nun, in Bäumen kann man normalerweise den Einfluss jeder Beobachtung jedes Merkmals berechnen, seinen Beitrag zum Modell, zum Beispiel durch Shap-Werte. Wenn wir nur die nützlichen Merkmale übrig lassen und nur auf diese trainieren, erhalten wir eine ungefähre Entsprechung der Regelsuche. Mit Neuronen ist das übrigens auch möglich.

Es ist schwer zu verstehen, wann nur Regeln die einzig sinnvollen sein können. Vielleicht für die Interpretierbarkeit des Ergebnisses. Obwohl Shap-Werte auch eine gute Interpretierbarkeit bieten, sozusagen.
 
Maxim Dmitrievsky #:
Nun, in Bäumen kann man normalerweise den Einfluss jeder Beobachtung jedes Merkmals berechnen, seinen Beitrag zum Modell, zum Beispiel durch Shap-Werte. Wenn man nur die nützlichen belässt und nur auf ihnen etwas trainiert, erhält man eine ungefähre Entsprechung der Regelsuche. Mit Neuronen ist das übrigens auch möglich.

Es ist schwer zu verstehen, wann nur Regeln die einzig sinnvollen sein können. Vielleicht für die Interpretierbarkeit des Ergebnisses. Obwohl auch Shap-Werte eine gute Interpretierbarkeit ergeben, sozusagen.
Der Einfluss der einzelnen Merkmale, der Einfluss der einzelnen Beobachtungen und der Einfluss der einzelnen Regeln sind unterschiedlich.
 
mytarmailS #:
Die Auswirkungen der einzelnen Merkmale, die Auswirkungen der einzelnen Beobachtungen und die Auswirkungen der einzelnen Regeln sind unterschiedlich
Die Regeln sind die Elemente des Modells, die die Merkmale und Bezeichnungen miteinander verbinden. Das einzige Problem ist, dass neuronale Netze keine Diskontinuität haben, aber sie kann künstlich hergestellt werden.

Was ich damit sagen will, ist, dass ich nicht viel Sinn in Regeln sehe (sinnvollerweise eine Pfeife rauchen).
 
Maxim Dmitrievsky #:
Regeln sind die Elemente des Modells, die Attribute und Bezeichnungen verknüpfen. Das Einzige ist, dass neuronale Netze keine Diskontinuität haben, aber sie kann künstlich hergestellt werden.

Worauf ich hinaus will, ist, dass ich nicht viel Sinn in Regeln sehe.

Ich versuche es mal von Chabarowsk aus...


jedes Modell ist eine bestimmte Summe von Mustern, überspitzt gesagt kann man ein Muster als TS bezeichnen.


Stellen wir uns vor, dass ein Modell aus 100 TS besteht.


Es kann sein, dass in Modell #1 100 TSs einen Deal gemacht haben.

Es kann sein, dass in Muster #2 ein TS 100 Geschäfte gemacht hat und die anderen 99 kein einziges Geschäft gemacht haben.


Wie berechnet man Statistiken für jeden TS?

Wenn das Modell ein Regelmodell ist, ist es einfach und klar.

Wenn es sich um einneuronales Modell handelt?

 
mytarmailS #:

Ich werde es aus der Nähe von Chabarowsk versuchen.

Wenn das Modell ein Neuron ist?

/\
!
!

Arbeiten Sie und Sanych nicht im selben Studio?
Sie wählen Beispiele aus, die von den NS gut vorhergesagt werden. Sie trainieren einen anderen NS nur an ihnen. Wiederholen Sie das mehrmals, je nach Ihrem Geschmack. Nach ein paar Runden haben Sie den NS mit den besten "Regeln".

Auch einfach und ich würde nicht sagen unverständlich.
 
Maxim Dmitrievsky #:

Sie wählen Beispiele aus, die von der NS gut vorhergesagt werden. Trainieren Sie ein anderes NS nur an diesen Beispielen. Wiederholen Sie den Vorgang mehrmals, je nach Ihrem Geschmack. Nach mehreren Runden erhalten Sie den NS mit den besten "Regeln".
Nun, wir haben eine Teilstichprobe, die Neuronka gut vorhersagt. Woher wissen Sie, ob es ein Muster in dieser Teilstichprobe ist, zwei oder zwanzig? Kennen Sie den Unterschied wirklich nicht?

 
mytarmailS #:
Nun, wir haben eine Teilstichprobe, bei der die Neuronik gute Vorhersagen macht. Woher wissen Sie, ob es ein Muster in dieser Teilstichprobe ist, zwei oder zwanzig? Kennen Sie den Unterschied wirklich nicht?

Anhand der Anzahl der verbleibenden Beispiele. Es gibt so viele Beispiele, wie es Muster gibt. Das ist eine ungefähre Regel, ich sage nicht, dass es das Gleiche ist wie eine strenge Regel. Aber man kann die Stichprobe weiter unterteilen, bis hin zu einer vollständigen Unterteilung für jedes Muster.
 
Maxim Dmitrievsky #:
Nach der Anzahl der verbliebenen Beispiele. Es gibt so viele Beispiele, wie es Muster gibt.
Es kann 200 Beispiele und nur 5 Muster geben.
Ein Beispiel ist kein Muster, ein Beispiel ist eine Beobachtung.
 
mytarmailS #:
Es kann 200 Beispiele und nur 5 Muster geben.
Ein Beispiel ist kein Muster, ein Beispiel ist eine Beobachtung.
Wenn der Fehler bereits aufgehört hat zu fallen oder gleich Null ist, können Sie die verbleibenden Beispiele durch ein gewisses Maß an Nähe in Muster unterteilen :). Clustering, zum Beispiel. Und zählen, wie viele übrig sind. Und sogar eine gemittelte Bedingung für jedes Muster/Cluster schreiben (Zentroide der Cluster nehmen), dann erhält man eine Ausgaberegel.