Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2478

 
Maxim Dmitrievsky #:
Meiner Meinung nach gibt es hier eher einen Standardisierungs- als einen Ausgleichseffekt. Außerdem helfen Stichproben aus Verteilungen gegen Übertraining.

Habe ich es richtig verstanden, je mehr Proben, desto näher sind Ihre Zeichen an der Normung?

 
iwelimorn #:

Habe ich es richtig verstanden, dass die Zeichen umso näher an der Norm sind, je mehr Proben sie enthalten?

Es ist schwer zu sagen, was die optimale Stichprobengröße ist, wahrscheinlich hängt sie von der Anzahl der Komponenten von Gaußschen Mischungen ab. Zu große Stichproben führen bei verrauschten Datensätzen zur Erzeugung sehr ähnlicher Stichproben, d. h. die Wahrscheinlichkeit des Auftretens häufig wiederholter Stichproben steigt, da Gaußsche Regeln für die Dichteschätzung und -erzeugung verwendet werden. Daher ist es eher ein Nein als ein Ja.
Ich habe irgendwo gelesen, dass GMM bei großen Datensätzen nicht gut funktioniert.
 
Maxim Dmitrievsky #:
Es ist schwer zu sagen, was die optimale Stichprobengröße ist, sie hängt wahrscheinlich von der Anzahl der Gaußschen Mischungskomponenten ab. Eine zu große Stichprobe mit einem verrauschten Datensatz führt zur Erzeugung sehr ähnlicher Stichproben, d. h. die Wahrscheinlichkeit des Auftretens häufig wiederholter Stichproben nimmt zu, da Gaußsche Regeln für die Dichteschätzung und -erzeugung verwendet werden. Es ist also eher ein Nein als ein Ja.

Danke. Wahrscheinlich habe ich die Frage nicht richtig gestellt. Ich meinte, ob es möglich ist, dass eine größere Anzahl von Stichproben zu einer standardisierteren Stichprobe führen würde.

 
iwelimorn #:

Ich danke Ihnen. Wahrscheinlich habe ich die Frage nicht richtig gestellt. Ich meinte, ob es möglich ist, dass eine größere Anzahl von Stichproben eine stärker standardisierte Stichprobe ergibt.

Ja, natürlich
 
iwelimorn #:

Ich danke Ihnen. Wahrscheinlich habe ich die Frage nicht richtig gestellt. Ich meinte, ob es möglich ist, dass eine größere Anzahl von Stichproben eine stärker standardisierte Stichprobe ergibt.

Wichtig ist, dass es bei der Erstellung der Stichprobe möglichst wenige Unstimmigkeiten gibt, sonst ist das Training nutzlos. Stellen Sie sich vor, dass in einem Fall mit demselben Wert des Eingangsvektors das Ziel den Wert 1 hat und im nächsten Fall mit demselben Eingangsvektor das Ziel den Wert 0. Was soll der Algorithmus dann tun? Wie soll man reagieren? Eine Vergrößerung der Trainingsstichproben ist also nur dann relevant, wenn sie nicht zu einem Anstieg der Widersprüche führt. Es ist eine philosophische Frage. Zum Beispiel decke ich 3 Monate des Marktes auf M5 mit 100 Trainingsproben ab. Zum Beispiel...
 
Übrigens gibt es auch eine Dame in unseren Reihen, wie ich höre. Das ist ein wirklich seltener Fall, man könnte sagen, eine Ausnahme von der Regel... :-)
 
Mihail Marchukajtes #:
Es ist wichtig, bei der Bildung der Stichprobe so wenig Widersprüche wie möglich zu haben, sonst ist das Training nutzlos . Stellen Sie sich vor, dass in einem Fall mit demselben Wert des Eingangsvektors das Ziel den Wert 1 hat, und im nächsten Fall mit demselben Eingangsvektor das Ziel den Wert 0. Was soll der Algorithmus dann tun? Wie soll man reagieren? Eine Vergrößerung der Trainingsstichproben ist also nur dann relevant, wenn sie nicht zu einem Anstieg der Widersprüche führt. Es ist eine philosophische Frage. Zum Beispiel decke ich 3 Monate des Marktes auf M5 mit 100 Trainingsproben ab. Zum Beispiel...

Haben Sie überhaupt verstanden, was Sie geschrieben haben?

 

Mihail Marchukajtes #:
Es ist wichtig, bei der Bildung der Stichprobe so wenig Widersprüche wie möglich zu haben, sonst ist das Training nutzlos. Stellen Sie sich vor, dass in einem Fall mit demselben Wert des Eingangsvektors das Ziel den Wert 1 hat, und im nächsten Fall mit demselben Eingangsvektor das Ziel den Wert 0. Was soll der Algorithmus dann tun? Wie soll man reagieren? Eine Vergrößerung der Trainingsstichproben ist also nur dann relevant, wenn sie nicht zu einem Anstieg der Widersprüche führt. Es ist eine philosophische Frage. Zum Beispiel decke ich 3 Monate des Marktes auf M5 mit 100 Trainingsproben ab. Zum Beispiel...

Ich stimme Ihnen zu, wenn ein und dasselbe Beispiel mehrere Zustände beschreibt, dann erhalten wir bei der Klassifizierung durch einen beliebigen verfügbaren Algorithmus eine Wahrscheinlichkeit nahe 1/n, wobei n die Anzahl der Zustände ist.

Aber es gibt keine absolut ähnlichen Beispiele, sie sind bis zu einem gewissen Grad ähnlich. Die Frage ist, wie man diese "Ähnlichkeit" feststellen kann.


100 Exemplare in drei Monaten auf der M5... Ich frage mich... Wählen Sie aus der ursprünglichen Stichprobe nach den Regeln Proben aus , die Sie dann beim Handel verwenden?

 
iwelimorn #:

Ich stimme Ihnen zu, wenn das gleiche Beispiel mehrere Zustände beschreibt, erhalten wir eine Wahrscheinlichkeit nahe 1/n, wobei n die Anzahl der Zustände ist, wenn wir mit einem beliebigen verfügbaren Algorithmus klassifizieren.

Aber es gibt keine absolut ähnlichen Beispiele, sie sind bis zu einem gewissen Grad ähnlich. Die Frage ist, wie man diese "Ähnlichkeit" feststellen kann.


100 Exemplare in drei Monaten auf der M5... Ich frage mich... Wählen Sie aus der ursprünglichen Stichprobe nach den Regeln Proben aus , die Sie dann beim Handel verwenden?

Wenn der gleiche Satz unabhängiger Variablen in der Trainingsstichprobe nur einer abhängigen Variable entspricht, handelt es sich um eine deterministische Reihe.

Hier gibt es nichts zu klassifizieren - der Vorhersagefehler ist 0.

Ja, es ist schon eine Qual.

 
Dmytryi Nazarchuk #:

Wenn der gleiche Satz unabhängiger Variablen in der Trainingsstichprobe nur einer abhängigen Variable entspricht, handelt es sich um eine deterministische Reihe.

Hier gibt es nichts zu klassifizieren - der Vorhersagefehler ist 0.

Ja, das ist eine Qual.

Danke, vielleicht ist es nicht die Qual, sondern mein Mangel an Grundlagenwissen.

Gilt dies auch, wenn mehrere Sätze unabhängiger Variablen derselben Variablen entsprechen?