Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3325

 
mytarmailS #:

Ist das Trolling?

Was ist Trolling?

Hier ist das Video.


 
Aleksey Vyazmikin #:

Was ist das für ein Trolling?

Hier ist das Video

Es istso.

 
mytarmailS #:

wie diese

Bei mir ging es um einen Ort im Internet, also einen Link.

 
Aleksey Vyazmikin #:

Bei mir ging es um einen Ort im Internet, d. h. einen Link.

Ich erinnere mich nicht mehr an den genauen Artikel,

aber es gibt nicht eine Million davon, schauen Sie nach.

 
mytarmailS #:

Ich kann mich nicht mehr an den Artikel erinnern,

aber es gibt nicht eine Million davon, schlagen Sie es nach.

Ich habe also eine Suche durchgeführt und noch nichts gefunden.

 
Aleksey Vyazmikin #:

Das ist mir klar geworden. Ich wollte nur wissen, ob die Ursache dafür gefunden wurde. Nicht was kaputt ist, sondern warum die Signale fehlen.

Der Grund ist einfach, so wie es beabsichtigt war - die Signale fehlen, weil bei neuen Daten die Signale außerhalb eines engen akzeptablen Bereichs liegen.

Man kann es mit einer Klassifizierung vergleichen: Es gibt eindeutige bekannte Muster und es gibt obskure unbekannte Muster. Mit der Zeit gibt es immer mehr Unbekannte, und in der "bekannten" Klasse ist nichts mehr übrig.

 
Aleksey Vyazmikin #:

Es wird behauptet, dass es mit diesem Algorithmus möglich war, erste Plätze auf Cagle zu gewinnen, ich glaube nicht, dass es einfache Aufgaben waren...

Sollen wir versuchen, es herauszufinden? Ich verstehe keine Formeln - zu meinem großen Bedauern.

Ich stehe auch nicht auf Formeln, sondern auf Ideen.
Und wenn man die Idee aufschlüsselt, ist sie so schlecht für Marktdaten.

Sie schlägt vor, Paare von Beispielen verschiedener Klassen zu löschen, die sehr nahe beieinander liegen. Betrachten wir das dritte Beispiel, so werden idealerweise alle Beispiele zwischen 0,2 und 0,8 entfernt, und nur die Bereiche unter 0,2 und über 0,8 mit absoluter Reinheit der Klassen bleiben übrig. Ein beliebiges Modell würde sie dann leicht klassifizieren.
Ich habe bereits gezeigt, dass sich ein solch einfaches Beispiel und der Baum leicht teilen lassen, wenn man Blätter mit hoher Klassenreinheit verwendet (und Blätter mit bis zu einem Beispiel in einem Blatt nicht teilt).
Aber dies ist ein künstliches Beispiel.

Bei Marktdaten wird es keine solchen reinen Blöcke mit Vorherrschaft einer Klasse geben. D.h. man wird fast alles bereinigen müssen. Zum Beispiel gab es 1000 Punkte, 900 wurden gesäubert, der Rest erreichte irgendwie die Sauberkeit von Blättern, zum Beispiel 70% - das scheint nicht schlecht zu sein, und man kann Geld verdienen. Aber wenn Sie beginnen, wirklich zu handeln, dann wird es Beispiele, die wir losgeworden, wenn die Reinigung (9 Müll für 1 verbleibenden) und Indikatoren von 70% wird auf 53% zum Beispiel fallen und Sie werden auf Spread, Slippages, etc. verlieren

Ich bevorzuge einen Baum und ein Blatt mit ehrlichen 53% der Reinheit von einer der Klassen. Und werde es nicht verwenden.
 
Aleksey Vyazmikin #:

Ich habe also eine Suche durchgeführt und bisher nichts gefunden.

es passiert

 
Aleksey Vyazmikin #:

Ich sehe hier keinen Zusammenhang. Woraus folgt das?

Wenn ich den Text auf deinem Link lese, gibt es sogar ein Theorem über ihre Verbindung. Sei nicht so faul, wenigstens deine Links zu lesen.
 
Forester #:
Ich verwende auch keine Formeln, sondern Ideen.
Und wenn man die Idee aufschlüsselt, ist sie für Marktdaten nicht so gut geeignet.

Sie schlägt vor, Paare von Beispielen verschiedener Klassen zu entfernen, die sehr nahe beieinander liegen. Betrachten wir das dritte Beispiel, so werden idealerweise alle Beispiele zwischen 0,2 und 0,8 entfernt, und es verbleiben nur Bereiche unter 0,2 und über 0,8 mit absoluter Reinheit der Klassen. Ein beliebiges Modell würde sie dann leicht klassifizieren.
Ich habe bereits gezeigt, dass sich ein solch einfaches Beispiel und der Baum leicht teilen lassen, wenn man Blätter mit hoher Klassenreinheit verwendet (und Blätter mit bis zu einem Beispiel in einem Blatt nicht teilt).
Aber dies ist ein künstliches Beispiel.

Bei Marktdaten wird es keine solchen reinen Blöcke mit Vorherrschaft einer Klasse geben. D.h. man wird fast alles bereinigen müssen. Zum Beispiel gab es 1000 Punkte, 900 wurden gesäubert, der Rest erreichte irgendwie die Sauberkeit von Blättern, zum Beispiel 70% - das scheint nicht schlecht zu sein, und man kann Geld verdienen. Aber wenn Sie beginnen, wirklich zu handeln, dann wird es Beispiele, die wir losgeworden, wenn die Reinigung (9 Müll für 1 verbleibenden) und Indikatoren von 70% wird auf 53% zum Beispiel fallen und Sie werden auf Spread, Slippages verlieren, etc.

Ich bevorzuge einen Baum und ein Blatt mit ehrlichen 53% der Reinheit von einer der Klassen. Und werde es nicht verwenden.

An diesem Punkt stimmen unsere Gedanken überein, was das Ergebnis angeht. Ja, ich erwarte eine stark ausgedünnte Stichprobe, aber so wie ich das verstehe, ist der Prozess iterativ, was bedeutet, dass man das Maß kennt und viel früher aufhören kann und die gleichen Daten verwenden kann, um die gleichen Holzmodelle zu erstellen, die weniger Splits und zuverlässigere Werte in den Blättern haben werden.

Verstehe ich das richtig, dass die anfänglichen Zentren zufällig angeordnet sind?