Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3187

 
Ich habe den Sinn des Geschehens überhaupt nicht verstanden, aber das ist ein normaler Zustand für mich.
 
fxsaber #:.

ZЫ Im Allgemeinen, wenn es Interesse zu versuchen, Unterschiede zwischen den beiden Zeilen zu finden, können sie bieten.

Schauen Sie sich an, was ich Ihnen geschrieben habe. Werde erst im Herbst in der Lage sein, es selbst zu betrachten.

 
Aleksey Nikolayev #

Förster#:

Ich habe ein Experiment mit der Stichprobe gemacht, auf der ich die Gifs veröffentlicht habe, es gibt bereits 47% Einheiten in der Stichprobe, die Daten sind in einer Tabelle zusammengefasst.


Beschreibung des Inhalts der Spalten:

  • Erzeugung - die Anzahl der zufälligen Erzeugung des Ziels mit einer festen Anzahl von "1" und "0", die letzte Zeile - das ursprüngliche Ziel
  • % Similarity of all - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben.
  • % Ähnlichkeit "1" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für die Antwort "1".
  • % Ähnlichkeit "0" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für eine Antwort "0".
  • Q_All - wie viele Quantensegmente insgesamt unter Verwendung von 870 Quantentabellen und 6533 Prädikaten gefunden wurden
  • Q_All% - wie viele "Q_All" als Prozentsatz der Stichprobe mit dem ursprünglichen Ziel
  • Q sampled - zeigt an, wie viele Quantensegmente abgetastet wurden (nur diejenigen, die sich im Bereich nicht überschneiden, werden abgetastet)
  • Q selected% - wie viele "Q selected" als prozentualer Ausdruck aus der Stichprobe mit dem ursprünglichen Ziel.
  • Prädiktoren - für wie viele Prädiktoren aus der Stichprobe konnte ein Quantensegment gefunden werden, das die vorgegebenen Kriterien erfüllt
  • Prädiktoren % - wie viele "Prädiktoren" in prozentualer Ausprägung aus der Stichprobe mit ursprünglichem Ziel

Lassen Sie mich erklären, dass für einen Prädiktor insgesamt mehr als ein Quantensegment ausgewählt werden kann, und dass sich diese Segmente im Bereich des Prädiktorwertes nicht überschneiden sollten.

Was mir nicht gefällt, ist, dass in der Nähe von 50 % der Zielvorgaben keine Überschneidungen auftreten, was sich negativ auf die Bewertung des Ergebnisses auswirken kann.

Tatsächlich stellte sich heraus, dass eine ganze Reihe von Quantensegmenten auf zufälligen Zielen gefunden wurden, aber da es sich um einige Cluster handelte (vermutlich), überlappten verschiedene Tabellen ihre Koordinaten, so dass sich nach der Auswahl nicht überlappender Bereiche herausstellte, dass die Qualität (der Nutzen) dieser Quantensegmente um den Faktor 10 schlechter (weniger) ist als die ursprünglichen. Dementsprechend wurden bei der Stichprobe mit dem ursprünglichen Ziel im Durchschnitt 3,5-mal mehr Quantenschnitte für verschiedene Prädiktoren gefunden.

Was halten Sie von diesen Ergebnissen?

Hinzugefügt:

Das Binärsequenzdiagramm des Zufallsziels und des Originalziels sieht wie folgt aus


 
Aleksey Vyazmikin #:

Ich habe ein Experiment mit der Stichprobe durchgeführt, auf der ich die Gifs veröffentlicht habe, es gibt bereits 47% Einheiten in der Stichprobe, die Daten sind in der Tabelle zusammengefasst.


Beschreibung des Inhalts der Spalten:

  • Erzeugung - die Anzahl der zufälligen Erzeugung des Ziels mit einer festen Anzahl von "1" und "0", die letzte Zeile - das ursprüngliche Ziel
  • % Ähnlichkeit aller - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben.
  • % Ähnlichkeit "1" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für die Antwort "1".
  • % Ähnlichkeit "0" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für eine Antwort "0".
  • Q_All - wie viele Quantensegmente insgesamt unter Verwendung von 870 Quantentabellen und 6533 Prädikaten gefunden wurden
  • Q_All% - wie viele "Q_All" als Prozentsatz der Stichprobe mit dem ursprünglichen Ziel
  • Q sampled - zeigt an, wie viele Quantensegmente abgetastet wurden (nur diejenigen, die sich im Bereich nicht überschneiden, werden abgetastet)
  • Q selected% - wie viele "Q selected" als prozentualer Ausdruck aus der Stichprobe mit dem ursprünglichen Ziel.
  • Prädiktoren - für wie viele Prädiktoren aus der Stichprobe konnte ein Quantensegment gefunden werden, das die vorgegebenen Kriterien erfüllt
  • Prädiktoren % - wie viele "Prädiktoren" in prozentualer Ausprägung aus der Stichprobe mit ursprünglichem Ziel

Lassen Sie mich erklären, dass für einen Prädiktor insgesamt mehr als ein Quantensegment ausgewählt werden kann, und dass sich diese Segmente im Bereich des Prädiktorwertes nicht überschneiden sollten.

Was mir nicht gefällt, ist, dass in der Nähe von 50 % der Zielvorgaben keine Überschneidungen auftreten, was sich negativ auf die Bewertung des Ergebnisses auswirken kann.

Tatsächlich stellte sich heraus, dass eine ganze Reihe von Quantensegmenten auf zufälligen Zielen gefunden wurden, aber da es sich um einige Cluster handelte (vermutlich), überlappten verschiedene Tabellen ihre Koordinaten, so dass sich nach der Auswahl nicht überlappender Bereiche herausstellte, dass die Qualität (der Nutzen) dieser Quantensegmente um den Faktor 10 schlechter (weniger) ist als die ursprünglichen. Dementsprechend wurden in der Stichprobe mit dem ursprünglichen Ziel im Durchschnitt 3,5-mal mehr Quantensegmente für verschiedene Prädiktoren gefunden.

Was halten Sie von den Ergebnissen?

Frage für Alexej. Ich bin kein Experte für statistische Theorie. Ich habe lediglich vorgeschlagen, das Ziel zu mischen, anstatt es zu erzeugen.
 
Forester #:
Frage an Alexej. Ich bin nicht gut in statistischer Theorie. Ich habe nur vorgeschlagen, das Ziel statt der Generation zu mischen.

Aha, ich verstehe.

Ich habe noch einen anderen Vorschlag für Sie: Wie wäre es, wenn wir den Prozess der Waldkonstruktion überschaubarer machen und eine bestimmte Teilstichprobe des ausgewählten Quantensegments als Wurzel für jeden Baum nehmen?

Die Tiefe sollte etwa 2-3 Splits betragen, so dass die Beispiele der klassifizierbaren Klasse pro Blatt mindestens 1 % betragen würden.

Ich denke, das Modell wird stabiler sein.

 
Aleksey Vyazmikin #:

Ich habe ein Experiment mit der Stichprobe durchgeführt, auf der ich die Gifs veröffentlicht habe, es gibt bereits 47% Einheiten in der Stichprobe, die Daten sind in der Tabelle zusammengefasst.


Beschreibung des Inhalts der Spalten:

  • Erzeugung - die Anzahl der zufälligen Erzeugung des Ziels mit einer festen Anzahl von "1" und "0", die letzte Zeile - das ursprüngliche Ziel
  • % Similarity of all - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben.
  • % Ähnlichkeit "1" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für die Antwort "1".
  • % Ähnlichkeit "0" - der Prozentsatz der Ähnlichkeit des Ziels wird angegeben, aber nur für eine Antwort "0".
  • Q_All - wie viele Quantensegmente insgesamt unter Verwendung von 870 Quantentabellen und 6533 Prädikaten gefunden wurden
  • Q_All% - wie viele "Q_All" als Prozentsatz der Stichprobe mit dem ursprünglichen Ziel
  • Q sampled - zeigt an, wie viele Quantensegmente abgetastet wurden (nur diejenigen, die sich im Bereich nicht überschneiden, werden abgetastet)
  • Q selected% - wie viele "Q selected" als prozentualer Ausdruck aus der Stichprobe mit dem ursprünglichen Ziel.
  • Prädiktoren - für wie viele Prädiktoren aus der Stichprobe konnte ein Quantensegment gefunden werden, das die vorgegebenen Kriterien erfüllt
  • Prädiktoren % - wie viele "Prädiktoren" in prozentualer Ausprägung aus der Stichprobe mit ursprünglichem Ziel

Lassen Sie mich erklären, dass für einen Prädiktor insgesamt mehr als ein Quantensegment ausgewählt werden kann, und dass sich diese Segmente im Bereich des Prädiktorwertes nicht überschneiden sollten.

Was mir nicht gefällt, ist, dass in der Nähe von 50 % der Zielvorgaben keine Überschneidungen auftreten, was sich negativ auf die Bewertung des Ergebnisses auswirken kann.

Tatsächlich stellte sich heraus, dass eine ganze Reihe von Quantensegmenten auf zufälligen Zielen gefunden wurden, aber da es sich um einige Cluster handelte (vermutlich), überlappten verschiedene Tabellen ihre Koordinaten, so dass sich nach der Auswahl nicht überlappender Bereiche herausstellte, dass die Qualität (der Nutzen) dieser Quantensegmente um den Faktor 10 schlechter (weniger) ist als die ursprünglichen. Dementsprechend wurden bei der Stichprobe mit dem ursprünglichen Ziel im Durchschnitt 3,5-mal mehr Quantenschnitte für verschiedene Prädiktoren gefunden.

Was halten Sie von diesen Ergebnissen?

Hinzugefügt:

Das Binärsequenzdiagramm des Zufallsziels und des Originalziels sieht wie folgt aus


Zehn Simulationen sind nichts, für statistische Signifikanz braucht man Tausende.

Ich bin auch nicht bereit, eine Expertenmeinung zu einem bestimmten Fall abzugeben, sondern habe nur auf mögliche Probleme und übliche Lösungswege hingewiesen.

 
Aleksey Vyazmikin #:

Was halten Sie von den Ergebnissen?

Hinzugefügt:

Das binäre Sequenzdiagramm der Ziel-Zufallszahl und des Originals sieht wie folgt aus

Du machst einen sinnlosen und unerbittlichen Blödsinn. Saber hat es wenigstens in einer halben Stunde geschafft und es vergessen.
 
Aleksey Nikolayev #:

Zehn Simulationen sind nichts, für statistische Signifikanz braucht man Tausende.

Ich bin auch nicht bereit, eine Expertenmeinung zu einem bestimmten Fall abzugeben, sondern habe lediglich auf mögliche Probleme und gängige Lösungsmöglichkeiten hingewiesen.

Tausende - es braucht zu viele Rechenressourcen - ein Durchgang - etwa 40 Minuten - einfache Berechnung auf einer Grafikkarte.

Ich dachte allgemein, dass dieser Test nur die Möglichkeit solcher Cluster in verschiedenen Bereichen des Prädiktors prüft.

Und es ist notwendig, die Wahrscheinlichkeit des Auftreffens eines bestimmten Bereichs des Quantensegments zu prüfen, der bereits zu Beginn ausgewählt wurde.

Und dennoch würde ich gerne die Meinung zur Frage des Unterschieds des Ziels im Prozentausdruck für die Zuverlässigkeit eines solchen Tests hören.

 
Maxim Dmitrievsky #:
Du machst einen sinnlosen und unerbittlichen Blödsinn. Saber hat es wenigstens in einer halben Stunde geschafft und es vergessen.

Behalten Sie Ihre Bewertungen der Leistungen anderer für sich, vor allem, wenn Sie nicht verstehen, was die andere Person tut.

Ich bin offen für konstruktive Kritik, und von Ihnen kommt keine.

 
Aleksey Vyazmikin #:

Behalten Sie Bewertungen der Leistungen anderer für sich, vor allem wenn Sie nicht verstehen, was die andere Person tut.

Ich bin offen für konstruktive Kritik, du aber nicht.

Du machst einen Scheißdreck. Es wurde schon mehrmals geschrieben, dass Sie JEDE Leistung nach dem Zufallsprinzip erhalten. Öffne deine Augen um zu sehen. Dem ist nichts hinzuzufügen :)

Kannst du wenigstens verstehen, was du tust und warum?)