Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3178

 
Forester #:
Wäre es nicht ausreichend, die Spalte mit der Zielspalte zu mischen?
Tail und andere Parameter der Serie bleiben gleich. Ich denke, das ist ein Pluspunkt.

Es ist aber auch nicht schlecht. Es ist wahrscheinlich besser, beide Methoden auszuprobieren. Wenn es viele Ausreißer in den Merkmalen gibt (starke Schwänze), können die Ergebnisse unterschiedlich ausfallen, was zusätzliche Informationen liefern kann.

 
Aleksey Vyazmikin #:

Das Problem der Sektierer ist ihre Angst, dass ihre religiösen Grundsätze auf den Prüfstand gestellt werden.

Es gibt immer viele Muster - man muss nur das richtige auswählen.

Zumindest habe ich es versucht.

 
Aleksey Vyazmikin #:

Können Sie das näher erläutern - ich verstehe es nicht.

Eine bekanntermaßen bedeutungslose Aufgabe kann einfach durch zufälliges Mischen von Bezeichnungen erhalten werden (oder durch zufällige Erzeugung von Bezeichnungen mit Wahrscheinlichkeiten, die der Häufigkeit der Klassen entsprechen).

Die Idee ist immer noch dieselbe - man nimmt eine große Stichprobe aus den Ergebnissen einer großen Anzahl absichtlich bedeutungsloser Aufgaben, um sie mit dem Ergebnis der echten Aufgabe zu vergleichen. Wenn das tatsächliche Ergebnis nicht im Schwanz dieser Stichprobe liegt, ist die Methode eher schlecht.

 
Maxim Dmitrievsky #:

Zumindest habe ich es versucht.

Verstehen Sie, wofür es in CatBoost eine Möglichkeit gibt, verschiedene Methoden der Quantifizierung von Indikatoren der Prädiktoren zu verwenden?

Glauben Sie, dass die Programmierer diese Möglichkeit einfach für diejenigen gelassen haben, die nicht genug operativen Speicher haben?

Oder ist den Entwicklern klar, dass das Ergebnis des Trainings direkt von diesen Tabellen abhängt?

Und am Ende - nehmen Sie sich selbst und ordnen Sie die Tabelleneinstellungen neu an und schauen Sie sich die Variabilität des Ergebnisses an.

Dann werden Sie darüber nachdenken, warum dies geschieht, und vielleicht beginnen Sie, mich besser zu verstehen.


Und alle Aussagen im Stil eines Predigers/Propheten/Jurodikers sind nicht informativ. Ich interpretiere sie als Wunsch, mit meiner Person zu protzen.

 
Aleksey Nikolayev #:

Man kann eine bedeutungslose Aufgabe erhalten, indem man die Bezeichnungen einfach zufällig mischt (oder sie zufällig mit Wahrscheinlichkeiten erzeugt, die der Häufigkeit der Klassen entsprechen).

Die Idee ist dieselbe - eine große Stichprobe der Ergebnisse einer großen Anzahl von offensichtlich bedeutungslosen Aufgaben zu erhalten, um sie mit dem Ergebnis der echten Aufgabe zu vergleichen. Wenn das tatsächliche Ergebnis nicht im Schwanz dieser Stichprobe liegt, ist die Methode eher schlecht.

Vielleicht ist es besser, zu "mischen", um das Verhältnis von Nullen und Einsen zu erhalten.

 
Aleksey Vyazmikin #:

Verstehen Sie, warum CatBoost die Möglichkeit hat, verschiedene Methoden zur Quantifizierung von Prädiktoren zu verwenden?

Glauben Sie, dass die Programmierer diese Möglichkeit einfach für diejenigen vorgesehen haben, die nicht über genügend Arbeitsspeicher verfügen?

Oder ist den Entwicklern klar, dass das Ergebnis des Trainings direkt von diesen Tabellen abhängt?

Und am Ende - nehmen Sie sich selbst und ordnen Sie die Tabelleneinstellungen neu an und schauen Sie sich die Variabilität des Ergebnisses an.

Dann werden Sie darüber nachdenken, warum das so ist, und vielleicht beginnen Sie, mich besser zu verstehen.


Und alle Aussagen im Stil eines Predigers/Propheten/Jurodikers sind nicht informativ. Sie werden von mir als Wunsch interpretiert, mit der eigenen Person zu protzen.

Es wird vorgeschlagen, die Entwickler in ihrem Warenkorb zu fragen, denn ich weiß nicht, was sie tun.
 
Maxim Dmitrievsky #:
Es wird vorgeschlagen, die Entwickler in ihrem Warenkorb zu fragen

nicht. Für den Fall, dass sie falsch antworten)

 
Aleksey Nikolayev #:

Nicht. Für den Fall, dass sie falsch antworten)

😁😁
 
Maxim Dmitrievsky #:
Es wird vorgeschlagen, die Entwickler in ihrem Wagen zu fragen, denn ich weiß nicht, was sie tun

Fragen Sie sie, denn Sie verstehen es nicht.

Außerdem führen einige Booster nach jedem Split eine Quantisierung des Prädiktors durch und quantifizieren den Rest.

Nun, ich bin nicht der Einzige, der das macht, auch die Teilnehmer erwähnen manchmal eine Arbeit in dieser Richtung.

Wie auch immer, ich will Sie nicht weiter belehren.

 
Aleksey Vyazmikin #:

Fragen Sie, wenn Sie etwas nicht verstehen.

Außerdem quantifizieren einige Booster den Prädiktor nach jedem Split und quantifizieren den Rest.

Nun, nicht nur ich verwende diese Methode, auch Teilnehmer von Wettbewerben erwähnen manchmal Arbeiten in dieser Richtung.

Wie dem auch sei, ich werde Sie nicht weiter belehren.

und warum sollte ich fragen, ob die Konvertierung von Flotten in Ints hauptsächlich für die Beschleunigung bei sehr großen Daten benötigt wird

Der Bonus kann eine kleine Kalibrierung des Modells zum Guten oder Schlechten sein, wie es der Zufall will.

Sie werden dir einfach die gleiche Antwort geben, also hast du wahrscheinlich Angst zu fragen, weil es all deine jahrelange harte Arbeit entwertet :)

Es ist ein Stöbern in der Unterwäsche des Algorithmus.