Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2385

 
Maxim Dmitrievsky:

Ich glaube, Alexey schlug Rechenleistung vor, er rechnet gerne etwas Langes, vielleicht solltest du eine Koop machen :)

R ohne Vectoring wird immer noch langsam sein. Sie könnten eine schnelle Datenbank verwenden

Ich habe langsame Teile vektorisiert, die Logik des Algorithmus sollte optimiert werden, ich versuche es jetzt herauszufinden, ich habe schon 5 Mal versucht, es zu beschleunigen, ich habe den Code umgeschrieben...

Mehr Zeichen sind so wenig, so primitiv, ich sollte auch etwas damit machen, das Ziel gefällt mir nicht so gut...

Oh Scheiße... es ist wie eine Reparatur, Ego kann nur beginnen ...

 
mytarmailS:

Natürlich nicht, und selbst wenn, würde es mich in keiner Weise beeinflussen.)

Versuchen Sie es, aber das Ergebnis wird bestenfalls dasselbe sein wie bei Random Forest, d.h. kein...


Die Forrest-Ausgabe ist die Summe der ausgelösten Regeln, die Regeln werden nicht herausgefiltert und in irgendeiner Weise zurückgewiesen, und die zurückgewiesenen Regeln liegen bei 100 %)

Regeln werden nicht auf Wiederholbarkeit (es kann nur eine Antwort geben) oder Angemessenheit (funktioniert sie) geprüft; Regeln werden einfach auf die Daten übertragen (das Modell passt zu den Daten)

Das Modell nähert sich einer Trainingsstichprobe nach dem Zufallsprinzip an, in der Hoffnung, dass die Kreuzvalidierung helfen wird, was aber aus objektiven Gründen nicht der Fall ist (es gibt zu wenige wichtige Ereignisse auf dem Markt)


Ich habe einen anderen Ansatz versucht: Ich passe das Modell nicht an die Daten an, sondern stelle Hypothesen auf und überprüfe sie.

1) Ich bilde plausible(bereits gefilterte) Hypothesen in Form von Regeln.

2) Hypothesen werden an kleinen Daten getestet

3) Hypothesen, die an kleinen Daten getestet wurden, werden an großen Daten getestet.

In der Tat bleibt nur eine von einer Million plausiblen Regeln übrig

Für den ungeübten Leser ist es schwierig, den Unterschied zwischen den beiden Ansätzen zu verstehen, aber der Unterschied zwischen ihnen ist gewaltig

Eine Art von Philosophie. Nichts Konkretes...
 
elibrarius:
Eine Art Philosophie. Nichts Konkretes...

Warum auch immer, der Weg wird vorher angekündigt, und alles ist genau so wie vorgesehen. Die Generierung von Regeln und deren Überprüfung ist nicht der übliche Ansatz, bei dem die Regeln auf der Grundlage der Logik/Ziele des Problems ausgewählt werden. D.h. in der Regel werden zunächst Regeln für die Lösung erstellt. Dies führt zum Verlust von Regeln, die nicht logisch sind, aber zu Ergebnissen führen.

 
elibrarius:
Eine Art Philosophie. Nichts Konkretes...
  • Viele Dinge sind für uns unverständlich, nicht weil unsere Begriffe schwach sind, sondern weil diese Dinge nicht in den Bereich unserer Begriffe fallen.
Valeriy Yastremskiy:

Der Weg wurde ja schon früher bekannt gegeben, und alles läuft genau nach Plan. Das Generieren von Regeln und deren Überprüfung ist nicht der übliche Ansatz, bei dem die Regeln auf der Grundlage der Logik/Ziele der Aufgabe ausgewählt werden. D.h. in der Regel werden zunächst Regeln für die Lösung erstellt. Dies führt zum Verlust von Regeln, die nicht logisch sind, aber zu Ergebnissen führen.

+++

 
mytarmailS:
  • Viele Dinge verstehen wir nicht, nicht weil unsere Konzepte schwach sind, sondern weil diese Dinge nicht in den Bereich unseres Verständnisses fallen.

+++

Ein bisschen mehr Philosophie))

 
Es ist typisch für solche Ansätze, dass sie zu Ergebnissen führen, die konventionell als "Anti-Hamster" bezeichnet werden können - was bedeutet, dass der Hamster gesehen, aber nicht gesehen wird. Dies ist ganz typisch für Reihen, die den SB-Implementierungen ähneln.
 
Aleksey Nikolayev:
Es ist typisch für solche Ansätze, dass sie zu Ergebnissen führen, die man konventionell als "Anti-Hamster" bezeichnen kann - was bedeutet, dass der Hamster gesehen, aber nicht gesehen wird. Dies ist ganz typisch für Reihen, die den SB-Implementierungen ähneln.

Da bin ich anderer Meinung. Das Problem der großen Anzahl von Regeln und Auswahllogiken ist sicherlich vorhanden. Die Ziele sind bei beiden Ansätzen die gleichen.

Und dass der Weg völlig falsch ist, nun, wir überprüfen die Regeln und korrigieren den Weg))))

 

Ich habe eine andere MO-Abstraktion, die echte Muster genau finden sollte (falls es welche gibt), aber es ist nicht sicher

Ich konnte bei Google keine Hinweise auf die Freimaurer oder das Pentagon finden, also behalte ich es vorerst für mich

Die Idee zu dieser Abstraktion kam mir, als ich Sonnenblumenkerne knipste.
 
Maxim Dmitrievsky:

Ich habe eine andere MO-Abstraktion, die echte Muster genau finden sollte (falls es welche gibt), aber es ist nicht sicher

Ich konnte bei Google keine Hinweise auf die Freimaurer oder das Pentagon finden, also halte ich es vorerst unter Verschluss.

Abstraktion, erfunden beim Schnappen von Sonnenblumenkernen

Ich scheine es vergessen zu haben: echte SB-Muster (falls es welche gibt) ))))

 
Maxim Dmitrievsky:

Ich glaube, Alexej hat Rechenleistung vorgeschlagen, er rechnet gerne lange, vielleicht könnt ihr zusammenarbeiten :)

Ohne Vektorisierung wird es auf R immer noch langsam sein. Sie könnten eine schnelle Datenbank verwenden

Außerdem mache ich das schon seit Jahren so.

Allerdings habe ich es jetzt etwas zurückgestellt, da es wirklich sehr langsam ist, was es unmöglich macht, das Ziel schnell zu ändern (auf der Suche nach einem guten Ziel), und einzelne Regeln funktionieren auch nicht mehr, egal wie man sie im Verlauf überprüft.

Maxim, können Sie helfen, machen Sie ein Skript in Python, die Zyklus zu erstellen Modell (oder 100 Modelle) aus CSV-Datei, dann analysieren sie auf Prädiktoren Gültigkeit mit Standard-CatBoost-Tools, dann verbieten/erlauben die Verwendung von Prädiktoren (CatBoost kann es tun) auf bestimmte Bedingungen und erstellen Sie neue Modell wieder. Mit dieser Methode lassen sich wichtige Prädiktoren zuordnen, die zu einer Verbesserung des Modells führen. Ich verwende eine ähnliche Methode, aber es ist wirklich unbequem für mich, da ich nach dem Hinzufügen/Entfernen von Prädiktoren die Schleife manuell neu starten muss.