Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2699

 
Die zyklische Zeit (Stundennummer usw.) lässt sich leicht verwenden, z. B. in KNN, wenn die Metrik richtig geschrieben ist. Oder in einigen Weiterentwicklungen dieser Methode wie der lokalen Regression.
 
Aleksey Nikolayev #:
Die zyklische Zeit (Stundennummer usw.) ist leicht zu verwenden, z. B. in KNN, wenn die Metrik richtig geschrieben ist. Oder in einigen Weiterentwicklungen dieser Methode, wie der lokalen Regression.
In Lehrbüchern wird so etwas geschrieben, aber in Wirklichkeit ist die zyklische Zeit bereits in Inkremente eingebettet, und diese enthalten mehr nützliche Informationen. Sie werden um der Zeit willen benötigt, und für die Preisniveaus müssen wir etwas anderes hinzufügen.
 
elibrarius #:
Ich sehe eine Vertrautheit, ich habe es jetzt 3-4 Mal in deinen Beiträgen gesehen.
2 mal 0,5 pro Runde.)))))))

2 mal, das ist so:

2 mal 0,5 ist in der Mitte :-) Ein Durchschnitt von zwei, der plötzlich Ticks gut beschreibt

 
War's das? Ist die Diskussion über die automatische Merkmalsuche beendet?
Oder war das der Punkt?
 
Ahahahaha, du hattest eine Menge Druck, aber als wir zur Sache kamen, haben wir einfach die Luft rausgelassen...
Die Hauptsache ist, dass du trindle, trindle, und dann wirst du sehen, wie deine Enkelkinder aufwachsen...
 
mytarmailS #:
0) Ja, das bin ich...)

1) Ich habe die ganze Sache noch nicht in Betrieb genommen,
1. es gibt Probleme mit dem Fluch der Dimensionalität und der kombinatorischen Explosion, aber das ist theoretisch lösbar, zugunsten der Genauigkeit....
2. Es gibt ein Problem mit der Tatsache, dass der Suchalgorithmus langsam ist, eine Menge Dinge müssen in C oder C++ geschrieben werden, und ich weiß nicht, wie man das macht.
3. Selbst ein optimierter Algorithmus wird nicht in der Lage sein, in einem großen Datenbestand nach Mustern zu suchen, wir müssen lokal nach Mustern suchen.....
Aber im Allgemeinen gilt: Wenn es nicht funktioniert, funktioniert nichts...

2) Ja.


Übrigens, Sie können das Wort "Ereignis" durch das Wort "Regel" ersetzen.


Meine Methode legt die Anzahl der Räume fest, in denen die Regelmäßigkeit gesucht wird, und begrenzt den Schritt der Koordinaten in diesen Räumen, so dass es keine Explosionen geben sollte. Außerdem gibt es Ideen, wie man die Anzahl der zu durchsuchenden Kombinationen sofort reduzieren kann, indem man die Räume vorher analysiert.

Ich werde die Suche in MQL5 über den Modus "mathematische Berechnung" durchführen, der Vorteil hier ist das fehlerfreie System der Agentenunterstützung, das es erlaubt, parallelisierte Berechnungsaufgaben zu verwalten. Ich habe ziemlich viele schwache Kerne auf meinen Servern, daher ist das für mich wichtig.

Eine Regel ist ein Analogon zu einem Baumblatt, wenn ich mich richtig an Ihre Forschung erinnere. Das Blatt enthält die Bedingungen, die das Muster beschreiben, und das Ereignis ist die Quelle für das Finden des Musters.

Das Ereignis ist vielleicht der Stumpf des Baumes, der durch Interaktion mit anderen Prädiktoren aufgebaut wird.

Der Aufbau, sogar kann man das Wachstum sagen, wenn die Vorstellung über den Baum zu verwenden, - es ist die zweite schon Etappe, zu verwirklichen, die man entweder durch den Algorithmus (bei den Skizzen auf dem Papier) oder auf R durch die genetischen Bäume (es ist einfach schon die ausgearbeitete Methodik, Ihnen warf das Skript), oder wie Sie machen - aber schon mit der kleinen im allgemeinen Tabelle arbeitend - die relativen Regelmäßigkeiten suchend, und man kann sich etwas anderes ausdenken. Und in diesem Stadium kann CatBoost bereits Daten mit Freude verdauen, als eine Zwischenlösung. Es ist möglich, Blätter und Regeln daraus zu ziehen, aber sie sind meist schwach.

 
Maxim Kuznetsov #:

die Wahrscheinlichkeit der Überwindung einer Linie durch den Kurs (und die Auslösung von Indikatorsignalen) hängt von der Tageszeit und dem Wochentag ab.

Es ist notwendig, die zyklische Zeit zu NN und DL hinzuzufügen. Der einfachste Weg ist eine Sinuswelle. Da die Abhängigkeiten nichtlinear sind, wird sie einfach quadriert, wobei das Vorzeichen berücksichtigt wird. Es gibt zwei zusätzliche Eingänge, die für die Zeitreferenzen zuständig sind. Mitternacht/Mittag ist überall anders, daher ist es besser, die Phase im Voraus zu berechnen und anzugeben. Dies ist die Verbindung des Modells mit der realen Welt und ihrer Zeit

Wenn sie nicht explizit angegeben werden, dann bekommt man IMHO entweder einen Kürbis oder das Ganze versucht, sie selbst zu ermitteln und auszugeben.

Ja, die Zeit ist eine der wichtigsten Skalen, und natürlich verwende ich sie.

Wie wird das Problem der Umstellung auf Sommer-/Winterzeit gelöst, glauben Sie, dass eine Korrektur erforderlich ist?

Nehmen wir an, wir handeln Euro/Rubel - in der Geschichte haben wir verschiedene Momente des Übergangs zur Winter-/Sommerzeit, und dann die Abwesenheit des Übergangs für den Rubel, aber die Anwesenheit des Euro, sagen wir, geplante Nachrichtenereignisse sind wichtig, aber mit der Zeitverschiebung werden sie auf dem Diagramm zu verschiedenen Zeiten sein, und wie zu sein? Vielleicht macht es Sinn, die Zeitskalen von zwei Währungen auf einmal zu verwenden, und vielleicht mehr?

 
Aleksey Vyazmikin #:

Ja, die Zeit ist eine der wichtigsten Skalen, und natürlich verwende ich sie.

Wie wird das Problem der Umstellung auf Sommer-/Winterzeit gelöst, ist Ihrer Meinung nach eine Korrektur erforderlich?

Sagen wir, wir handeln Euro/Rubel - in der Geschichte haben wir verschiedene Momente des Übergangs zur Winter-/Sommerzeit, und dann das Fehlen des Übergangs für den Rubel, aber die Anwesenheit des Euro, sagen wir, geplante Nachrichtenereignisse sind wichtig, aber mit der Zeitverschiebung werden sie auf dem Diagramm zu verschiedenen Zeiten sein, und wie zu sein? Vielleicht macht es Sinn, die Zeitskalen von zwei Währungen auf einmal zu verwenden, und vielleicht mehr?

das ist ein bekannter b@##... und es verwirrt ständig alles, egal was wir handeln:-) in zwei großen Zentren - USA und England, werden die Zeiger der Uhr an verschiedenen Tagen bewegt. Bis zu mehr als 1 Woche auseinander. Die Abstände zwischen den wichtigsten Ereignissen ändern sich, und zwei oder drei Wochen in sechs Monaten können aus der Analyse herausfallen. Und unsere Leute bringen die Dinge durcheinander, "wir stellen die Uhren um, wir stellen die Uhren nicht um".

Ich kenne keine allgemeingültige oder gar mehr oder weniger erfolgreiche Lösung für dieses Problem. Entweder man ignoriert diese "kritischen Tage" oder man unterrichtet Winter- und Sommerzeit getrennt. Letzteres scheint vernünftiger zu sein, aber wir haben schon jetzt einen kritischen Datenmangel.

 
Aleksey Vyazmikin #:

Meine Methode legt die Anzahl der Räume fest, in denen ein Muster gesucht wird, und begrenzt den Schritt der Koordinaten in diesen Räumen, so dass es keine Explosionen geben sollte. Außerdem gibt es Ideen, wie man die Anzahl der zu untersuchenden Kombinationen sofort reduzieren kann, indem man die Räume vorher analysiert.

Ich werde die Suche in MQL5 über den Modus "mathematische Berechnung" durchführen, der Vorteil hier ist das fehlerfreie System der Agentenunterstützung, das es erlaubt, parallelisierte Berechnungsaufgaben zu verwalten. Ich habe ziemlich viele schwache Kerne auf meinen Servern, daher ist dies für mich wichtig.

Eine Regel ist ein Analogon zu einem Baumblatt, wenn ich mich richtig an Ihre Forschung erinnere. Das Blatt enthält die Bedingungen, die das Muster beschreiben, und das Ereignis ist die Quelle für die Suche nach dem Muster.

Das Ereignis ist vielleicht der Stumpf des Baumes, der durch Interaktion mit anderen Prädiktoren wachsen wird.

Aufbauend, sogar kann man das Wachstum sagen, wenn die Vorstellung über den Baum zu verwenden, - es ist die zweite schon Etappe, zu verwirklichen, die man entweder durch den Algorithmus (während der Skizzen auf dem Papier) oder auf R durch die genetischen Bäume (es ist einfach schon die ausgearbeitete Methodik, Ihnen warf das Skript), oder, wie Sie machen - aber schon mit der kleinen im allgemeinen Tabelle arbeitend - die relativen Regelmäßigkeiten suchend, und es ist möglich, etwas anderes auszudenken. Und in diesem Stadium kann CatBoost bereits Daten mit Freude verdauen, als eine Zwischenlösung. Es ist möglich, Blätter und Regeln daraus zu ziehen, aber sie sind meist schwach.

Gibt es in Ihrem Ansatz irgendwelche Werkzeuge, um die Dateninvarianz zu berücksichtigen?

https://en.wikipedia.org/wiki/Affine_transformation
 
mytarmailS #:

Gibt es in Ihrem Ansatz Instrumente zur Berücksichtigung der Dateninvarianz?

https:// en.wikipedia.org/wiki/Affine_transformation

Vielleicht ist es für mehrere Punkte relevant, zum Beispiel um ähnliche Muster zu finden, aber in meinem Fall gibt es in der ersten Phase im Wesentlichen nur einen Punkt. Der Punkt wird in verschiedene relative Messsysteme umgewandelt/normalisiert - Zeitskala und Preis, plus einen dritten Raum - jeden diskreten Prädiktor, der den Markt kontinuierlich beschreibt. Man erhält 3 Dimensionen in der ursprünglichen Darstellung. Jede hat ihre eigene Quantentabelle.