Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1782

 
Valeriy Yastremskiy:

Was teilen Sie? Und was gefällt Ihnen nicht an den Inkrementen? Es handelt sich im Wesentlichen um zeitlich angepasste Geschwindigkeiten. Aber ohne Mittelwertbildung kann ich es nicht schaffen. Aber wenn man anfängt, Durchschnittswerte zu berücksichtigen, gerät man schnell in ein Labyrinth. Irgendwo muss es eine funktionierende Mitte geben. Beim letzten Ticken reicht der Balken nicht mehr aus, und ein bisschen mehr Wildnis ist angesagt.

2 oder mehr Prioritäten mit unterschiedlichen Verzögerungen, für unterschiedliche Anzahl von Clustern

Da es keine funktionale Abhängigkeit zwischen den beiden Inkrementen gibt, wird die Wolke dummerweise in zwei Hälften geteilt, usw. Wir brauchen etwas Strengeres als Inkremente. Vielleicht sollten sie auf irgendeine Weise umgestaltet werden.

Beispiele


 
Maxim Dmitrievsky:

2 oder mehr Inkremente mit unterschiedlichen Verzögerungen, bei unterschiedlicher Anzahl von Clustern

Da keine funktionale Abhängigkeit zwischen den Inkrementenpaaren besteht, wird die Wolke einfach in zwei Hälften geteilt, usw. Wir brauchen etwas Strengeres als Inkremente. Vielleicht sollten sie auf irgendeine Weise umgestaltet werden.

Beispiele


Ich verstehe nicht, was es mit dem Paar von Inkrementen auf sich hat. Auf den letzten 2 Takten oder etwas anderes?

Ich habe auch noch eine Idee, was die Geschwindigkeiten und Durchschnittswerte anbelangt. Gut, die Systeme sollten auf verschiedene TFs trainiert werden, auf die Interaktion verschiedener TFs, und es sollte tickwise crap geben, d.h. es sollte auch tickwise Verhalten geben, wenn der TS irgendwelche Entscheidungen trifft.

Verschiedene TFs gewichten nur die Zeichen, die vom aktuellen Zustand abweichen. Semko hat da sein eigenes System, aber mir gefällt TF noch besser, da es sowohl Einheitlichkeit als auch eine gewisse Berücksichtigung von Extremen gibt.

Das ist mir aufgefallen. Wir platzieren Orders auf die Preiswolke und daher wird der Drawdown in 99 % der Fälle negativ sein. Aber wie können wir einschätzen, dass wir uns nicht geirrt haben? Wenn die nächstgelegenen Extrema negativ sind, können wir ohne Verlust schließen.

 

Das können wir anhand einiger aktueller Balken und einer Historie von 120 Balken messen. Auf einen Monat gerechnet sind das 10 Jahre. Es scheint genug zu sein.

Geschwindigkeiten von Mach 2, 14, 30, 120 und 480 sowie das Auffinden von Hochs und Tiefs

Spreizt zwischen benachbarten Strichen und findet Maxima und Knicke

Maximale Preisunterschiede zu Mashas, aber das sind in der Regel die wirklichen Extreme im Preis.

Durchschnittliche Trendzeiten, Hervorhebung der Maxima und Minima

Durchschnittliche Unterschiede in den Trends, ala Donchian.

Und es ist möglich, Trends in Flüsse und deren Dauer zu unterteilen

Die durchschnittliche Dauer der Trends in der Wohnung. Die Tendenzen der niedrigeren TFs in den höheren TFs.

Die durchschnittliche Zeit der Trends.

Und es scheint, dass verschiedene Parameter in Abhängigkeit von den anderen von Bedeutung sind. Und der Zusammenhang ist nicht offensichtlich. Es ist das erste, was einem in den Sinn kommt, die untere TF mit der oberen zu verbinden, aber es ist klar, dass das nicht ausreicht. Und ich kann in den Links noch keine Logik erkennen.

 
Valeriy Yastremskiy:

Ich verstehe das mit den paar Schritten nicht. Auf den letzten 2 Takten oder etwas anderes?

2 Zeitreihen mit unterschiedlichen Verzögerungen. Man kann alles clustern, was man will, aber dann bleibt man wieder bei einem falschen Verständnis des Themenbereichs und dessen, was und warum geclustert wird, hängen. Ich habe im Internet keine erfolgreichen Beispiele gesehen. Übrigens wollte ich Cluster statt saisonaler Komponenten zuweisen und habe es vergessen, habe angefangen, MO reinzuschieben... Uy... dann wäre das eine andere Studie
 
mytarmailS:

Nun, die Zeit ist ein Proxy für die Volatilität, die saisonal ist, es gibt aktive und passive Handelszeiten

Ich stimme zu, ich habe das nicht berücksichtigt.

mytarmailS:

Ja, man kann sie speichern, aber um das Modell zu unterrichten, muss man diese Matrix in die Umgebung laden, und das ist dann das Ende)) oder eher früher, in der Phase der Bildung der Matrix mit Prädikaten

Versuchen Sie CatBoost. Auf jeden Fall kann ich es trainieren und wir werden das Ergebnis sehen.

mytarmailS:

Wow, ein Auftritt ist nicht wenig, ich frage mich, wie viele Schilder du hast?

566 in dieser Stichprobe.

mytarmailS:

Was ist der genetische Baum?


1) einfach )

2) Wie ist es? Und wie passen Sie die Prädiktoren für die ZZ an?

3) Nun, Sie haben eine Kerze als die Eröffnung oder so etwas, es ist schon verzerrt, weil sie von Clowes sein sollte, und hier sofort eine Menge Verwirrung, Zeichen zu bauen, wie, wie das Ziel zu tun, usw. (unnötige Schmerzen), wenn Sie etwas für sich selbst zu ändern, sollten Sie immer verlassen das Original für andere)

Das Skript in R, das einen Baum mithilfe eines genetischen Algorithmus erstellt und die Splits auswählt. Ich bin nicht wirklich bewandert darin - die Arbeit von Doc.


2. Ich verwende ZZ-basierte Prädiktoren, die natürlich effizienter sind, wenn sie und das Ziel auf der gleichen ZZ berechnet werden.

3. Ich weiß nicht, wie hoch der OHLC am Anfang des Balkens ist, also habe ich ihn so aufgeschrieben, wie er im wirklichen Leben vorkommt.

Unterm Strich: Soll ich es noch einmal machen oder ist es sinnlos?

 
Aleksey Vyazmikin:

Unterm Strich: Soll ich es noch einmal machen oder ist es sinnlos?

Die Catbust wird nicht helfen, das Problem ist die Größe der Daten, ich werde nicht einmal in der Lage sein, Traits zu erstellen, Sie werden nicht einmal zum Training kommen...

Machen Sie die Stichprobe 50k, lassen Sie sie klein sein, lassen Sie sie nicht ernsthaft sein, lassen Sie es eher möglich sein, zu übertrainieren, .... ..., ... Die Aufgabe ist es, einen Roboter für die Produktion zu machen, und nur eine gemeinsame Anstrengung, um den Fehler zu reduzieren, und dann die gewonnenen Erkenntnisse können auf jedes Werkzeug und den Markt übertragen werden, 50k ist völlig ausreichend, um zu sehen, welche Zeichen, dass etwas wichtig ist.

Aleksey Vyazmikin:

3. Zu Beginn des Balkens kenne ich seinen OHLC nicht, also habe ich ihn aufgeschrieben - wie es im wirklichen Leben geschieht.

Wenn Sie die OHLC nicht kennen, brauchen Sie sie nicht zu schreiben. Warum sollten Sie die gesamte OHLC verschieben? Niemand tut das, Sie müssen nur ZZ um einen Schritt verschieben, so als ob Sie zum Üben um einen Schritt in die Zukunft schauen würden, und das ist alles. Ich möchte Sie bitten, wenn Sie einen der Artikel von Wladimir Perervenko über das Rehen gelesen haben, sie bitte zu lesen, sie sind sehr unangenehm, wenn wir bereits die optimale Art und Weise des Umgangs mit Daten festgelegt haben und jeder daran gewöhnt ist, und jemand versucht, das Gleiche zu tun, aber auf eine andere Art und Weise, es ist irgendwie sinnlos und ärgerlich, und verursacht viele Fehler bei Menschen, die versuchen, mit Daten dieses Autors zu arbeiten.


Wenn Sie nach all dem immer noch etwas tun wollen, habe ich folgende Anforderungen

1) die Daten 50-60k nicht mehr, vorzugsweise eine Datei, nur vereinbaren, dass die n der letzten Kerze wird der Test sein

2) Die Daten, vorzugsweise ohne Kleber, so dass nicht nur die neuesten Preise berücksichtigt werden können, sondern auch Unterstützung und Widerstand, was mit Kleber unmöglich ist

3) das Ziel sollte bereits in den Daten enthalten sein

4) Daten im Format Datum,Zeit,o,h,l,c, Ziel


Oder soll ich einen Datensatz erstellen?

 
Maxim Dmitrievsky:
Zwei Zeitreihen mit unterschiedlichen Verzögerungen. Man kann alles clustern, was man will, aber dann bleibt man wieder in einem Missverständnis des Themenbereichs stecken und weiß nicht, was geclustert wird und warum. Ich habe im Internet keine erfolgreichen Beispiele gesehen. Übrigens wollte ich Cluster statt saisonaler Komponenten zuweisen, habe es aber vergessen und angefangen, MO einzuschieben... Uy... dann wäre das eine andere Studie

So etwas kommt vor, die Logik hat keine Geduld für diesen Schwachsinn )))) .... Bisher gibt es Probleme mit dem Verständnis. Alles, was es gibt, ist Mittelwertbildung, Ausdünnung und GA mit Lernen auf relativ kurzen Daten. Ich habe auch noch keine Arbeit über die Trennung von Serienmerkmalen gesehen. Einerseits sollte die Serienanalyse für verschiedene TFs identisch sein. Es sollte Kriterien für den Übergang zu einer niedrigeren TF geben. Wenn z.B. auf dem unteren TF Trends mit ausreichender Streuung und Geschwindigkeit festgestellt werden, dann ist es möglich, sich gegen den Trend des höheren TF zu bewegen. Aber das ist logisch. Wir sollten die Merkmale irgendwie gruppieren und uns das unterschiedliche Verhalten der Serien ansehen. Wenn vom Gegenteil zu lösen.

Im Kernkraftwerk haben wir 19 Parameter untersucht. Es gab eine Tabelle mit 3 bis 7 Parametern, bei denen die Zone rot ist und die Stäbe entfernt werden sollten. Auch dort gab es nicht nur einen Parameter, und sie waren nicht miteinander verknüpft. Unseres ist natürlich anders, aber die Zeitskala ist zu groß, und es gibt keinen oder nicht immer einen Zusammenhang zwischen Zecken und monatlichem Verhalten. Im Allgemeinen sollten wir uns die Beziehung zwischen den Parametern ansehen und wie lange diese Beziehung besteht.

Aber es ist immer noch kompliziert.

 
Valeriy Yastremskiy:

So etwas kommt vor, die Logik hat keine Geduld für diesen Schwachsinn )))) .... Bisher gibt es Probleme mit dem Verständnis. Alles, was es gibt, ist Mittelwertbildung, Ausdünnung und GA mit Lernen auf relativ kurzen Daten. Ich habe auch noch keine Arbeit über die Trennung von Serienmerkmalen gesehen. Einerseits sollte die Serienanalyse für verschiedene TFs identisch sein. Es sollte Kriterien für den Übergang zu einer niedrigeren TF geben. Wenn z. B. auf der unteren TF Trends mit ausreichender Spanne und Geschwindigkeit festgestellt werden, ist es möglich, sich gegen den Trend der höheren TF zu bewegen. Aber das ist logisch. Wir sollten die Merkmale irgendwie gruppieren und uns das unterschiedliche Verhalten der Serien ansehen. Wenn vom Gegenteil zu lösen.

Im Kernkraftwerk haben wir 19 Parameter untersucht. Es gab eine Tabelle mit 3 bis 7 Parametern, bei denen die Zone rot ist und die Stäbe entfernt werden sollten. Auch dort gab es nicht nur einen Parameter, und sie waren nicht miteinander verknüpft. Unseres ist natürlich anders, aber die Zeitskala ist zu groß, und es gibt keinen oder nicht immer einen Zusammenhang zwischen Tick und monatlichem Verhalten. Im Allgemeinen sollten wir uns die Beziehung zwischen den Parametern ansehen und wie lange diese Beziehung besteht.

Aber es ist ziemlich schwierig.

Ich gehe nicht an einem Bomber mit einem Atomsprengkopf vorbei, ohne einen Witz zu machen :)
 
Maxim Dmitrievsky:
Ich gehe nicht an einem Bomber mit einem Atomsprengkopf vorbei, ohne einen Witz zu machen :)

Was kann man ohne sie tun, in dieser Wildnis)))) Nuklearscheiße ist, wo alles anfing, Wahrscheinlichkeitsrechner mit Durchschnittswerten, Rückkopplung und Bayesianer, Konfidenzkriterium ist etwas))) Offenbar müssen dieselben Parameter zunächst manuell ausgewählt werden. Es gibt zu viele von ihnen.

Im Allgemeinen geht es darum, eine Reihe von 120 Balken zu betrachten und daraus in verschiedenen Varianten etwas herauszuholen. Es ist nicht gut, den aktuellen Zustand zu messen und zu trainieren.

 
Valeriy Yastremskiy:

Was kann man ohne sie tun, in dieser Wildnis)))) Nuklearscheiße ist, wo alles anfing, Wahrscheinlichkeitsrechner mit Durchschnittswerten, Rückkopplung und Bayesianer, Konfidenzkriterium ist etwas))) Offenbar müssen dieselben Parameter zunächst manuell ausgewählt werden. Und zwar eine ganze Menge.

Im Allgemeinen geht es darum, eine Reihe von 120 Balken zu betrachten und daraus in verschiedenen Varianten etwas herauszuholen. Es ist nicht gut, den aktuellen Zustand zu messen und zu trainieren.

Wenn es sich um Cluster handelt, müssen Sie die Statistiken nur mit den neuen Daten abgleichen. Wenn sie identisch sind, können Sie CA bauen.