Von der Theorie zur Praxis - Seite 128

 
Nikolay Demko:

Tut mir leid, Kumpel, es ist üblich, einen eigenen Löffel zu haben.


Er hat vor ein paar Tagen ein Archiv mit exponentiell verarbeiteten Zeckendaten abgegeben, und jetzt stellt sich heraus, dass sie keine Zeitstempel haben.

 
СанСаныч Фоменко:

Er hat vor ein paar Tagen ein Archiv mit exponentiell verarbeiteten Zeckendaten abgegeben, und jetzt stellt sich heraus, dass sie keine Zeitstempel haben.


Ja, peinlich, was soll ich sagen... Ich werde nächste Woche mit dem Sammeln von Zeitstempeln beginnen...

 
Nikolay Demko:

Werfen Sie ein Beispiel des Archivs, ein Skript zu schreiben, wie zwei Bytes zu übertragen.

https://yadi.sk/d/snmT60R43RNUeL Datei AUDCAD_3DC.rar 247 Mb

Hier sind die Ticks für 3+ Jahre (von 2014 bis 28.10.2017) für AUDCAD, ein Tool, das Alexander schon mehrfach bearbeitet hat, für 3 DC, von denen einer 4-stellig notiert und dessen Ticks am 26.02.2016 beendet wurden. Die Zecken wurden von http://advancetools.net/index.php/instrumenty/tikovye-ob-emy/istoriya-tikov entnommen, entpackt und zu 3 Dateien zusammengefügt. Es wurden keine Kontrollen durchgeführt. Die Größe von 2 der 3 .csv-Dateien beträgt über 2 GB.

In der Quelle wird nicht ausdrücklich darauf hingewiesen, aber nach meinen Informationen ist Igor Gerasko für diese Ticks zu danken.

AUDCAD_3DC.rar
AUDCAD_3DC.rar
  • yadi.sk
View and download from Yandex.Disk
 
Dmitriy Skub:

Nikolai, hier ist das Rubel/Dollar-Archiv von der Börse.

Format:

Datum Uhrzeit in msec Bid Ask Last Volume


Es gibt eine Menge Doppelgänger im Archiv nach der Zeit, ich verstehe nicht, was der Clou daran ist. Wie diese

2017.09.21 11:59:11.601,59843,59862,60100,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60120,150,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60099,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60085,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60089,7,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60230,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60599,30,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60600,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60600,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60394,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60300,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60361,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60362,44,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59874,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59873,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59876,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59875,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59872,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60000,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59950,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59878,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59877,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59950,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59880,100,BUY,1505995151601 0




Außerdem ist das Archiv nicht nach Zeit sortiert, sondern die Zeitangaben sind zufällig. Manchmal sind sie eine Minute voraus, manchmal sogar mehr.

Daher die Frage: Daten verarbeiten? so dass sie nur den Zeitablauf gemessen haben und nicht darauf geachtet haben, was bei den einzelnen Transaktionen herauskommt.

Ich denke, wir müssen auf vollständige Duplikate prüfen, nicht nur nach Zeit, sondern auch nach Preis, Volumen und Richtung.

 
Nikolay Demko:

Im Archiv gibt es viele zeitliche Überschneidungen, ich weiß nicht, was daran so schlimm sein soll. Es ist folgendermaßen.

Außerdem ist das Archiv nicht nach Zeit sortiert, die Zeitangaben sind völlig durcheinander. Manchmal eine Minute voraus, manchmal sogar mehr.

Daraus ergibt sich die Frage, ob die Daten so verarbeitet werden sollten, dass sie nur die Zeit messen, ohne zu berücksichtigen, dass die Aufzeichnung von jedem Geschäft stammt.

Dabei handelt es sich nicht um ein Duplikat, sondern nur um ein bestimmtes Marktvolumen, das auf mehrere Limit-Orders verteilt wird. Die Preise sind dort anders. Es sollte nach Zeit sortiert sein - können Sie die Zeit angeben, zu der die Sortierung unterbrochen ist?

Dies ist übrigens eine Frage an Alexander. Es gibt mehrere Inkremente zur gleichen Zeit (wenn man Ihrer Logik folgt) - und wie sollen wir das berechnen?

 
Dmitriy Skub:

Dabei handelt es sich nicht um Duplikate, sondern nur um ein gewisses Marktvolumen, das sich auf mehrere Limit-Orders verteilt. Die Preise sind dort anders. Es sollte nach Zeit sortiert sein - können Sie die Zeit angeben, zu der die Sortierung unterbrochen ist?

Dies ist übrigens eine Frage an Alexander. Wir erhalten mehrere Inkremente zur gleichen Zeit (wenn wir Ihrer Logik folgen) - und wie sollen wir sie berechnen?


Verzeihen Sie, dass ich mich einmische. Imho, fair zu zählen, wie an der Börse, im System "Netting": [Durchschnitt] Preis der Position = Kosten aller Transaktionen / Volumen aller Transaktionen.

Dabei gilt: Transaktionswert = Transaktionsvolumen * Wechselkurs. Wenn Sie zum Beispiel 1,2 Lots EURUSD zu 1,2025 gekauft haben, dann ist der Transaktionswert = 120.000 * 1,2025 = 144.300 $.

 
Dmitriy Skub:

Dabei handelt es sich nicht um Duplikate, sondern nur um ein gewisses Marktvolumen, das sich auf mehrere Limit-Orders verteilt. Die Preise sind dort anders. Es sollte nach Zeit sortiert sein - können Sie die Zeit angeben, zu der die Sortierung unterbrochen ist?

Dies ist übrigens eine Frage an Alexander. Es gibt mehrere Inkremente zur gleichen Zeit (wenn man Ihrer Logik folgt) - und wie sollen wir das berechnen?

Deshalb bin ich auf meine Zeitskala umgestiegen, um solche Situationen zu vermeiden. In diesem Fall - ich weiß es nicht. Feynman betrachtet deltaT -->0. Aber zu =0, eine solche Situation, leider, in der Theorie nicht existiert.
 
Nikolay Demko:

Im Archiv gibt es viele zeitliche Überschneidungen, ich weiß nicht, was daran so schlimm sein soll. Es ist folgendermaßen.

Außerdem ist das Archiv nicht nach Zeit sortiert, die Zeitangaben sind völlig durcheinander. Manchmal eine Minute voraus, manchmal sogar mehr.

Daher die Frage: Daten verarbeiten? so dass sie nur den Zeitablauf gemessen haben und nicht darauf geachtet haben, was bei den einzelnen Transaktionen herauskommt.

Ich denke, wir müssen noch auf vollständige Verdoppelungen achten, nicht nur nach Zeit, sondern auch nach Preis, Volumen und Richtung.

Komm schon, Nikolai. Ich sehe, es geht nicht schnell - nächste Woche werde ich die Zecken einsammeln und es selbst überprüfen. Aber wenn Sie ernsthaftes Interesse haben, wird es interessant sein, Ihre Ergebnisse zu sehen.
 
Alexander_K2:
Ach, komm schon, Nikolai. Wie ich sehe, ist das keine schnelle Angelegenheit - ich werde nächste Woche die Tics zusammenstellen und es selbst überprüfen. Aber wenn Sie ernsthaftes Interesse haben, wird es interessant sein, Ihre Ergebnisse zu sehen.
Und Alexander, passen die Aktiendaten wirklich zu Ihnen? Ich dachte, Sie sprechen nur von Devisen...
 
Vladimir:
Passen die Börsendaten wirklich zu dir, Alexander?
Ich weiß es nicht... Ich habe ein NDD-Konto (früher habe ich ECN falsch geschrieben). Diese Namen verwirren mich. Ich habe meinen Vorgesetzten danach gefragt - es ist NDD. Sie sagen, dass sie dies direkt von den Börsen aus tun. Ich erhalte Angebote von Ask und Bid. Es gibt keine Zitate für Last. Aber man kann einige Dinge wie Reis, Zucker und Kaffee tauschen. Ich habe das noch nicht geklärt.