De la teoría a la práctica - página 128

 
Nikolay Demko:

Lo siento amigo, es costumbre tener tu propia cuchara.


Hace un par de hojas dejó un archivo de datos de ticks procesados por exponentes, y ahora resulta que no tienen marcas de tiempo.

 
СанСаныч Фоменко:

Hace un par de hojas dejó un archivo de datos de ticks procesados por exponentes, y ahora resulta que no tienen marcas de tiempo.


Sí, vergonzoso, qué puedo decir... Empezaré a coleccionar con sellos de tiempo la próxima semana...

 
Nikolay Demko:

Lanza un ejemplo del archivo, un script para escribir cómo transferir dos bytes.

https://yadi.sk/d/snmT60R43RNUeL archivo AUDCAD_3DC.rar 247 Mb

Aquí están los ticks de más de 3 años (desde 2014 hasta el 28 de octubre de 2017.) para AUDCAD, una herramienta, ya procesada muchas veces por Alexander, para 3 DC, uno de los cuales cotizó 4 dígitos y sus ticks han terminado el 26.02.2016. Las garrapatas se tomaron de http://advancetools.net/index.php/instrumenty/tikovye-ob-emy/istoriya-tikov, se descomprimieron y se fusionaron en 3 archivos sólidos. No hizo ninguna comprobación. El tamaño de 2 de los 3 archivos .csv es superior a 2 GB.

El recurso no lo dice explícitamente, pero según mi información, hay que agradecer a Igor Gerasko estos tics.

AUDCAD_3DC.rar
AUDCAD_3DC.rar
  • yadi.sk
View and download from Yandex.Disk
 
Dmitriy Skub:

Nikolai, aquí está el archivo del rublo/dólar del intercambio.

Formato:

Fecha Hora en mseg Oferta Venta Último Volumen


Hay muchos dobles en el archivo por tiempo, no entiendo cuál es el truco. Así

2017.09.21 11:59:11.601,59843,59862,60100,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60120,150,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60099,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60085,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60089,7,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60230,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60599,30,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60600,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60600,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60394,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60300,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60361,2,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60362,44,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59874,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59873,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59876,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59875,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59872,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59862,3,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60000,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59950,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,60025,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59878,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59877,10,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59950,1,BUY,1505995151601 0
2017.09.21 11:59:11.601,59843,59862,59880,100,BUY,1505995151601 0




Además, el archivo no está ordenado por tiempo, los tiempos son aleatorios. A veces se adelantan un minuto, a veces incluso más.

De ahí la pregunta: ¿Proceso de datos? para que midan sólo el tiempo, sin prestar atención a lo que va de cada transacción.

Creo que hay que comprobar los duplicados completos, no sólo por tiempo sino también por precio, volumen, dirección.

 
Nikolay Demko:

Hay mucha duplicación de tiempo en el archivo, no sé cuál es el problema. Es así.

Además, el archivo no está ordenado por tiempo, los tiempos están por todas partes. A veces con un minuto de antelación, a veces incluso más.

De ahí la pregunta: ¿se deben procesar los datos? para que midan sólo el tiempo, sin prestar atención al hecho de que el registro proviene de cada acuerdo.

No se trata de un duplicado, sino de un volumen de mercado repartido entre varias órdenes de límite. Los precios son diferentes allí. Debería estar ordenado por hora - ¿puede especificar la hora en la que se rompe la ordenación?

Esta es una pregunta para Alexander, por cierto. Hay varios incrementos a la vez (si se sigue su lógica) - ¿y cómo debemos calcular?

 
Dmitriy Skub:

No se trata de duplicados, sino de un volumen de mercado repartido entre varias órdenes limitadas. Los precios son diferentes allí. Debería estar ordenado por hora - ¿puede especificar la hora en la que se rompe la ordenación?

Esta es una pregunta para Alexander, por cierto. Obtenemos varios incrementos a la vez (si seguimos su lógica) - ¿y cómo debemos calcularlos?


Perdóname por interferir. En mi opinión, es justo contar como en la bolsa, en el sistema "netting": precio [medio] de la posición = coste de todas las transacciones / volumen de todas las transacciones.

Donde valor de la transacción = volumen de la transacción * tipo de cambio. Por ejemplo, si compró 1,2 lotes de EURUSD a 1,2025, el valor de la transacción = 120.000 * 1,2025 = 144.300 dólares.

 
Dmitriy Skub:

No se trata de duplicados, sino de un volumen de mercado repartido entre varias órdenes limitadas. Los precios son diferentes allí. Debería estar ordenado por hora - ¿puede especificar la hora en la que se rompe la ordenación?

Esta es una pregunta para Alexander, por cierto. Hay varios incrementos a la vez (si se sigue su lógica) - ¿y cómo debemos calcular?

Por eso cambié a mi escala de tiempo, para evitar esas situaciones. En este caso, no lo sé. Feynman consideró que deltaT -->0. Pero a =0, tal situación, por desgracia, en la teoría no existe.
 
Nikolay Demko:

Hay mucha duplicación de tiempo en el archivo, no sé cuál es el problema. Es así.

Además, el archivo no está ordenado por tiempo, los tiempos están por todas partes. A veces con un minuto de antelación, a veces incluso más.

De ahí la pregunta: ¿Proceso de datos? para que midan sólo el tiempo, sin prestar atención a lo que va de cada transacción.

Creo que todavía hay que comprobar si hay dobles completos, no sólo por tiempo sino también por precio, volumen, dirección.

Vamos, Nikolai. Veo que no es rápido, la semana que viene recogeré las garrapatas y lo comprobaré yo mismo. Pero si estás seriamente interesado, será interesante ver tus resultados.
 
Alexander_K2:
Oh, vamos, Nikolai. Veo que no es un asunto rápido, la semana que viene reuniré las tics y lo comprobaré yo mismo. Pero, si está seriamente interesado, será interesante ver sus resultados.
Y Alexander, ¿los datos bursátiles te convienen realmente? Pensé que sólo hablabas de forex...
 
Vladimir:
¿Los datos del mercado de valores realmente te convienen, Alexander?
No sé... Tengo una cuenta NDD (solía escribir mal ECN). Me confunden estos nombres. Le pregunté a mi gerente al respecto: es NDD. Dicen que lo hacen directamente desde los intercambios. Obtengo cotizaciones en Ask and Bid. No hay citas para Last. Pero uno puede intercambiar algunas cosas como el arroz, el azúcar, el café. Todavía no lo he resuelto.