Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2637

 
Maxim Dmitrievsky #:
Piensa en características como los incrementos, pero más informativos. Por ejemplo, encuentre el precio medio de todo el historial y deduzca el resto. Se necesita la máxima variación, pero tiene que estar dentro de un rango que se conozca con los nuevos datos.

Me recuerda a la teoría de la negociación de los diferenciales. Y las matemáticas son bastante complicadas, a juzgar por la plétora de artículos sobre el tema.

Maxim Dmitrievsky #:
La diferenciación fraccionaria funciona así (manteniendo la estacionariedad la máxima dispersión), pero quiero algo nuevo.

Tal vez algunas "líneas de pendiente" del tiempo y deducir de ellos los precios, decibelios, f-de tiempo, cualquier tipo de turbidez, siempre y cuando las condiciones de estacionariedad y máxima dispersión se observan.

¿Pero será algo así como una puntuación z, cuando sólo hay estacionariedad en el historial? Aunque, por supuesto, los intentos de llevar a la estacionariedad no pueden ser evitados en principio - sin ella, no se puede hacer mucho de un comercio.

 
Aleksey Nikolayev #:

Me recuerda a la teoría de la negociación de los diferenciales. Y las matemáticas son bastante complicadas, a juzgar por la plétora de artículos sobre el tema.

Pero sería algo así como la puntuación z cuando sólo hay estacionariedad en la historia, ¿no? Aunque, por supuesto, tratar de lograr la estacionariedad es imposible en principio: no se puede operar realmente sin ella.

Algo así sucede y debemos intentar estabilizarlo durante algún tiempo - por lo tanto, debemos tomar todo el historial en un gráfico mensual y utilizarlo para evitar que los últimos datos sean extremos durante tales transformaciones - de lo contrario el IM dejará de funcionar adecuadamente

Algo así como una línea de tendencia a largo plazo que cambia lentamente, pero que de nuevo está más cerca de los incrementos. Quizá haya otras soluciones inesperadas :)

Es posible que esté ligado a los fundamentos macro como el PIB, pero no me gustaría
 
Aleksey Nikolayev #:

Sólo se puede trabajar con patrones muy simples, como el movimiento después de la ruptura de un tope. En el sentido de que debe haber suficientes para que la frecuencia sirva como una buena estimación de la probabilidad.

¿Cuántos son suficientes? Supongamos que tengo entre un 5% y un 15% en la muestra que selecciona "patrones" simples, y la muestra para el entrenamiento, digamos 15k ejemplos, ¿es demasiado poco?

Aleksey Nikolayev #:

Mi observación es que cuando el margen de beneficio del patrón está totalmente formalizado, las ineficiencias del mercado (en el sentido de las diferencias con respecto a la SB) pasan a tener poca importancia. Convencionalmente hablando, dentro de la extensión. Existe un deseo natural de hacer más complejo el diseño del patrón, pero esto suele conducir a un tamaño de muestra reducido y a resultados inestables.

La cuestión es cómo formalizar mejor estas observaciones para obtener resultados rápidamente y descartar/clasificar patrones con o sin regularidad.

 
Aleksey Vyazmikin #:

¿Cuánto es suficiente? Supongamos que tengo entre un 5% y un 15% en una muestra de "patrones" simples, y la muestra para el entrenamiento, sea de 15k ejemplos, ¿es demasiado poco?

Es mejor contar en trozos de patrones. Las rupturas del mismo patrón (significativas para el trabajo) pueden no ocurrir más que unos pocos cientos por año. Yo lo llamaría un número limitante. Si se trata de hacer patrones más complicados a partir de ellos -por ejemplo, un par de nodos que se abren paso y que además cumplen algunas condiciones-, entonces pueden ser docenas por año. Y eso no es suficiente.

 
Aleksey Vyazmikin #:

La cuestión es cómo formalizar mejor estas observaciones para obtener resultados rápidamente y descartar/clasificar los patrones con y sin patrón.

¿Algo así como un bucle sobre todas las construcciones posibles de un patrón de un tipo determinado? Hice algo similar una vez con los mismos desgloses de vértices. En principio, es posible pensar en algo, pero la búsqueda será (en el caso general) no iterativa, sino recursiva. De nuevo, la mayoría de los patrones carecerían de sentido debido a su complejidad y rareza. Probablemente sea más fácil recopilar manualmente una lista de patrones significativos y sortearlos en un bucle regular, eligiendo el óptimo.

 
sin vida o FA vinculante El AT de los sistemas complejos sólo puede funcionar en condiciones estables.
 
mytarmailS #:
¿Por qué?

Pocos datos reales significativos.

Zy. La generación de datos con un entorno aleatorio da la impresión de alargar los datos. Esto es un error. Todos los datos que hay. 211 barras significa 211 y no más.

 

¡Hola!

La verdad está ahí fuera... (Fox Mulder "The X-Files")

Es evidente que estás cerca del objetivo. Tienes que esforzarte más.

 
Aleksey Nikolayev #:

Es mejor contar en piezas del patrón. Las pausas del mismo patrón (significativas para el trabajo) no son más que unos pocos cientos al año. Yo lo llamaría un número límite. Si se intenta hacer patrones más complicados a partir de ellos -por ejemplo, en pares de nodos consecutivos que se rompen y que además cumplen algunas condiciones- se pueden obtener docenas de estos patrones por año. Y eso no es suficiente.

Sí, estoy de acuerdo en que los datos no son suficientes, por eso tomo la máxima cantidad de historia. Por supuesto, cuantos más ejemplos, más seguro es el resultado, en teoría, pero es lo que hay.

Aleksey Nikolayev #:

¿Algo así como un bucle sobre todas las construcciones posibles de un tipo de patrón determinado? Hice algo similar una vez con los mismos desgloses de vértices. En principio, es posible llegar a algo, sólo que la enumeración (en el caso general) no será iterativa, sino recursiva. De nuevo, la mayoría de los patrones carecerían de sentido debido a su complejidad y rareza. Probablemente sea más fácil recopilar manualmente una lista de patrones significativos y sortearlos en un bucle regular, eligiendo el óptimo.

Sólo necesito una herramienta con una métrica precisa para evaluar la tendencia/distribución/tipo de ondas a lo largo del tiempo para identificar cualquier tendencia dentro de ellas. Cuáles son estas tendencias, por ejemplo:

- Si hubo un resultado positivo después de un patrón durante mucho tiempo, es más probable que haya un resultado negativo cuando surja un nuevo patrón;

- El resultado se distribuye por igual en todas las secciones de la muestra (¿cómo se divide en secciones correctamente?);

- Si ha habido un resultado de patrón negativo durante mucho tiempo, es más probable que se produzca un resultado positivo;

- Si no hubo un patrón durante mucho tiempo, es más probable que el resultado sea positivo/negativo cuando aparezca.

Básicamente algo así. Es un corte estadístico, pero debe ser a intervalos de la historia, y mi pregunta es la mejor manera de cortar estos intervalos (medir en diferentes intervalos, hacer un desplazamiento), por lo que la estimación sería correcta y expresada preferiblemente por algún coeficiente generalizado.

 
Aleksey Vyazmikin #:

Sí, estoy de acuerdo en que no hay suficientes datos, y por eso tomo toda la historia posible. Por supuesto, cuantos más ejemplos, más seguro es el resultado, en teoría, pero lo que hay es lo que hay.

Sólo necesito una herramienta con una métrica precisa para evaluar la tendencia/distribución/tipo de ondas a lo largo del tiempo para identificar cualquier tendencia dentro de ellas. Cuáles son estas tendencias, por ejemplo:

- Si hubo un resultado positivo después de un patrón durante mucho tiempo, es más probable que haya un resultado negativo cuando surja un nuevo patrón;

- El resultado se distribuye por igual en todas las secciones de la muestra (¿cómo se divide en secciones correctamente?);

- Si ha habido un resultado de patrón negativo durante mucho tiempo, es más probable que se produzca un resultado positivo;

- Si no hubo un patrón durante mucho tiempo, es más probable que el resultado sea positivo/negativo cuando aparezca.

Básicamente algo así. La pregunta para mí es cuál es la mejor manera de cortar estos intervalos (medir en diferentes intervalos, hacer un desplazamiento) para hacer una estimación correcta y expresarla preferiblemente por algún coeficiente generalizado.

La solución más sencilla es una estadística que se calcula en alguna serie de pruebas. En el comercio se suele mencionar en el contexto de la búsqueda de la dependencia de un resultado comercial con respecto al anterior. Si se nota alguna dependencia/serialidad, se puede intentar estudiar su estructura. En este caso, probablemente tenga sentido considerar las cadenas de Markov y utilizar como métrica algunas funciones de sus matrices de probabilidad.

Para cortar intervalos de historia, suelo utilizar un gran zigzag. Probablemente no sea óptimo, pero es bastante sencillo y relativamente objetivo.