Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2564

 
Aleksey Vyazmikin #:

Eso es lo que escribí - con el objetivo de identificar un patrón consistente que da una ventaja estadística en un sitio particular. Y cuantificamos los predictores, cualquier predictor.

Pero el "cómo" hacerlo es una cuestión abierta - hasta ahora sólo mediante la enumeración de tablas preparadas, hechas en base a suposiciones empíricas o a la partición estadística del algoritmo CatBoost.

En la figura 3 "quanta" - lo más probable es que se elija el rango medio, en el que hay alguna ventaja estadística.

Tengo entendido que hay un problema de colinealidad (correlación) de casi todos los predictores. También hay un problema combinatorio: si hay muchos predictores, puede haber demasiados cuantos. Probablemente valga la pena reducir la dimensionalidad primero mediante PCA o PLS.

 
mytarmailS #:
¿Alguien ha intentado aplicar la paradoja de Montichol al comercio/toma de decisiones?

Lo paradójico es que el problema no está totalmente formalizado matemáticamente. La respuesta varía en función de cómo se realice la formalización completa.

En el sentido de la utilidad - excepto como un ejemplo instructivo de que para el mismo fenómeno del mundo real pueden ser diferentes modelos matemáticos que dan diferentes respuestas.

 
Es curioso. Estoy eligiendo ticks en el herst y estoy obteniendo valores en la escala de dispersión muy diferentes a 0,5 y cuanto más grande es la escala de tiempo, más se acerca el herst a 0,5. Hice un sistema primitivo en una máscara y sustituí los períodos 10, 100, 1000, 10000. Todos ellos tienen aproximadamente la misma recompensa esperada. Así es un mercado eficiente.
 
Aleksey Nikolayev #:

Tengo entendido que hay un problema de colinealidad (correlación) de casi todos los predictores. También hay un problema combinatorio: si hay muchos predictores, puede haber demasiados cuantos. Puede valer la pena reducir la dimensionalidad mediante PCA o PLS primero.

He escrito más arriba que excluyo los predictores que tienen una señal similar en la muestra, es decir, la correlación entre los predictores cuantílicos disminuye, aunque utilizo mi método de agrupar y seleccionar el mejor resultado de un grupo de similares.

En cuanto al problema combinatorio, ¿dónde lo ves exactamente? ¿En la muestra de entrenamiento? Si es así, teóricamente puede serlo, y probablemente tenga sentido aplicar el ACP aquí, pero no antes de que la muestra final esté lista. Todavía no he encontrado ese problema; al contrario, hay menos predictores que en la muestra inicial.

 
Aleksey Nikolayev #:

La paradoja es que el problema no está totalmente formalizado matemáticamente. La respuesta es diferente, dependiendo de cómo se lleve a cabo la formalización completa.

En el sentido de la utilidad - excepto como un ejemplo instructivo que para un fenómeno real puede haber diferentes modelos matemáticos que dan diferentes respuestas.

¿Cómo?

aquí hay un artículo con el código

También hay un millón de otras realizaciones

Todo formalizado matemáticamente, ¿o me estoy perdiendo el punto?

 
mytarmailS #:

¿Cómo es eso?

aquí hay un artículo con el código

también hay un millón de otras implementaciones

Todo se formaliza matemáticamente, ¿o me estoy perdiendo?

Es como el problema de los 2 matraces, las condiciones están incompletas y puedes adivinar el resto de las condiciones y obtener la respuesta.

 
mytarmailS #:

¿Cómo es eso?

aquí hay un artículo con el código

también hay un millón de otras implementaciones

Todo se formaliza matemáticamente, ¿o me estoy perdiendo?

Mira la wiki, dice que la formulación inicial es incorrecta y no dice claramente que se puede hacer correcta de diferentes maneras. La esencia de la paradoja es precisamente que la intuición rellena la reticencia inicial de diferentes maneras para diferentes personas. Un efecto puramente psicológico.

 
Rorschach #:

Es como el problema de los dos frascos, las condiciones son incompletas, la respuesta será según te apetezca el resto de las condiciones.

No lo entiendo, pero atribuyámoslo a mi analfabetismo...

Entonces, ¿cuál es el objetivo de esta mierda en pocas palabras?

He leído tu post, construir el heurst y qué hacer con él?


 
Aleksey Vyazmikin #:

He escrito más arriba que excluyo los predictores que tienen una señal similar en la muestra, es decir, la correlación entre los predictores cuantílicos se reduce, aunque utilizo mi método de agrupar y seleccionar el mejor resultado de un grupo de similares.

En cuanto al problema combinatorio, ¿dónde lo ves exactamente? ¿En la muestra de entrenamiento? Si es así, teóricamente puede serlo, y probablemente tenga sentido aplicar el ACP aquí, pero no antes de que la muestra final esté lista. No he encontrado ese problema en la realidad, al contrario, hay menos predictores que en la muestra inicial.

Pues bien, si dividimos cada predictor en dos trozos y buscamos todas las reglas posibles en las que se incluya una mitad de cada predictor, entonces habrá 2^N trozos diferentes, donde N es el número de predictores. Ahora, cada una de estas piezas puede ser tomada o descartada: obtenemos 2^(2^N) variantes. Se trata de un número enorme incluso con una N pequeña.

 
Aleksey Nikolayev #:

Bien, si dividimos cada predictor en sólo dos trozos y miramos todas las posibles reglas que incluyen una mitad de cada predictor, entonces habrá 2^N trozos diferentes, donde N es el número de predictores. Ahora, cada una de estas piezas puede ser tomada o descartada: obtenemos 2^(2^N) variantes. Se trata de una cifra enorme, incluso con una N pequeña.

Primero descartar y luego combinar.