Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2602

 
mytarmailS #:
Un ejemplo concreto:
Hay una regla lógica que predice algo con un 80% de probabilidad tanto en el tren como en la prueba y la validación cruzada, etc. Pero en los datos de validación (datos nuevos absolutamente desconocidos) la regla funciona a nivel aleatorio...

Hay otra regla que se comporta igual que la primera en un tren, prueba y pasa la validación también sin problemas, es decir, es un patrón real...

Pregunta: ¿Cómo puedo distinguir una regla de otra en la etapa de entrenamiento, prueba, crosvalidación... antes de la etapa de validación...

Me pregunto si hay algún signo por el que podamos trazar la línea entre uno y otro, tal vez algunas pruebas estadísticas de aleatoriedad o determinismo, etc...

La cuestión de la aleatoriedad/continuidad es una piedra angular para todo el algo y para el ML en el algo.

Un montón de trucos y artimañas de todo tipo.


Lo más fácil es mirar cómo se ha obtenido el resultado. Si el mejor resultado que obtuviste... escogiendo el mejor resultado del conjunto - por supuesto, la probabilidad de que encaje es muy alta (especialmente si la mayoría de los otros resultados son sobre nada). Los resultados de la prueba. ¿Cómo los has conseguido? - Por supuesto, si se tomara el 5% de los mejores de la bandeja, se los hiciera pasar a todos por la prueba y se seleccionara a los mejores de la prueba, por supuesto, la probabilidad de encajar sigue siendo pequeña (especialmente si el resultado medio de los demás no es mucho). Este "cómo no hacerlo" reducirá, estoy seguro, la probabilidad de que se sobrecaliente muy decentemente. Por esta razón, no veo cómo el robot/modelo de otra persona puede ser evaluado en equidad, de ninguna manera.


Además, como ya se ha dicho, todo tipo de trucos y artimañas.

 
Replikant_mih #:

La cuestión de la aleatoriedad/ilegalidad es un tema fundamental para todo algo y para el ML en algo.

Hay todo tipo de trucos y artimañas.

Lo más fácil es mirar cómo se ha obtenido el resultado. Si el mejor resultado que obtuviste... escogiendo el mejor resultado del conjunto - por supuesto, la probabilidad de que encaje es muy alta (especialmente si la mayoría de los otros resultados son sobre nada). Los resultados de la prueba. ¿Cómo los has conseguido? - Por supuesto, si se tomara el 5% de los mejores de la bandeja, se los ejecutara a todos en la prueba, se seleccionaría el mejor de la prueba - por supuesto, la probabilidad de encajar sigue siendo poco (especialmente si el resultado promedio de los otros no es mucho). Este "cómo no hacerlo" reducirá, estoy seguro, la probabilidad de que se sobrecaliente muy decentemente. Por esta razón, no veo cómo el robot/modelo de otra persona puede ser evaluado en la equidad, de ninguna manera.

Además, como ya se ha dicho, todo tipo de trucos y artimañas.

Todo es obvio, aceitado... Interesado en trucos específicos

==============================

Por ejemplo, como variante, el análisis de la superficie de optimización (RP) de TC, reglas, AMO y demás...

Por ejemplo, OD TC intersección de dos vagones por objetivo "factor de recuperación".

Por supuesto, esta ST no funciona, nunca lo hizo y nunca lo hará


=======================================

Y aquí es un PP trabajando TS, que es muy estable, hace un beneficio hasta ahora (Valery sabe :) )


Por así decirlo, siente la diferencia.

 

Así que tengo la obsesiva idea de que si se ve el DO del TC, se puede saber qué es y si funcionará con los nuevos datos...

Pero es largo y complicado calcular el DO, tal vez se pueda obviar de una manera más elegante y que consuma menos tiempo desde el punto de vista de los recursos informáticos.

 
mytarmailS #:

Así que tengo la obsesiva idea de que si se ve el DO del TC, se puede saber qué es y si funcionará con los nuevos datos...

Pero es largo y complicado calcular el OP, tal vez sea posible eludirlo de forma más elegante y menos trabajosa en términos de recursos informáticos.

Tengo una idea de cómo lo hacen los algo-traders. No tengo ni idea de cómo lo hacen los científicos de datos. Y sé exactamente cómo lo hago)).


La superficie de optimización, según entiendo, es (en este caso) un espacio de 3 dimensiones, donde 2 ejes son ejes de parámetros (modelo, estrategia) y uno es la métrica objetivo. Sí, por supuesto que puedes entrar por ahí. Tengo un par de maneras, y si es necesario puedo inventar algo más. Sin embargo, ahora lo veo desde el otro lado. Y, por supuesto, no hay ningún deseo de compartir información útil con alguien que va con"Son cosas obvias, mariposas").

 
mytarmailS #:
No siempre es posible rastrear la causalidad

Entonces sólo se pueden hacer suposiciones sobre las causas y la presencia de un patrón. Las causas son primarias, el comportamiento es secundario. En el AT a veces se olvidan de la primacía de las causas y toman las repeticiones aleatorias de comportamiento como patrones, que no lo son.

 
Replikant_mih #:

Tengo una idea de cómo lo hacen los algo-traders. No tengo ni idea de cómo lo hacen los científicos de datos. Y sé exactamente cómo lo hago).


La superficie de optimización, según entiendo, es (en este caso) un espacio de 3 dimensiones, donde 2 ejes son ejes de parámetros (modelo, estrategia) y uno es la métrica objetivo. Sí, por supuesto que puedes entrar por ahí. Tengo un par de maneras, y si es necesario puedo inventar algo más. Sin embargo, ahora lo veo desde el otro lado. Y, por supuesto, no hay ningún deseo de compartir información útil con alguien que va con"Son cosas obvias, mariposas").

Mira, si tu respuesta a la pregunta es : Muchos trucos y artimañas. Y además, como ya se ha dicho, todo tipo de trucos y artimañas.

Gracias por este conocimiento profundo, que definitivamente no es "aceite de mantequilla".

Intenta responder en sitios especiales como SA o CV, es interesante la cantidad de pluses que obtendrás...

Si te molesta tanto, siempre puedes llorar ))

 
mytarmailS #:

Mira, si tu respuesta a la pregunta es: Muchos trucos y artimañas. y además, como has dicho, todo tipo de trucos y técnicas.

Gracias por estos conocimientos profundos, que definitivamente no son "dedos de mantequilla".

Intenta responder en sitios especiales como SA o CV, es interesante la cantidad de pluses que obtendrás...

Si te molesta tanto, siempre puedes llorar ))

Me alegro de que te haya gustado).

 
Valeriy Yastremskiy #:

Entonces sólo puede haber suposiciones sobre las causas y la presencia de un patrón. Las causas son primarias, el comportamiento es secundario. En el AT a veces se olvidan de la primacía de las causas y toman las repeticiones aleatorias de comportamiento como patrones, que no lo son.

Estoy de acuerdo, es un tema complicado...

Por eso es necesario entrar en las matemáticas para tener una respuesta, no "muchos trucos y artimañas".

 

1) Creo que es obvio que no hay ni puede haber forma de probar que un patrón establecido en la historia funcione necesariamente en el futuro.

2) La existencia de un método que establezca un patrón determinista (no aleatorio) para el futuro basado en datos del pasado sería una negación de (1)

Sólo tenemos la validación cruzada, que sólo puede establecer la homogeneidad de un patrón en la historia. Sólo podemos interpolar el patrón, no extrapolarlo. Sólo tenemos una PROPOSICIÓN muy débil de que un patrón bien interpolado resultará bien extrapolado. No se trata de una inferencia deductiva, sino meramente inductiva, una variante de la inferencia por analogía.

 
Aleksey Nikolayev #:

1) Creo que es obvio que no hay ni puede haber forma de probar que un patrón establecido en la historia funcione necesariamente en el futuro.

2) La existencia de un método que establezca la determinabilidad (no aleatoriedad) de un patrón para el futuro mediante datos del pasado sería una negación de (1)


Entonces, ¿cuál es la obviedad de (1) y cuáles son los argumentos para su validez?