Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 184
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Anteriormente he descrito mi enfoque para dividir en 3 clases (vender, cercar, comprar). La clase "valla" incluye todos los casos que se contradicen o que no pueden dividirse en clases de compra y venta. Resulta que sólo el 3-10% entra en las clases de compra y venta. Lo bueno de este enfoque es que al trabajar con datos desconocidos (reales) con el tiempo la red deja de reconocer las situaciones del mercado y empieza a atribuirlas a la "valla" cada vez más, es decir, deja de operar gradualmente. Esto es cien veces mejor que empezar a errar en la entrada cada vez más con el tiempo.
Pero todo es inútil, nadie quiere, nadie escucha.
¿Qué es la valla? ¿Cuando la red para comprar dice comprar y la red para vender dice vender?
Es el mismo ternario de Reshetov.
Anteriormente he descrito mi enfoque para dividir en 3 clases (vender, cercar, comprar).
Esto ya está implementado en jPrediction. Por eso se llama clasificador ternario en lugar de binario.
Implementado de forma muy trivial:
Anteriormente, se suponía que utilizaba el método de la "bicicleta":
Sin embargo, la "rueda" anterior produce más señales falsas en comparación con la clasificación por dos binarios debido a la falta de validación cruzada, pero es más fácil de implementar.
El binario ternario más tonto e inútil, aunque el más primitivo en su implementación: es una RNA con tres salidas. Si cada una de estas salidas tiene su propio umbral de clasificación, producen no tres, sino ocho estados potencialmente posibles, de los cuales sólo tres son inequívocos (un valor por encima del umbral en sólo una de las tres salidas), y cinco no están claros de cómo interpretarlos (valores por encima del umbral en más de una de las salidas, o por debajo del umbral en las tres salidas).
¿Qué es una valla? ¿Cuando la red para comprar dice comprar y la red para sentarse dice sentarse?
Este es el mismo ternario de Reshetov
Esto ya está implementado en jPrediction. Por eso se llama clasificador ternario en lugar de binario.
Implementado de forma muy trivial:
Anteriormente, se suponía que utilizaba el método de la "bicicleta":
Sin embargo, la "bicicleta" anterior produce más señales falsas en comparación con la clasificación por dos binarios, pero es más fácil de implementar.
El binario ternario más tonto e inútil y el más primitivo en su implementación: es una RNA con tres salidas. Si cada una de estas salidas tiene su propio umbral de clasificación, entonces no tienen tres, sino ocho estados potenciales, de los cuales sólo tres son inequívocos (un valor por encima del umbral en sólo una de las tres salidas), y cinco no están claros de cómo interpretarlos (valores por encima del umbral en más de una de las salidas, o por debajo del umbral en las tres salidas).
Hay otra forma que no has considerado. La salida es una de la neurona-clave, pero el área de valores se divide condicionalmente en tres áreas. Lo hice como [-1,5...1,5]. El área de valor medio [-1,0...1,0] es la "valla". Resulta que cuanto más familiar es la situación para la red neuronal, más se excita y los valores tienden más hacia los valores extremos. Los valores fuera del rango [-1,0...1,0] son señales apropiadas para Comprar y Vender.
Pero la gente sigue luchando con la clasificación binaria.
Hay otra manera, que no has considerado. La salida es la misma de la llave neuronal, pero el área de valores se divide condicionalmente en tres áreas. Lo hice como [-1,5...1,5]. El área de valor central [-1,0...1,0] es la "valla".
No lo he ignorado, no lo has leído con atención. Véase el método de dos umbrales "bicicleta" con un n binario. 3 y párr. 4, y cito:
...
Antes de esto, se suponía que se aplicaba el método de la "bicicleta":
- Entrenar un clasificador binario en una mitad de la muestra
- Pruébalo en la segunda mitad de la muestra.
- Utilizando el análisis ROC, aumentar uno de los umbrales para aumentar la sensibilidad y disminuir el segundo umbral para aumentar la especificidad.
- Clasificación: Si el patrón a clasificar está por encima del umbral de sensibilidad - comprar. Si el patrón está por debajo del umbral de especificidad - vender. Si el patrón está entre los umbrales, siéntese en la valla y fume bambú.
...El problema de tu enfoque es que inicialmente (antes del filtrado ternario de las señales de compra/venta) tus MOs se entrenan con datos que pueden explicar más del 5% de todos los datos, ¿ves?
Creo que es la misma historia aquí...
==================================
Mi manera no utiliza el MO en absoluto en la toma de decisiones y no trata de explicar toda la muestra, sino sólo lo que considera una fuerte regularidad estadística, y si tales datos son sólo el 0,01% de todos los datos, entonces sólo se quedarán...
...
Pero la gente sigue jugando con la clasificación binaria.
Porque a la mayoría de la gente le resulta más fácil coger un paquete ya preparado con una clasificación binaria ya implementada que experimentar con una ternaria. No a todo el mundo le gusta reinventar las "bicicletas", porque no todas las ideas dan buenos resultados. A algunas personas les resulta más fácil montar en una bicicleta estándar, aunque tenga ruedas cuadradas.
Si se utiliza la clasificación ternaria, la mayoría de las fuentes sobre aprendizaje automático sugieren el método menos prometedor: entrenar una RNA con tres salidas, lo cual es fácil de implementar pero totalmente inadecuado en la práctica.
Porque a la mayoría de la gente le resulta más fácil coger un paquete ya preparado con la clasificación binaria ya implementada que experimentar con la ternaria. No a todo el mundo le gusta reinventar la "rueda", porque no todas las ideas dan buenos resultados. A algunas personas les resulta más fácil montar una bicicleta ya existente, aunque tenga ruedas cuadradas.
Si se utiliza la clasificación ternaria, la mayoría de las fuentes sobre aprendizaje automático sugieren el método menos prometedor: entrenar una RNA con tres salidas, lo cual es fácil de implementar pero totalmente inadecuado en la práctica.
Pues sí, estoy de acuerdo, lo es.
Pero una cosa es cierta (perdón por la taftalogía): un binario es lo peor que se puede utilizar para el mercado.
El problema con tu enfoque es que inicialmente (antes del filtrado ternario de las señales de compra/venta) tus MOs están entrenados con datos que pueden explicar tal vez el 5% de todos los datos, ¿ves? antes del filtrado ternario los MOs ya están entrenados con ruido y sus salidas son correspondientemente
Verás, intentamos dividir toda la muestra en compra y venta y queremos predecir todos los movimientos del mercado, pero nuestros predictores son tan mierdosos que sólo pueden predecir objetivamente el ~3% de todos los movimientos, así que ¿qué necesitamos? tenemos que intentar coger al menos ese3% y tirarel resto de cosas inseparables porque es la misma basura de entrada/ruido que hay que cribar/motivo de reconversión, etc. llámalo como quieras, está bien...
Veo que entiende la causa de los problemas. Pero estoy tratando de resolverlo de manera diferente a la que usted sugiere.
Me inclino por las palabras de SanSanych: hay que reclutar predictores y objetivos que no sean basura. Con buenos predictores obtendrás un gráfico de ejemplos de entrenamiento, no como el que hice en mi último post, sino como el de Vizard_. Es mucho más difícil que eliminar ejemplos de entrenamiento conflictivos, pero creo que una selección adecuada de predictores será más fiable al final.
No puedo decir nada sobre tu método, no se me da bien, pero espero que puedas hacerlo.