Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 804

 
Yuriy Asaulenko:

No te pongas triste, soy consciente de ello). Aunque, si te sientes más cómodo, puedes continuar.

Pero tienes razón.

 
Aleksey Vyazmikin:
Por favor, díganme si es suficiente con buscar la correlación con los datos del objetivo en la fase inicial, y si es así, qué umbral de correlación debería utilizarse.
La correlación es un método lineal. Si hay uno, no tiene sentido hacer un huerto de NS. La regresión lineal es suficiente.
 
Grigoriy Chaunin:
La correlación es un método lineal. Si está presente, no tiene sentido hacer un huerto con NS. La regresión lineal es suficiente.

Gracias por su respuesta.

¿Qué tal si aplicamos la regresión lineal para identificar las relaciones más sólidas, añadiendo características adicionales?

 
No entiendo la pregunta. Sin embargo, la regresión lineal no funciona en los mercados financieros.
 

Llevo un tiempo pensando en esto.... en realidad.

Tenemos una matriz de diez por diez, ¿qué podemos decir de ella?

La cantidad de datos es de 100.

A continuación, podemos calcular la cantidad de información de estos datos, que también se expresará en algunas unidades. ¿Qué más contiene este conjunto de datos, además de la cantidad de datos y la cantidad de información???? No voy a perder el tiempo contestando. La cantidad de conocimientos. Todo esto es natural en relación con el objetivo. Así que si observamos la relación causa-efecto obtenemos el siguiente modelo.

Cantidad de conocimiento -> Cantidad de datos -> Cantidad de información.

Por lo tanto, para predecir es necesario encontrar sólo el CONOCIMIENTO sobre un valor requerido de un conjunto de datos, en lugar de la cantidad de información.

El conocimiento en sí mismo es algo muy frágil que puede perderse por una conversión de datos poco hábil. Un cambio descuidado, incluso en un registro por una pequeña cantidad, puede reducir significativamente el importe, si no eliminarlo por completo.

Por ello, no se recomienda complicar los datos de entrada con conversiones. Cuanto más compleja es la transformación, menos conocimientos quedan en el resultado final.

Así que... Sólo pensando en voz alta sobre la alta materia, algunas personas no lo entenderán y seguirán su camino sin llegar a la estación final....

 
Mihail Marchukajtes:

Llevo un tiempo pensando en esto.... en realidad.

Tenemos una matriz de diez por diez, ¿qué podemos decir de ella?

La cantidad de datos es de 100.

A continuación, podemos calcular la cantidad de información de estos datos, que también se expresará en algunas unidades. ¿Qué más contiene este conjunto de datos, además de la cantidad de datos y la cantidad de información???? No voy a perder el tiempo contestando. La cantidad de conocimientos. Todo esto es natural en relación con el objetivo. Así que si observamos la relación causa-efecto obtenemos el siguiente modelo.

Cantidad de conocimiento -> Cantidad de datos -> Cantidad de información.

Por lo tanto, para predecir es necesario encontrar sólo el CONOCIMIENTO sobre un valor requerido de un conjunto de datos, en lugar de la cantidad de información.

El conocimiento en sí mismo es algo muy frágil que puede perderse por una conversión de datos poco hábil. Un cambio descuidado, incluso en un registro por una pequeña cantidad, puede reducir significativamente el importe, si no eliminarlo por completo.

Por ello, no se recomienda complicar los datos de entrada con conversiones. Cuanto más compleja es la transformación, menos conocimientos quedan en el resultado final.

Así que... Sólo con pensar en voz alta sobre la alta materia, algunos no lo entenderán y seguirán su camino sin llegar a la estación final....

Es más, has pensado y redondeado números a docenas y has perdido algunos datos, generalmente es perjudicial pensar, mientras que algunas personas siguen...

 
Aleksey Vyazmikin:

Gracias por su respuesta.

¿Qué tal si aplicamos la regresión lineal para identificar las relaciones más sólidas, añadiendo características adicionales?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
Grigoriy Chaunin:
No entiendo la pregunta, pero la regresión lineal no funciona en los mercados financieros.

¿Entonces no hay correlación? Creo queMaxim Dmitrievsky ha respondido a la pregunta de abajo.

Gracias por la respuesta.

 
Pruebe a trazar la autocorrección sobre los datos de los precios y verá inmediatamente si hay correlación o no. Añadir indicadores es inútil. El indicador está en función del precio. Por lo tanto, lo construimos sólo con datos de precios.
 

Para los aficionados a la validación cruzada, el muestreo de pruebas, el OOS y otras cosas, no me cansaré de repetirlo:

SanSanych y Vladimir Perervenko en particular

Pruebas fuera de la muestra
Este es el método de validación más popular y también el más abusado. En pocas palabras, las pruebas fuera de muestra exigen reservar una parte de los datos que se utilizarán para probar la estrategia una vez desarrollada y obtener una estimación no sesgada del rendimiento futuro. Sin embargo, las pruebas fuera de muestra
reducir la potencia de las pruebas debido a una muestra más pequeña
los resultados están sesgados si la estrategia se desarrolla mediante comparaciones múltiples
En otras palabras, las pruebas fuera de muestra son útiles sólo en el caso de hipótesis únicas. El uso de pruebas fuera de la muestra para las estrategias desarrolladas a través de la minería de datos muestra la falta de comprensión del proceso. En este caso, la prueba puede utilizarse para rechazar estrategias pero no para aceptar ninguna. En este sentido, la prueba sigue siendo útil, pero los desarrolladores de estrategias de negociación saben que el buen rendimiento en las muestras de las estrategias desarrolladas mediante comparaciones múltiples es, en la mayoría de los casos, un resultado aleatorio.
Se han propuesto algunos métodos para corregir la significación fuera de la muestra por la presencia del sesgo de comparaciones múltiples, pero en casi todos los casos reales el resultado es una estrategia no significativa. Sin embargo, como mostramos en la Ref. 1 con dos ejemplos que corresponden a dos grandes regímenes de mercado, las estrategias altamente significativas, incluso después de aplicar correcciones por sesgo, también pueden fallar debido a los cambios en los mercados. Por lo tanto, las pruebas fuera de muestra son estimaciones insesgadas del rendimiento futuro sólo si los rendimientos futuros se distribuyen de forma idéntica a los pasados. En otras palabras, la no estacionariedad puede invalidar cualquier resultado de las pruebas fuera de muestra.


Conclusión: Las pruebas fuera de muestra sólo se aplican a hipótesis únicas y suponen estacionariedad. En este caso son útiles, pero si no se cumplen estas condiciones, pueden ser bastante engañosas.

El ROS sólo puede utilizarse para la anulación de hipótesis o sólo para problemas estacionarios conocidos.

Pero no para buscar estrategias y seleccionar características/evaluar la estabilidad del sistema