Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 48

 
Dr.Trader:

Llevo un tiempo experimentando con RNeat y he llegado a la conclusión de que no se puede manejar de la misma manera que las redes neuronales convencionales.

Gracias por compartir tus hallazgos, es muy interesante...

Tomé tu ejemplo con los iris y lo reescribí para que se ajustara a mis datos y obtuve un error, no entiendo qué es lo que está mal. Quiero saber si has intentado utilizar tus datos además del iris, ¿cuál ha sido el resultado en comparación con la cuadrícula normal?

 
Interesante artículo sobre la evaluación de los modelos de clasificación.
 
Dr.Trader:

Experimenté un poco más con RNeat y llegué a la conclusión de que no se puede manejar de la misma manera que las redes neuronales convencionales.

1) A diferencia de los modelos convencionales, el entrenamiento de RNeat no utiliza datos brutos. El modelo se genera de forma aleatoria, se mejora y sólo al final se prueba con datos brutos. Normalmente, los modelos utilizan datos brutos, construyen su lógica a partir de ellos y luego utilizan el muestreo de validación para ver si la lógica del modelo es correcta o si simplemente ha aprendido los ejemplos brutos. A diferencia de los demás, RNeat no es capaz de memorizar los datos brutos en absoluto, ya que no los conoce, todo lo que el modelo sabe son los resultados requeridos y lo cerca que está de ellos.

2) La validación cruzada no ayudará a mejorar los resultados del fronttest. Parece que todos estamos de acuerdo en que es posible entrenar un modelo normal, ejecutar un par de validaciones cruzadas y manejar de alguna manera los errores de todas las muestras para la puntuación final de aptitud del modelo. Como RNeat no conoce los datos en bruto, no le importa si los datos están en una muestra de entrenamiento o de prueba, ajustará su lógica al resultado deseado en cualquier caso. Teóricamente "aprenderá" (más exactamente mutará :) ) de todas las muestras que se utilizan en la función de fitness. Lo único que se puede hacer es entrenar el modelo con la precisión adecuada y esperar que no se sobreentrene, un enfoque bastante arriesgado para el mercado de divisas. La validación cruzada sólo se puede utilizar después del entrenamiento como una estimación final del posible resultado en el fronttest, y de ninguna manera utilizar esta muestra de validación dentro de la función de fitness.

En la validación cruzada, se recogen los parámetros de entrenamiento. ¿Hay algún parámetro en esta NS? Debería haberla.
 
mytarmailS:

Por favor, dígame exactamente que ha intentado sustituir sus propios datos además de los de iris, ¿cuáles fueron los resultados en comparación con la red habitual?

He utilizado datos de forex (eurusd d1 durante un año), el modelo lleva ya un día aprendiendo, muestra su propia mejor estimación = 0,017 (cuanto más mejor, para iris era 0,7). Hasta ahora no hay resultados reales, el modelo muestra un 50% de error incluso en los datos de entrenamiento y tengo que dejarlo aprender un par de días más.

Alexey Burnakov:
En la validación cruzada se recogen los parámetros de entrenamiento. ¿Hay algún parámetro en esta NS? Tiene que haberla.

El modelo se complica cada vez más y añade cada vez más neuronas. Hay un parámetro que define el número máximo de neuronas para limitar su crecimiento. Y un segundo parámetro que define el número de individuos de la genética. Por lo general, ambos cuanto más mejor, un límite se introduce más bien para ahorrar memoria y tiempo, es mejor utilizar el valor máximo permitido para usted en lugar de recoger.

El modelo, a juzgar por las descripciones, tiene un precio para cada neurona y las conexiones entre ellas, por lo que busca utilizar el menor número de neuronas posible. Si el entrenamiento tiene éxito, el modelo alcanzará la precisión requerida antes de alcanzar el número máximo de neuronas.

 
Dr.Trader:

He añadido datos de forex (eurusd d1 durante un año), el modelo está aprendiendo durante un día ya y muestra su propia mejor estimación = 0,017 (cuanto más mejor, para Iris era 0,7). El modelo muestra un error del 50% incluso en los datos de entrenamiento y tengo que dejar que aprenda durante unos días más.

¿hay muchos predictores?
 
SanSanych Fomenko:
Interesante artículo sobre la estimación de modelos de clasificación.

He probado 3 métricas diferentes para estimar el modelo en un subconjunto de predictores: Exactitud como en este artículo; modelo R^2; y sólo error medio del modelo (abs(y-x)/(max(y)-min(y)), donde X es el vector de resultados de la predicción e Y es el resultado requerido).

La exactitud de las funciones de aptitud estaba bien, pero tenía un problema con no muchos ejemplos en la muestra, la precisión sale muy escalonada. Dos modelos, de calidad similar, sólo dieron el mismo resultado. Pero si hay muchas muestras de entrenamiento y validación, sería una buena métrica. No puedo decir nada sobre el resto de métricas descritas en el artículo.

R^2 se comportaba de forma extraña, incluso podía ser negativo aunque más del 50% de los resultados fueran correctos, en general no me gustaba.

El error medio es el que más me convenía. El paso como en la precisión no está presente, porque sustituyo en la fórmula el resultado de la regresión, incluso antes de redondear a las clases 0 o 1. Incluso si dos modelos dan el mismo resultado para las clases, puedo determinar el mejor, en términos de cuánto se "acerca" el resultado de la regresión a los resultados deseados.

mytarmailS:
¿Hay muchos predictores?

Alrededor de 400

 
¿Alguno de ustedes sabe algo sobre el análisis espectral de Fourier? Necesito ayuda.
 
mytarmailS:
Aquí los que saben al menos un poco de análisis espectral de Fourier. Necesito ayuda.
¿Qué no está tan claro? Descomponer una función periódica en armónicos y obtener un espectro.
 
Yury Reshetov:
¿Por qué no está claro? Descomponemos una función periódica en armónicos y obtenemos un espectro.

Es cierto, pero mi tarea es diferente...

Necesito encontrar similitudes en BP aquellas áreas que están cerca unas de otras, la proximidad se puede medir por correlación, métrica euclidiana, etc. Según mis experimentos entendí que tales métricas no son adecuadas para mi tarea creo que se adaptan muy bien a la búsqueda de proximidad a través de la amplitud, fase, frecuencia... Pero como tal se hace ninguna idea, por lo que pido que sabe cómo y qué, lo que es correcto, lo que no es, cómo debe ser en general.

P.D. puedes en privado, no a destiempo, en principio, la conversación no es sobre el tema de esta rama y es poco probable que alguien interesante

 
Yury Reshetov:
¿Qué no está claro ahí? Descomponemos una función periódica en armónicos y obtenemos un espectro.
¿Por qué periódico?
También podemos descomponer un solo pulso, que no es periódico en absoluto)