Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3084

 
Lilita Bogachkova #:

Sí,

pero el gran número con los mismos valores me hace cuestionar la calidad general de los datos.
Ejemplo: seq = ([5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5]) = [5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5,5,5][5]; [5,5,5,5,5,5][5] ....
No veo el sentido de alimentar el modelo con tales datos de entrenamiento;

Así que sigo tamizando todos los datos que no son únicos.

Podría equivocarme, pero me parece mal alimentar también el modelo con los siguientes datos de entrenamiento:

[1,2,3,4,5] [5];

[1,2,3,4,5] [6];

[1,2,3,4,5] [7];

[1,2,3,4,5] [8];

...

Es un montón de mierda

 
Aleksey Vyazmikin #:

¿Tampoco tienes resultados de la muestra de entrenamiento?

La serie de esos artículos no es una solución lista para usar: nadie le revelará lo más valioso en el aprendizaje automático: los predictores. Así que antes de probar los métodos que allí se proponen, es necesario desarrollar un conjunto de predictores que potencialmente puedan describir el comportamiento de los precios.

El sí tampoco funciona en la muestra de entrenamiento. Simplemente no funciona en ningún sitio. ¿Y qué son los predictores en este caso? El autor describe la toma de parámetros del gráfico en forma de velas, tiempo y 4 indicadores. El modelo de red neuronal también está ahí.
 
Maxim Dmitrievsky #:

¿dónde está escrito que no deben dar resultados aleatorios? :) la abundancia de artículos idénticos ya sugiere una dirección equivocada.

El aprendizaje por refuerzo no está diseñado para este tipo de tareas, el campo de aplicación es bastante diferente. Se puede jugar con ello.
El autor ofrece un gráfico y estadísticas del probador de estrategias al final de cada artículo. Bueno, si las estadísticas son ficticias, entonces sí....
 
Viktor Kudriavtsev #:
Tampoco funciona en la muestra de entrenamiento. No funciona en ninguna parte. ¿Y qué son los predictores en este caso? El autor describe la toma de parámetros del gráfico en forma de velas, tiempo y 4 indicadores. El modelo de red neuronal también está ahí.

Si no funciona en la muestra de entrenamiento, entonces probablemente el problema está de su lado. Las redes neuronales tardan mucho tiempo en entrenarse, no como los modelos de árbol.

Los predictores pueden ser cualquier cosa, cualquier factor que afecte al precio con un resultado probabilístico estable, sí, como opción - indicadores.

Bueno, el autor tenía algunos errores en el código (crítico para las tarjetas no Intel) - un par de versiones de las reglas en las peticiones de la gente.
 
Aleksey Vyazmikin #:

Si tampoco funciona con la muestra de entrenamiento, probablemente tengas un problema. Las redes neuronales tardan mucho en entrenarse, no como los modelos de árbol.

Los predictores pueden ser cualquier cosa, cualquier factor que afecte al precio con un resultado probabilístico estable, sí, como opción - indicadores.

Bueno, el autor tenía algunos errores en el código (crítico para las tarjetas no Intel) - un par de versiones de las reglas en las peticiones de la gente.

Bueno, tengo los últimos artículos (de GoExplore y en adelante) y de 27 a 35 parecen compilar y ejecutar normalmente. No funcionó 36-38 es que en el probador entrenado. Tengo una tarjeta de Nvidia GTX 660 ti.

¿Cuál podría ser el problema de mi lado? Mi sovtnik compila, se ejecuta, el proceso de aprendizaje (error y el progreso en el gráfico) continúa. ¿Y cuánto es la deuda? El autor de los artículos también escribe mucho, es necesario repetir las iteraciones de la recogida de ejemplos y de formación, pero en ninguna parte escribe cualquier cifras al menos aproximadas. Por ejemplo, he entrenado 500 épocas, las primeras ofertas comenzaron a ser menos. Bueno, al menos algo de especificidad en las cifras. Por lo demás no está nada claro, o enseño mucho y algo falla, o no he enseñado lo suficiente y es pronto para esperar nada.

 
Viktor Kudriavtsev #:
Al final de cada artículo, el autor ofrece un gráfico y estadísticas del probador de estrategias. Si las estadísticas son ficticias, entonces sí.....
Son pruebas muy modestas para un periodo corto de tiempo, y es imposible sacar conclusiones inequívocas de ellas. Si no funciona ni en el de entrenamiento, es que la han liado gorda :) El enfoque en sí es inadecuado, porque el proceso de dicha formación es difícil de controlar. Y si encuentras la función de control adecuada (recompensas), ya no la necesitas.
He probado diferentes, no pude obtener resultados estables.

Y es computacionalmente más complicado que la optimización genética, pero no mejor en términos de eficiencia. Se puede hacer en 1 iteración con resultados similares. Sin un conocimiento experto en el campo del trading, no saldrá nada bueno.
 
Maxim Dmitrievsky #:
Hay pruebas muy modestas para un periodo corto de tiempo, no se pueden sacar conclusiones inequívocas de ellas. Si no funciona ni siquiera en un programa de formación, significa que han cometido muchos errores :) El enfoque en sí es inadecuado, porque el proceso de este tipo de formación es difícil de controlar. Y si encuentras la función de control adecuada (recompensas), ya no la necesitas.
.
He probado diferentes, no pude obtener resultados estables.

Y es computacionalmente más complicado que la optimización genética, pero no mejor en términos de eficiencia. Se puede hacer en 1 iteración en absoluto, con resultados similares. Sin un conocimiento experto en el campo del trading, no saldrá nada bueno.
He intentado entrenar Asesores Expertos de esta serie utilizando métodos genéticos y evolutivos (artículos 30 y 31). El autor tiene 1000 épocas en los parámetros. La población es de 50 individuos por epoch según tengo entendido. El mejor resultado se muestra en el registro durante el entrenamiento. Así que para 200 epochs este mejor resultado no ha cambiado en relación con el inicial. También he puesto la población de 100 individuos y entrenado unas 150 epochs. El efecto es el mismo. Así que abandoné este método y pasé a otros más nuevos.
 
Viktor Kudriavtsev #:
He intentado entrenar EAs de este ciclo utilizando métodos genéticos y evolutivos (artículos 30 y 31). El autor tiene 1000 épocas en los parámetros. La población es de 50 individuos por epoch, según tengo entendido. El mejor resultado se muestra en el registro durante el entrenamiento. Así que para 200 epochs este mejor resultado no ha cambiado en relación con el inicial. También he puesto la población de 100 individuos y entrenado unas 150 epochs. El efecto es el mismo. Así que abandoné este método y pasé a otros más nuevos.

Es una completa pérdida de tiempo perder el tiempo con cualquier modelo novedoso, especialmente los complejos.

El ideal de RF es un modelo sencillo y muy claro. Se pueden tomar un par de tres modelos más de modelos antiguos y bien probados, si se pretende obtener el resultado final mediante un conjunto de modelos (da aproximadamente un 5% de reducción del error).

Mi escepticismo se explica de forma muy sencilla: nuestro principal enemigo NO es la estacionariedad de los mercados financieros, es decir, el teorema del límite y todas las estadísticas basadas en él -diferentes correlaciones, dispersiones, etc.- no funcionan. Por cierto, y estimaciones como el RMSE.


Por eso hay que empezar por el preprocesamiento (datamining). Sin obtener un conjunto de predictores con una conexión suficientemente estable con el objetivo (profesor), no tiene sentido hablar de nada. Es la calidad de esta conexión la que determina el error de predicción y su estabilidad en diferentes partes de las citas. El modelo no tiene nada que ver en absoluto. Si en la RF se obtiene aproximadamente el mismo error de predicción en "dentro de la muestra" y "fuera de la muestra", inferior al 20%, entonces se puede probar con el mismo conjunto de predictores y tratar de reducir el error de predicción mediante modelos más avanzados, conjuntos de modelos..., pero se trata de un pequeño porcentaje, para el que no tiene sentido dedicar tiempo a otra cosa que no sea la RF.

Hay una condición más: la prueba matemática de la estabilidad de la conexión de los predictores con el objetivo, es decir, la estacionariedad de la conexión de los predictores con el objetivo con la obtención de la varianza de la conexión de los predictores con el objetivo y la prueba de al menos su estabilidad aproximada en el sentido de GARCH.

Y diferentes "épocas" y siglos de pruebas... nada, que tanto te quejas, parece que estás en el tema, pero corres en tu sitio.

 
Viktor Kudriavtsev #:
No escuches a nadie, aquí no hay expertos.