Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1034

 
Maxim Dmitrievsky:

decidieron atiborrar los predictores de no-acumulación y multiplicar sin ningún sentido

¿De dónde has sacado tantos predictores? ¿Cuál es su importancia? Hay 1/3 del bosque que no está incluido en el conjunto de entrenamiento, y el 95% tiene poca importancia. ¿Y cuál es la retroalimentación que tiene ahora el sistema con tantos predictores, 3 horas para 1 pronóstico? )

No lo sabrás hasta que lo construyas...

El resultado en sí: es posible con Apache Spark

Ahora no hago más de 1000 pronósticos. Pero menos de 100 predictores no es suficiente.

 
Roffild:

No lo sabrás hasta que lo construyas...

El resultado en sí: esto es posible con Apache Spark

Por el momento no hago más de 1000 pronósticos. Pero menos de 100 predictores creo que no es suficiente.

¿Ignoras deliberadamente las preguntas?

Repito: ¿cómo es que hay tantos predictores?

 
Maxim Dmitrievsky:

¿Ignoras deliberadamente las preguntas?

Repito: ¿cómo es que hay tantos predictores?

Puedes hacer mil millones de predictores, impulso en incrementos de uno y así sucesivamente)

Pero no le darán nada adicional.

 
Maxim Dmitrievsky:

¿Ignoras deliberadamente las preguntas?

repito: ¿cómo es que hay tantos predictores?

La mayoría de estos predictores dan como resultado: bool(high[0] > high[1]) y por lo tanto tienen estado 0 o 1

Por supuesto, estoy generando una lista de predictores con un script.

No tiene sentido la selección intencionada de predictores, porque es fácil excluir uno importante de ella.

 
Roffild:

La mayoría de estos predictores dan como resultado: bool(high[0] > high[1]) y tienen respectivamente el estado 0 o 1

Por supuesto, genero una lista de predictores con un script.

No tiene sentido seleccionar a propósito los predictores, porque es fácil excluir uno importante.

Hay que tomar no por cantidad sino por transformación de los pocos iniciales hasta que las clases sean bien separables, con control de errores en OOS

 
forexman77:

Puedes hacer mil millones de predictores, impulso en incrementos de uno, etc.)

Pero no nos dan nada adicional.

Si el predictor no forma parte del bosque, no hará ningún daño. Quizá este predictor se manifieste en otra versión del bosque aleatorio.

Estamos hablando de una matriz de 7000 dobles, que ocupa poca RAM y se mueve en cuestión de nanosegundos. No hay ninguna ralentización perceptible en la interpretación de 500 árboles con 7000 predictores. Si no me crees, instala Spark y compruébalo tú mismo.

 
Maxim Dmitrievsky:

Hay que tomar no por cantidad sino por transformación de los pocos iniciales hasta que las clases sean bien separables, con control de errores en el OOS

Evaluar la calidad de un bosque es un tema completamente diferente.
 
Roffild:
Evaluar la calidad de un bosque es un tema completamente diferente.

La cuestión es la eficacia del enfoque, su propuesta es, por decirlo claramente, ineficaz

 
Maxim Dmitrievsky:

La cuestión es la eficacia del enfoque, su enfoque propuesto es, por decirlo claramente, ineficaz.

La eficacia aún está por demostrar con resultados prácticos. Quizá mi método de estimación de los gráficos de precios no coincida con los indicadores clásicos de calidad, pero al final todo se decide por el beneficio.

Respondía a la pregunta "¿por qué necesitamos a Spark?" Le contesté. ¿O vas a acusarme de nuevo de ignorar las preguntas?

 
Roffild:

La eficacia aún debe demostrarse con resultados prácticos. Tal vez mi método de evaluación para los gráficos de precios no coincida con los indicadores clásicos de calidad, pero al final es el beneficio el que lo decide todo.

Respondía a la pregunta "¿por qué necesitamos a Spark?" Le contesté. ¿O va a acusarme de ignorar las preguntas otra vez?

Hace tiempo que está claro lo de la chispa, no he preguntado. Preguntado por la idea. Este enfoque de la chispa es exactamente lo que se lanza de golpe debido a la curva de aprendizaje ineficiente y a la capacidad requerida.

Lo mismo puede hacerse mediante la optimización en la nube de MT5 sin andamiaje. No sé si tu salida y si te da beneficios, pero no es así y este algoritmo siempre fallará debido a los sobreajustes

IMHA