Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 235

 
Vizard_:
Veo que ya han empezado a escribir libros sobre r)))
allitebooks.com/automated-trading-with-r-2/
El puño es empezar a escribir libros sobre "cómo hacer dinero", entonces este método ya no funciona o nunca funcionó. Un indicador, sin embargo. Es decir, cuando la descripción de un método en un libro hace más dinero que el propio método.
 
Vizard_:
Por el bien del deporte, me adelanté un poco, me detendré allí. Los recursos se liberan un poco, pero el deseo no es y no era en absoluto,

sólo apoyó la idea de un "billete de entrada a la sucursal". < 0,69, en una suposición, no hay mucho problema para salir adelante. < 0,68 no sé, hay que pensarlo))

https://numer.ai


Por favor, dígame, ¿qué modelo, cómo aprendió?
 
lucky_teapot:
Por favor, dime qué modelo, ¿cómo se enseñó?

El error de predicción de clase es inferior al 30%. Puede ser mucho menos del 30%, pero menos del 20% no se podría conseguir. Pero hay buenas razones para decir que el modelo NO está sobreentrenado. Lo importante es que no esté sobreentrenado: un modelo sobreentrenado no es necesario en absoluto, es una basura peligrosa.

Modelos: random forest y ada. Por lo general, la elección del modelo tiene poco efecto en el resultado, si es que se entrena. En mis predictores, la red no está entrenada en absoluto.

 
SanSanych Fomenko:

El error de predicción de clase es inferior al 30%. Ocurre mucho menos del 30%, pero no se ha podido conseguir menos del 20%. Sin embargo, hay buenas razones para creer que el modelo NO está reentrenado. Lo principal es no estar sobre-entrenado - un modelo sobre-entrenado no es necesario en absoluto, es una basura peligrosa.

Modelos: random forest y ada. Por lo general, la elección del modelo tiene poco efecto en el resultado, si es que se entrena. En mis predictores la red no está entrenada en absoluto.

¿Qué tipo de pérdida de troncos tienes ahí?
 
lucky_teapot:
¿Qué tipo de pérdida de troncos tienes ahí?
¿Qué es el logloss?
 
SanSanych Fomenko:

El error de predicción de clase es inferior al 30%. Puede ser mucho menos del 30%, pero menos del 20% no se podría conseguir. Sin embargo, hay buenas razones para creer que el modelo NO está reentrenado. Lo principal es no estar sobre-entrenado - un modelo sobre-entrenado no es necesario en absoluto, es una basura peligrosa.

Modelos: random forest y ada. Por lo general, la elección del modelo tiene poco efecto en el resultado, si es que se entrena. En mis predictores la red no está entrenada en absoluto.

SanSanych Fomenko:
¿Qué es el logloss?

Supongo que estás hablando de tu puntuación enhttps://numer.ai pero no enlogloss sino en términos de hashing (% de error). Peroel logloss es una cosa complicada, no sólo necesitas adivinar la clase sino también la probabilidad.

 
lucky_teapot:

Entiendo que estás hablando de tu calibre enhttps://numer.ai pero no en logloss sino en el dobladillo (% de error), peroel logloss es algo complicado, no sólo hay que adivinar la clase sino también la probabilidad.

Estoy escribiendo sobre mi EA. Tiene un modelo.

Yo uso paquetes y tienen una estimación aproximada, que no tiene nada que ver con el logloss. Además, los resultados de los paquetes pueden estimarse por otros medios.... No recuerdo los loglos.

Y la clase, en los paquetes que he visto, se deriva de la probabilidad, es decir, en realidad la probabilidad se cuenta y luego se calibra. Es estándar en la mitad para dos clases, pero puedes entrar y dirigir.

 
SanSanych Fomenko:

Estoy escribiendo sobre mi EA. Tiene un modelo en él.

Yo uso paquetes y hay una valoración en ellos, a simple vista, que no tiene nada que ver con los loglos. Además, los resultados de los paquetes pueden ser evaluados por otros medios.... No recuerdo los loglos.

Y la clase, en los paquetes que he visto, se deriva de la probabilidad, es decir, en realidad la probabilidad se cuenta y luego se calibra. Es estándar en la mitad para dos clases, pero puedes entrar y dirigir.

No puedo decir nada entonces, como mínimo necesitas un conjunto de datos sobre el que hayas obtenido esos resultados. Loglos estoy de acuerdo, para nuestro caso no es realmente la opción adecuada, es un homenaje a kaggle, no reentrenado 20-30% de error en la precisión, eso me suena muy potente, francamente me cuesta creerlo.

En el caso de los loglos, el truco está en que, por ejemplo, para dos clases si se tiene un 0% de error, las probabilidades de respuesta serán cercanas al 100% y al 0%, {0,1,0,1....} cuando el error es del 10%, afecta no sólo a la probabilidad de respuestas incorrectas, sino también a la probabilidad de respuestas correctas, por lo que esas respuestas correctas, que eran 1 y 0, deberían ser ahora por ejemplo 0,8 y 0,2, cuando el error es del 45%, todo debería oscilar alrededor de 0,5 +- 0,1, por lo que el logloss sería óptimo, tal alquimia ....

 
Dr.Trader:

Acabo de mirar el perfil de lucky_teapot, había un hilo en el foro con un enlace a un artículo. Creo que todo fue transferido desde el foro mql4.com, que apenas estudié, gracias MetaQuotes si realmente lo transfirió desde allí.
El artículo tiene casi 9 años, pero he encontrado un montón de cosas útiles que puedo probar ahora. Creo que incluso he entendido lo del espacio de retardo dimensional, del que Alexei ya ha hablado un par de veces en este hilo.
El artículo en sí, me parece muy útil -https://www.mql5.com/ru/articles/1506

Lo leí... Me interesó una cosa, el autor dice que se pueden modificar un poco los datos, aumentando así la muestra y el modelo entonces funcionará mejor, ya que la base de conocimiento del modelo será más amplia...

Estoy trabajando con diferenciales y los diferenciales siguen siendo pequeños en comparación con la muestra total

Creo que si sacamos una muestra multimillonaria y enseñamos al modelo a captar retrocesos, habrá muchos ejemplos y creo que el patrón de retrocesos es el mismo en ambos mercados(me refiero a muchos patrones)

Y aquí tengo otra pregunta, o más bien una idea pero sin solución todavía...

Creo que si separamos todos los retrocesos de este multimillón de valores y dejamos sólo esos como muestra de entrenamiento, el modelo aprenderá sólo los retrocesos por sí mismo, es tan rápido, pero cuando necesitemos distinguir un retroceso de un no retroceso en los nuevos datos ¿cómo lo hará el modelo si no tiene idea de lo que es un no retroceso...? ((.

 
mytarmailS:

Lo leí... Me interesó una cosa, el autor dice que se pueden modificar un poco los datos, aumentando así la muestra y el modelo entonces funcionará mejor, ya que la base de conocimiento del modelo será más amplia...

Estoy trabajando con pivotes y los pivotes siguen siendo pequeños en comparación con la muestra total


¿Qué es un pivote? ¿Una barra como en ZZ?

Me gusta mucho la idea (que se ha sacado aquí en el hilo) de considerar una inversión como una determinada secuencia de barras, tras la cual, en el futuro, habrá un beneficio predeterminado. Este enfoque reduciría en gran medida el desequilibrio de clases. Esa es una. Dos, la propia clase tendría una clara propiedad predictiva.