Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2385

 
Maxim Dmitrievsky:

Creo que Alexey sugirió la potencia de cálculo, le gusta calcular algo largo, tal vez debería hacer una cooperativa :)

R sin vectorización seguirá siendo lento. Podrías utilizar algún tipo de base de datos rápida

Tengo partes lentas vectorizadas, la lógica del algoritmo debe ser optimizada, estoy tratando de resolverlo ahora, ya he tratado de acelerarlo 5 veces, he reescrito el código...

Más señales son tan pocas, tan primitivas, yo también debería hacer algo con ella, no me gusta mucho la del objetivo...

Oh, mierda... es como una reparación, el ego sólo puede empezar ...

 
mytarmailS:

Por supuesto que no)), e incluso si lo hicieras, no me afectaría de ninguna manera).

Inténtelo, pero el resultado será, en el mejor de los casos, el mismo que el de Random Forest, es decir, ninguno...


La salida de Forrest es una suma de reglas activadas, las reglas no se filtran ni se rechazan de ninguna manera, y las reglas rechazadas son aproximadamente el 100%)

No se comprueba la repetibilidad de las reglas (puede haber sólo una respuesta) ni su adecuación (si funciona); las reglas se ajustan a los datos (el modelo se ajusta a los datos)

El modelo se aproxima a una muestra de entrenamiento de forma aleatoria, esperando que la validación cruzada ayude, pero no lo hará por razones objetivas (hay muy pocos eventos importantes en el mercado)


He probado un enfoque diferente, no ajusto el modelo a los datos, sino que formo hipótesis y las compruebo.

1) Formo hipótesis plausibles(ya filtradas) en forma de reglas.

2) Las hipótesis se prueban con datos pequeños

3) Las hipótesis que se han probado con datos pequeños se prueban con datos grandes.

De hecho, sólo queda una de un millón de reglas plausibles

Es difícil para el lector inexperto entender la diferencia entre ambos enfoques, pero la diferencia entre ellos es abismal

Una especie de filosofía. Nada concreto...
 
elibrarius:
Una especie de filosofía. Nada concreto...

Pues porque, el camino se anuncia antes, y todo es estrictamente como se pretende. Generar reglas y comprobarlas no es el enfoque habitual, en el que las reglas se seleccionan en función de la lógica/los objetivos del problema. Es decir, normalmente se generan reglas para la solución inicialmente. Esto lleva a la pérdida de reglas que no son lógicas pero que producen resultados.

 
elibrarius:
Una especie de filosofía. Nada concreto...
  • Muchas cosas nos resultan incomprensibles, no porque nuestros conceptos sean débiles, sino porque esas cosas no están dentro del círculo de nuestros conceptos.
Valeriy Yastremskiy:

Por qué, el camino se ha anunciado antes y todo es estrictamente como se planeó. Generar reglas y comprobarlas no es el enfoque habitual, en el que las reglas se seleccionan en función de la lógica/los objetivos de la tarea. Es decir, normalmente se generan reglas para la solución inicialmente. Esto lleva a la pérdida de reglas que no son lógicas pero que producen resultados.

+++

 
mytarmailS:
  • Muchas cosas no las entendemos, no porque nuestros conceptos sean débiles, sino porque estas cosas no están dentro del alcance de nuestro entendimiento.

+++

Un poco más de filosofía))

 
Es típico que estos enfoques tengan resultados que pueden llamarse convencionalmente "antihámster", lo que significa que el hámster se ve pero no se ve. Esto es bastante típico para filas similares a las implementaciones de SB.
 
Aleksey Nikolayev:
Es típico que este tipo de enfoques tengan resultados que pueden llamarse convencionalmente "antihámster", lo que significa que el hámster se ve pero no se ve. Esto es bastante típico de filas similares a las implementaciones de SB.

No estoy de acuerdo. El problema del gran número de reglas y lógicas de selección está ciertamente ahí. Los objetivos son los mismos en ambos enfoques.

Y que el camino está completamente equivocado, pues estamos revisando las normas y corrigiendo el camino))))

 

Tengo alguna otra abstracción de MO que debería encontrar con precisión los patrones reales (si los hay), pero no es seguro

No he podido encontrar ninguna referencia masónica o pentagónica en google, así que lo mantengo en secreto por ahora

Se me ocurrió la abstracción cuando estaba cogiendo semillas de girasol.
 
Maxim Dmitrievsky:

Tengo alguna otra abstracción de MO que debería encontrar con precisión los patrones reales (si los hay), pero no es seguro

No he podido encontrar ninguna referencia masónica o pentagónica en google, así que lo mantengo en secreto por ahora.

abstracción inventada mientras se rompen las semillas de girasol

Parece que se me ha olvidado: los verdaderos patrones de SB (si es que los hay) ))))

 
Maxim Dmitrievsky:

Creo que Alexei sugirió la potencia de cálculo, le gusta hacer cálculos largos, tal vez usted puede hacer una cooperativa :)

Seguirá siendo lento en R sin vectorización. Podrías utilizar alguna base de datos rápida

Además, llevo años aplicando este enfoque.

Sin embargo, lo he pospuesto un poco ahora, ya que es realmente muy lento, lo que hace imposible cambiar el objetivo rápidamente (buscando uno bueno), y las reglas individuales también dejan de funcionar, no importa cómo las revises en el historial.

Maxim, ¿puedes ayudar, hacer un script en python que haga un ciclo para crear un modelo (o 100 modelos) desde un archivo CSV, luego analizarlo(s) sobre la validez de los predictores con las herramientas estándar de CatBoost, luego prohibir/permitir el uso de los predictores (CatBoost puede hacerlo) en ciertas condiciones y crear un nuevo modelo de nuevo. Este método permitirá asignar predictores importantes que conducirán a la mejora del modelo. Estoy utilizando un método similar, pero es realmente incómodo para mí, ya que después de añadir/quitar predictores tengo que reiniciar manualmente el bucle.