Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2426

 
mytarmailS:

Ahora la respuesta a la primera pregunta.

Gracias.

Intentaré averiguarlo, pero es difícil conseguirlo de inmediato - la sintaxis del código es bastante diferente a la de C++, sin embargo.

 
elibrarius:

¿No crees que estás ajustando tu modelo a la versión más exitosa de la prueba?

¿En qué momento crees que estoy afinando para probar? El muestreo "prueba" se utiliza para detener la formación, en los proyectos, excepto uno, no existe en absoluto, entonces lo utilicé en la formación final - bien se puede sustituir por un número fijo de árboles - 50/100/300/500/800 y ver el resultado en todas las muestras, entonces usted cree que obtendrá resultados significativamente peores?

 
Aleksey Vyazmikin:

Gracias.

Intentaré averiguarlo, pero es difícil conseguirlo de inmediato, porque la sintaxis del código es bastante diferente a la de C++.

Muchas funciones desconocidas porque el lenguaje es de alto nivel.
Pero lo que tú escribes en 300 líneas en C++ yo lo puedo escribir en 3 líneas)

 
Aleksey Vyazmikin:

¿En qué momento debo hacer la prueba, en su opinión? La muestra "test" se utiliza para detener el entrenamiento, en los Proyectos, excepto uno, no está en absoluto, entonces lo utilicé en el entrenamiento final - bien puedes sustituirlo por un número fijo de árboles - 50/100/300/500/800 y ver el resultado en todas las muestras, entonces ¿supones que el resultado será mucho peor?

Sí, dejar de entrenar también es una prueba de ajuste. No conozco otros detalles de tu sistema, no puedo decir nada más.
En la crosvalidación todos los datos son una prueba y todos ellos son también trenes. Es sólo uno a la vez. Sólo querías aumentar la parcela de la bandeja en un 40%.
 
mytarmailS:
Muchas funciones desconocidas, porque el lenguaje es de alto nivel.
Pero lo que tú escribes en 300 líneas en c++ yo lo puedo escribir en 3 líneas ))

No creo que todas mis perversiones se puedan implementar fácilmente en R :)

 
elibrarius:
Sí, dejar de entrenar también es una prueba de ajuste. No conozco otros detalles de su sistema, no puedo decir nada más

Estoy de acuerdo en que, en teoría, esto aumenta el resultado en la muestra del examen, ¡pero estoy evaluando el resultado en la muestra del examen!

Bueno, creo que he cubierto todos los detalles, si tienes alguna duda, por favor, pregunta.

elibrarius:
En la crosvalidación, todos los datos son una prueba y todos son también una traina. Es sólo uno a la vez. Sólo querías aumentar la parcela de la bandeja en un 40%.

Bueno, ¿cuál es su propósito para usar la crosvalidación? Veo su sentido en cuanto a la búsqueda de hiperparámetros del modelo, ya que mostrará en promedio qué ajustes son los mejores de todos en parcelas aleatorias.

 
Aleksey Vyazmikin:

No creo que se puedan implementar fácilmente todas mis perversiones en R :)

Ahahaha))))

Si yo puedo realizar mis perversiones, las tuyas son como un descanso)

 
Aleksey Vyazmikin:

Bien, ¿cuál es el objetivo de utilizar la revalidación? Veo su propósito hasta ahora como encontrar los hiperparámetros del modelo, ya que mostrará en promedio qué ajustes son los mejores de todos en parcelas aleatorias.

Es exactamente para eso. ¿Hay algo más que necesites? Y un conjunto específico de características. Con diferentes atributos, es probable que los hiperparámetros sean diferentes. Si eliges los que tienen los mejores hiperparámetros, tienes que trabajar con ellos.

Aleksey Vyazmikin:
Bueno, creo que he descrito todos los detalles, si tiene alguna pregunta.

Me da pereza entrar en detalles.

 
mytarmailS:

Ahahaha))))

Si yo puedo poner en práctica mis propias perversiones, las tuyas son como un descanso)

Bueno, aquí estoy, ya que hacer un script para preparar los datos, todavía tengo que hacer un archivo que lista las columnas excluidas, que incluyen:

1. Columnas con predictores correlacionados (por cierto, ¿cómo se elige qué columna descartar, digamos 5 predictores correlacionados?)

2. Columnas descartadas de la primera tabla de archivos, excepto la columna con el objetivo.

Además, la columna con la etiqueta de destino debe escribirse en el archivo, preferiblemente buscada por el nombre de la columna.

La estructura del archivo es

5336    Auxiliary
5337    Auxiliary
5338    Label
5339    Auxiliary
5340    Auxiliary
 
elibrarius:

Es exactamente para eso. ¿Hay algo más que necesites? Y un conjunto específico de características. Con diferentes atributos, es probable que los hiperparámetros sean diferentes. Los que se seleccionan con los mejores hiperparámetros son los que hay que poner a trabajar.

Me da pereza profundizar demasiado.

Necesito seleccionar los predictores adecuados en menos tiempo. Volver a pasar por los predictores es multiplicar por cien el tiempo de procesamiento. Mi método se basa en la lógica de que un buen predictor (incluido uno adecuado para un método de aprendizaje concreto) será exigido por el modelo en todos los intervalos de muestreo, lo que excluye el ajuste a la zona de muestreo.