Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 610

 
Vladimir Perervenko:
Dentro de la función darch() está el parámetro seed = NULL por defecto. Ponlo en algún estado, por ejemplo seed = 12345.

Este es un pequeño valor de learnRate. Comienza con learnRate = 0.7, numEpochs = 10 para RBM y NN. Pero estos son datos del techo. Hay que optimizar para un conjunto de datos específico.

Buena suerte

Si quieres hacer un conjunto, será mejor que elimines set.seed(), ¿no? Para que las rejillas sean diferentes. O set.seed(N grid) - para la reproducibilidad de todo el conjunto.
 
elibrarius:
Y si uno quiere hacer un conjunto, entonces es mejor quitar set.seed(), ¿no? Para que las rejillas sean diferentes. O set.seed(N mesh) - para la reproducibilidad de todo el conjunto.

Sí, así es. Un conjunto de modelos tan complejos (me refiero a darch) no puede contener más de 3-5 piezas. Y deben ser muy diferentes. Es decir, deben tener diferentes valores de parámetros (número de capas, neuronas, funciones de activación, etc.), o (muchas otras variantes que no describiré ahora). La variante del conjunto de la misma estructura entrenada con diferente inicialización puede ser posible, pero es débil. Al menos haz que el tipo de inicialización sea diferente.

Buena suerte

 
Vladimir Perervenko:

Sí, así es. Un conjunto de modelos tan complejos (me refiero a darch) no puede contener más de 3-5 piezas. Y deben ser muy diferentes. Es decir, deben tener diferentes valores de parámetros (número de capas, neuronas, funciones de activación, etc.), o (muchas otras variantes que no describiré ahora). La variante del conjunto de la misma estructura entrenada con diferente inicialización puede ser posible, pero es débil. Al menos haz que el tipo de inicialización sea diferente.

Buena suerte

Si compite con el procesador en un conjunto de entrenamientos sobre los mismos datos para definir la mejor estructura, será mejor que coloque los resultados en el conjunto. Si desea utilizar la opción más simple - malla con intervalo de neuronas de 5 o porcentaje (con este intervalo los modelos serán muy buenos), entonces tome 3-5 o 10 mejores resultados y utilícelos para promediar. Los modelos se construirán y calcularán de todos modos, así que ¿por qué deberíamos desperdiciar nuestros esfuerzos? ))

 
elibrarius:

Si tenemos que pasar la CPU por muchos entrenamientos con los mismos datos para determinar la mejor estructura, es mejor poner los resultados en un conjunto. Si asumimos la opción más simple - rejilla con espaciamiento de neuronas de 5 o porcentaje (con tal espaciamiento también los modelos serán bien diferentes), entonces tome 3-5 o 10 mejores resultados y úselos para promediar. Los modelos se construirán y calcularán de todos modos, así que ¿por qué deberíamos desperdiciar nuestros esfuerzos? ))


¿cómo te va en general con estos modelos? ¿merece la pena subirse a ellos? :) se discute pero nadie habla de los resultados

Tal vez algunos bancos comparados con perseptrone o gbm. Para el mercado de divisas, por supuesto.

 
Maxim Dmitrievsky:

:) porque hay una discusión pero nadie anuncia los resultados.

Si se considera un gráfico de beneficios como resultado, no habrá ningún resultado. Y la mayoría de la gente, incluso en este hilo, no necesita nada más que un gráfico de beneficios. La única prueba es que simplemente no entendemos a los demás.
 
Maxim Dmitrievsky:

¿cómo te va en general con estos modelos? ¿merece la pena subirse a ellos? :) la discusión está en curso pero nadie da voz a los resultados

Tengo, como la mayoría de la gente, un error al borde del 50%. Pero al menos cuenta diez veces más rápido que Alglib. Si aquí se tarda entre 40 y 100 minutos en calcular el modelo, en Alglib estuve esperando más de veinticuatro horas por la misma estructura, no esperé y desactivé el cálculo.
Pero si ahora tengo que recoger modelos en el ciclo, me llevará mucho tiempo de nuevo.... También tengo que programarlo todo.
En general, esto es mucho tiempo, ya que no se pone límites de tiempo en el modus operandi.

Interesante - así que cavo)

 
Yuriy Asaulenko:
Si se considera un gráfico de beneficios como resultado, no habrá resultados. Y la mayoría de la gente, incluso en este hilo, no necesita nada más que el gráfico de beneficios. La única prueba es que simplemente no entendemos a los demás.

No es que te hayas involucrado en el interior del país.

 
elibrarius:
En el sitio de prueba, como en la mayoría, el error está al borde del 50%. Pero al menos cuenta docenas de veces más rápido que Alglib. Si aquí durante 40-100 minutos para calcular el modelo, el Alglib-e más de un día de espera para la misma estructura, no esperó y desactivar el cálculo.
Pero si ahora tengo que recoger modelos en el ciclo, me llevará mucho tiempo de nuevo.... También hay que programarlo todo.

Quiero decir, la elección de los rasgos sigue siendo el principal problema :) pero al menos es más rápido de aprender, eso es bueno

 
Maxim Dmitrievsky:

es decir, la elección de los atributos sigue siendo el principal problema :)

y las características y estructura del modelo resultan ser demasiado

 
Vladimir Perervenko:

1. ¿De qué optimización habla? ¿Qué meseta? ¿Qué modelo? Si se trata de una red neuronal, sería extraño no entrenar (optimizar los parámetros) la DNN antes de utilizarla.

2. ¿Qué parámetros del modelo (?) deben ser estables?

No entiendo sus pensamientos.

Me refería a la optimización de los hiperparámetros del DNN que debe hacerse necesariamente y no en el probador.

¿De qué estás hablando?

La eficacia del modelo comocriterio de optimización de todo lo demás.

¿Qué tipo de meseta?

La meseta de la eficiencia.

¿Qué modelo?

Cualquier modelo.

Si se trata de una red neuronal, sería extraño no entrenar (optimizar los parámetros) la DNN antes de utilizarla.

Y esta es la cuestión principal, que una vez te pregunté: cómo los resultados del entrenamiento (optimización de los parámetros) dependen de la no estacionariedad de los predictores de entrada. Su respuesta fue: no lo hace. No me queda claro, ya que los NS deben ser constantemente reentrenados, por lo que reaccionan a la no estacionariedad, por lo que los parámetros del modelo son variables aleatorias, por lo que hay un problema de estacionariedad de los parámetros. Así que esta es la imagen completa de todo lo que se discute en GARCH pero que por alguna razón no se discute en la clasificación.

Типы оптимизации - Алгоритмический трейдинг, торговые роботы - MetaTrader 5
Типы оптимизации - Алгоритмический трейдинг, торговые роботы - MetaTrader 5
  • www.metatrader5.com
В данном режиме происходит полный перебор всех возможных комбинаций значений входных переменных, выбранных для оптимизации на соответствующей вкладке. Быстрая (генетический алгоритм) В основу данного типа оптимизации заложен генетический алгоритм подбора наилучших значений входных параметров. Данный тип оптимизации значительно быстрее полного...