Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2109
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
seleccione todos los archivos y descárguelos, serán comprimidos
diferentes longitudes de muestra, entonces si una parte
¡Gracias, es cierto - se puede descargar como un archivo, lo que es agradable!
Pero diferentes longitudes de muestreo es malo, yo estaba pensando en la selección de las columnas más al azar donde las pequeñas desviaciones son aceptables.
Creo que no es necesario aplicar este método a la muestra - de lo contrario, ¿cómo puedo usarlo en la vida real.
Lo estoy ejecutando para el entrenamiento, vamos a ver qué pasa.
Gracias, es cierto, se puede descargar un archivo, lo que está bien.
Pero las diferentes longitudes de las muestras son malas, he pensado en destacar las columnas más aleatorias, donde las pequeñas desviaciones son aceptables.
Creo que no es necesario aplicar este método a la muestra - de lo contrario, ¿cómo puedo usarlo en la vida real.
Lo estoy ejecutando para el entrenamiento, vamos a ver qué pasa.
No lo necesito para los exámenes, pero puede ser útil.
Demasiado perezoso para convertirlo)
Déjeme explicarle:
1) ordenamos la columna
2) contamos el número medio de elementos en un cuanto, por ejemplo 10000 elementos / 255 cuantos = 39,21
3) en el bucle nos movemos por 39,21 elementos en cada paso y añadimos el valor del array ordenado al array de valores del cuanto. Es decir, el valor de la matriz 0 = valor 0 quantum, el valor 39 = 1 quantum, el valor 78 = 2 quantum, etc.
Si el valor ya está en el array, es decir, si entramos en una zona con muchos duplicados, nos saltamos el duplicado y no lo añadimos.
En cada paso, sumamos exactamente 39,21, y luego redondeamos la suma para seleccionar un elemento de la matriz, para que sea igual. Es decir, en lugar de 195 (39*5 = 195) toma 196 ( 39,21 * 5 = (int) 196,05).
Con la distribución uniforme está claro - crearía un array de valores únicos y lo usaría para cortar.
Pero hay otros métodos para dividir la red:
Con la distribución uniforme veo - primero crearía un array de valores únicos y lo usaría para cortar.
Pero hay otros métodos para dividir la red:
Debe haber muchas muestras, de lo contrario el modelo no aprenderá nada
debe haber muchas muestras, de lo contrario el modelo no aprenderá nada
Estos son los métodos de cuantificación de muestreo para CatBoost - estos son los límites por los que la enumeración/aprendizaje continúa.
Mis experimentos muestran que la rejilla debe ser elegida para cada predictor por separado, entonces se observa un aumento de la calidad, pero no es capaz de hacerlo CatBoost y no soy capaz de construir una rejilla y tengo que construir rejillas y subirlas a csv, y luego iterarlas con el fin de estimar el comportamiento de los objetivos en ellas. Creo que es una herramienta muy prometedora, pero necesito traducir el código a MQL.
Estos son los métodos de cuantificación de muestreo para CatBoost - estos son los límites por los que la enumeración/aprendizaje procede.
Mis experimentos muestran que la rejilla debe ser elegida para cada predictor por separado, entonces se observa una ganancia de calidad, pero CatBoost no puede hacerlo y no puedo construir una rejilla y tengo que construir rejillas y subirlas a csv y luego iterar a través de ellas para evaluar el comportamiento del objetivo en ellas. Creo que es una función muy prometedora, pero tengo que traducir el código a MQL.
¿está en los ajustes del propio modelo (parámetros)? no sé lo que es
si no está en la configuración, entonces es una mierda.
¿Está en la configuración del propio modelo (parámetros)? No sé lo que es
Si no está en la configuración, es una mierda.
Está en la configuración, al menos para la línea de comandos
--feature-border-type
El modo decuantificación de las características numéricas.
Está en la configuración, al menos para la línea de comandos
--feature-border-type
El modo decuantificación de las características numéricas.
¿Hace una gran diferencia? Debería estar dentro de un porcentaje
Con la distribución uniforme entiendo - primero crearía un array de valores únicos y lo usaría para cortar.
Pero hay otros métodos para dividir la red:
y ¿hace una gran diferencia? Debería estar dentro de un porcentaje
La elección del desglose correcto tiene un impacto significativo en el resultado.
Aquí hay un ejemplo en Recall - hasta un 50% de variación - para mí eso es significativo.
Aumentando los límites de 16 a 512 en incrementos de 16 -aunque no en orden en el histograma- mis títulos son un poco un estorbo.
Todavía estoy experimentando con la selección de mallas, pero ya es obvio que hay diferentes predictores para los que se necesitan diferentes mallas, para observar la lógica, y no sólo para ajustar.