Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 2040

 
Aleksey Vyazmikin:

Hay algo ahí, no sé qué es.

Día de la semana, día del mes, hora, minuto, ...igual para la salida..., duración de la operación en minutos, SL, TP, resultado +-1

2 6 0 4 2 6 57 57 100 100 -1
4 2 6 0 4 2 6 57 57 100 200 -1
4 2 6 0 4 2 6 57 57 100 300 -1
4 2 6 0 4 2 6 57 57 100 400 -1
4 2 6 0 4 2 6 57 57 100 500 -1
4 2 6 0 4 2 6 57 57 100 600 -1
4 2 6 0 4 2 6 57 57 100 700 -1
4 2 6 0 4 2 6 57 57 100 800 -1
4 2 6 0 4 2 6 57 57 100 900 -1
4 2 6 0 4 2 6 57 57 100 1000 -1
4 2 6 0 4 2 6 57 57 100 1100 -1
4 2 6 0 4 2 6 57 57 100 1200 -1
4 2 6 0 4 2 6 57 57 100 1300 -1
4 2 6 0 4 2 6 57 57 100 1400 -1
4 2 6 0 4 2 6 57 57 100 1500 -1
4 2 6 0 4 2 6 57 57 100 1600 -1
4 2 6 0 4 2 6 57 57 100 1700 -1
4 2 6 0 4 2 6 57 57 100 1800 -1
4 2 6 0 4 2 6 57 57 100 1900 -1
4 2 6 0 4 2 6 57 57 100 2000 -1
4 2 6 0 4 2 6 57 57 100 2100 -1
4 2 6 0 4 2 6 57 57 100 2200 -1
4 2 6 0 4 2 6 57 57 100 2300 -1
4 2 6 0 4 2 6 57 57 100 2400 -1
4 2 6 0 4 2 6 57 57 100 2500 -1

Tengo 8 GB de memoria.

Según he entendido por sus resultados, la información de entrada no se tiene en cuenta en absoluto. Es extraño, porque toda una clase de sistemas se basa en la hora de entrada.

Entonces, ¿el 50% se toma a partir del día de cierre de la transacción?
 
Rorschach:

Día de la semana, día del mes, hora, minuto, ...igual para la salida..., duración de la operación en minutos, SL, TP, resultado +-1

Tengo 8 GB de memoria.

Según he entendido por sus resultados, la información de entrada no se tiene en cuenta en absoluto. Es extraño, porque toda una clase de sistemas se basa en la hora de entrada.

No se pueden preparar fichas así. Los rangos de los valores de las columnas deben ser acordes. Para categorizar se hace por van caliente
 
Rorschach:

Día de la semana, día del mes, hora, minuto, ...igual para la salida..., duración de la operación en minutos, SL, TP, resultado +-1

Tengo 8 GB de memoria.

Según he entendido por sus resultados, la información de entrada no se tiene en cuenta en absoluto. Es extraño, ya que toda una clase de sistemas se basa en la hora de entrada.

Entonces, ¿el 50% se toma del día de cierre de la operación?

En realidad, el resultado no es extraño - vemos que hay días en los que la tendencia cambia más a menudo o hay un plano, por lo que el movimiento oscilante no es infinito y en la media termina después de algún valor de puntos, por lo tanto el tiempo de permanencia y TP con SL ha golpeado. Y la entrada por tiempo resultó ser poco importante, ya que no garantiza un movimiento bezapless - es una previsión de futuro - si lo buscáramos - tiempo de entrada para las operaciones rentables, habríamos encontrado la mayor probabilidad. En general, si hubiera más predictores, entonces tal vez la entrada en el momento con alguien sería rentable.

El porcentaje sólo indica la altura del árbol en la que se encuentra la división con el predictor. No me he ocupado de eso. Esta es la descripción a través del traductor:

"

Valores de importancia individuales para cada uno de los objetos de entrada (el método por defecto para calcular la importancia de los objetos para las métricas no clasificatorias).

Para cada objeto, el cambio en los valores de predicción muestra cuánto cambia la predicción en promedio cuando el valor del objeto cambia. Cuanto mayor sea el valor de la importancia, mayor será, por término medio, el cambio en el valor de la predicción si se modifica esa característica.

"

 
Maxim Dmitrievsky:
Así no se preparan las fichas. Los rangos de valores de las columnas deben ser comparables. En el caso de las categóricas, se hace por furgoneta caliente.

¿Por qué considera el tiempo como algo categórico? ¿O de qué características estamos hablando?

 
Aleksey Vyazmikin:

¿Por qué crees que el tiempo es categórico? ¿O de qué signos estamos hablando?

¿Dónde está el tiempo? El día de la semana, el día del mes, la hora del día, el minuto de la hora. El tiempo es un valor continuo y existen categorías ordinales
 
Aleksey Vyazmikin:

Por cierto, ¿has visto un generador de este tipo que saque aleatoriamente un número de una matriz sin repeticiones?

Esto es lo que hago:

1) Creo un array de índices de cadenas con longitud igual al número de cadenas, lo relleno con valores de 0 a N cadenas

2) Barajo esta matriz

RandomizeIdx(int &idx[], int rows) {//ссылка на массив и его длина
        int j = 0, c = 0;
        for (int r = 0; r<rows; r++) {//перебор train участка
                j = RandomInteger(rows);//номер строки с которой поменять 
                c = idx[r]; idx[r] = idx[j]; idx[j] = c;
        }
}

donde RandomInteger() - cualquier variante de

3) luego tomo todos los valores de estos índices en un bucle y los uso desde el array principal para obtener la cadena correcta, resulta ser una cadena pseudo-aleatoria después de mezclar los índices
 

¿Alguien ha intentado clasificar muchas clases, digamos 10k?

¿funciona en absoluto?

 
mytarmailS:

¿Alguien ha intentado clasificar muchas clases, digamos 10k?

¿funciona en absoluto?

Los árboles/los bosques/la lata de la quema. Pero no he probado más de 3, no he tenido esa tarea.
 
elibrarius:
Árboles/bosques/lata de incendios. Pero no he probado más de 3, no he tenido esa tarea.

Los bosques se cuelgan, no hay suficiente RAM

 
mytarmailS:

el andamio se cuelga, no hay suficiente RAM

menos árboles, menos profundidad, quizás suficiente, al menos para probar