Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 1383

 
elibrarius:

No aplico la división (P[i] / P[0]), sino la resta (P[i] - P[0]), es decir, no un cambio de precio relativo, sino absoluto. Elimino preliminarmente los valores atípicos (1% en cantidad de los valores mayores y menores).

¿La división da alguna ventaja? Actualmente estoy utilizando un bosque que no requiere normalización ni escalado.

Usted hace el cambio pero no la escala
 
Yuriy Asaulenko:
Está haciendo un cambio, pero no un escalamiento.
Sí. Los árboles/bosques tampoco necesitan ser escalados.


Es decir, no hay mucha ventaja en dividir sobre restar. Excepto en el caso del logaritmo, que hará que los datos se parezcan más a una distribución normal, como dijo Alexey Nikolaev. Es decir, la densidad entre los puntos cambiará, pero no el orden. Pero incluso en este caso no veo ninguna ventaja: el árbol no se dividirá por un nivel, sino por otro, es decir, se ajustará a cualquier distribución. Como el árbol es esencialmente una simple memorización.

 
Tomar el precio como un porcentaje de los últimos 100 precios. ¿Incorrecto?
 
Evgeniy Chumakov:
Tomar el precio como un porcentaje de los últimos 100 precios. ¿Incorrecto?
Esto es similar a la división
 

El gráfico debe estar dividido en niveles, trozos idénticos o no idénticos verticalmente, y cada trozo debe estar nomrrmado en un rango.

El gráfico debe estar dividido en niveles, trozos iguales o quizá no iguales verticalmente, y cada trozo debe estar normalizado a un rango, es decir, análogo a los niveles de precios normales. Si no normalizamos toda la serie o en la ventana deslizante, volveremos a perder información muy importante.

Pero al dividir en niveles nos enfrentamos a otro problema: cuando el precio está en las condiciones límite o si tomamos muchos precios últimos para la formación, algunos de ellos están en un "nivel", los otros están en otro. Todavía no he descubierto cómo hacerlo.

Es posible que tenga que reflejar los niveles en relación con los demás para que las transiciones entre ellos sean indoloras

es natural que el gráfico no convertido siga siendo el más informativo. Por lo tanto, debe tener mucho cuidado con cualquier conversión: la calidad del modelo se degradará en proporción a su ignorancia. De ahí todos los cuentos de que el 50% de error es normal y otras tonterías, el modelo simplemente no aprende nada de esas "características".

 

Es algo complicado, no sé por qué y realmente no sé cómo hacerlo.

Yuri también lo hace bien con los incrementos simples

 

x.append((SD.historia[i-j][c.c]/SD.historia[i][c.c]-1)*1000)

esto no tiene sentido - cada cadena caliente subsiguiente contiene la mitad de la información útil de la anterior, es decir, 1: están fuertemente correlacionadas, 2: la cadena caliente con mayor retardo contiene toda la varianza de la cadena caliente anterior, es decir, no dan ningún incremento de información

el resultado será el siguiente: la importancia del rendimiento con el mayor retraso será la mayor (más varianza, más ganancia de información), y este rendimiento contiene toda la varianza de otras características

 
elibrarius:

A Yuri también le va bien con los incrementos simples.

no puede ser porque nunca puede ser

 
elibrarius:

Algo que te has inventado es complicado, no está claro por qué y no está claro cómo hacerlo.

imagina la situación.

El precio en el mercado refleja el equilibrio de la oferta y la demanda principalmente, en diferentes momentos históricos

Usted se aferra a una sección limitada y normalizada de la historia como característica, reflejando sólo la situación actual

su modelo fusiona diferentes momentos históricos en un flujo normalizado sin rostro (todas las situaciones del mercado se equiparan entre sí), que ya no contiene ninguna secuencia histórica ni un precio justo

Te quedas con un montón de patrones normalizados idénticos, que se superponen al aumentar la profundidad de la historia, lo que lleva a un error de 50/50. No le enseñas nada al modelo y desechas la información más importante ya durante el preprocesamiento, porque lo haces todo de forma incorrecta, es decir, siguiendo libros, diseñados para tareas absolutamente diferentes y que describen procesos completamente distintos.

Un presupuesto no es una señal, es un proceso completamente diferente y no debe ser manejado de esa manera. Yuri es radiofísico, por ejemplo, y por eso no tiene otra cosa que hacer.

En este tipo de formación, se tiene en cuenta el tiempo, pero no el precio. El nivel de precios (por encima/por debajo) en el mercado es aún más importante que el tiempo porque refleja el equilibrio entre la oferta y la demanda, que refleja toda la información básica del mercado.
 
Maxim Dmitrievsky:

imagina la situación.

El precio en el mercado refleja el equilibrio de la oferta y la demanda, sobre todo en diferentes momentos históricos

Te quedas con una parte limitada y normalizada de la historia como característica, reflejando sólo la situación actual

su modelo fusiona diferentes momentos históricos en una corriente impersonal normalizada (todas las situaciones del mercado se equiparan entre sí), que ya no contiene ninguna secuencia histórica ni un precio justo

Te quedas con un montón de patrones normalizados idénticos, que se superponen al aumentar la profundidad de la historia, lo que lleva a un error de 50/50. No le enseñas nada al modelo y desechas la información más importante ya durante el preprocesamiento, porque lo haces todo de forma incorrecta, es decir, siguiendo libros, diseñados para tareas absolutamente diferentes y que describen procesos completamente distintos.

Un presupuesto no es una señal, es un proceso completamente diferente y no debe ser manejado de esa manera. Yuri es radiofísico, por ejemplo, y por eso no tiene otra cosa que hacer.

En este tipo de formación, se tiene en cuenta el tiempo, pero no el precio. El nivel de precios (por encima/por debajo) en el mercado es aún más importante que el tiempo porque refleja el equilibrio entre la oferta y la demanda, que refleja toda la información básica del mercado.

Es una pena que no se pueda dar un "Me gusta".