Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 496

 
Dr. Trader:

¿Puede el bosque extrapolarse? Sí.
¿Lo hace bien? No.


¿Qué es bueno y qué es malo?

¿Tiene un análisis comparativo de los diferentes modelos? ¿Y desde el principio: con la idoneidad de unos predictores concretos para un objetivo concreto, con la idoneidad de un conjunto concreto de predictores para un modelo concreto, y luego la evaluación con una ejecución obligatoria en un archivo fuera de los archivos de entrenamiento? Con la justificación de que los modelos no están sobreentrenados.


Con todo esto será posible juzgar lo que es bueno y lo que es malo para un determinado conjunto de predictores y objetivo. Al mismo tiempo, debe entenderse que lo más probable es que haya un conjunto diferente de predictores y objetivos que den un resultado diferente.


En mi caso particular, hice ese trabajo. He publicado el resultado varias veces en este hilo. Orden de los modelos, en orden descendente: ada, rf, SVM. Lo peor es NS, pero es alguna versión antigua, no he usado las modernas. Todo esto está sujeto a las condiciones anteriores.

 
Dr. Trader:

Aquí hay un ejemplo interesante, lo publiqué en este hilo hace tiempo.
La extrapolación en este caso sería predecir fuera de la "nube de puntos conocidos"

Si los puntos conocidos están bien agrupados, podemos ver que la extrapolación no es un problema para la mayoría de los modelos.
Pero si los puntos conocidos estuvieran dispuestos de forma más aleatoria, sin agrupaciones evidentes, la predicción en sí sería peor y la extrapolación no sería creíble.

Todo es cuestión de predictores, si pones basura en el modelo no puedes extrapolar bien.
Y nunca operaría con datos financieros utilizando la extrapolación.


la extrapolación es una predicción sobre puntos desconocidos, si los puntos están fuera de los máximos y mínimos de la muestra de entrenamiento, entonces RF siempre emitirá los máximos y mínimos de la muestra entrenada

¿se confunde con la aproximación mb?

 
Dr. Trader:

Aquí hay un ejemplo interesante, lo publiqué en este hilo hace tiempo.
La extrapolación sería predecir fuera de la "nube de puntos conocidos".

Si los puntos conocidos están bien agrupados, podemos ver que la extrapolación no es un problema para la mayoría de los modelos.
Pero si los puntos conocidos estuvieran dispuestos de forma más aleatoria, sin agrupaciones evidentes, la predicción en sí sería peor y la extrapolación no sería creíble.

Todo es cuestión de predictores, si pones basura en el modelo no puedes extrapolar bien.
Y nunca operaría con datos financieros utilizando la extrapolación.


La cuestión de la confianza en las estadísticas en general es filosófica.

Esta es la clasificación.

¿Se aplica la propia noción de extrapolación? Para mí, no. La clasificación encuentra patrones y, a continuación, intenta distribuir los nuevos datos de acuerdo con estos patrones.


Extrapolación en modelos analíticos que tienen alguna función en forma analítica.


¿Y ARIMA? ¿Hay extrapolación en ello? Depende de qué. La propia maqueta se lleva los últimos compases, normalmente uno. Pero la selección de parámetros requiere miles de barras. Este millar es extrapolado y el que estaba en el último cálculo no lo es.


No creo que la extrapolación en su sentido matemático sea aplicable a los mercados financieros.

 
SanSanych Fomenko:

La cuestión de la confianza en las estadísticas en general es filosófica.

Esta es la clasificación.

¿Se aplica la propia noción de extrapolación? Para mí, no. La clasificación encuentra patrones y, a continuación, intenta distribuir los nuevos datos de acuerdo con estos patrones.


Extrapolación en modelos analíticos que tienen alguna función en forma analítica.


¿Y ARIMA? ¿Hay extrapolación en ello? Depende de qué. La propia maqueta se lleva los últimos compases, normalmente uno. Pero la selección de parámetros requiere miles de barras. Este millar es extrapolado y el que estaba en el último cálculo no lo es.


No creo que la extrapolación en su sentido matemático sea aplicable a los mercados financieros.


La extrapolación en MO es la capacidad de un modelo para trabajar con nuevos datos, y es un tipo especial de aproximación. Sobre una muestra de entrenamiento su modelo APROXIMA, sobre nuevos datos que no están en la muestra de entrenamiento EXTRAPOLIZA.

por eso puse un ejemplo con la regresión lineal comparada con XGboost, que no leíste con atención, la regresión lineal extrapola perfectamente, mientras que todo lo que implique árboles de decisión NO PUEDE extrapolar debido a la estructura de los árboles de decisión

 

Laregresión lineal en general existe y, en particular, extrapola SÓLO sobre series estacionarias con residuos del modelo distribuidos normalmente. Hay un gran número de limitaciones en su aplicación que hacen que este tipo de modelo sea inútil para las series financieras.

O uno se mete en la APLICABILIDAD de los modelos a sus datos concretos, entonces es modelización, en todos los demás casos es un juego de números.

Un gran número de mensajes en este hilo son juegos de números, ya que no se dan pruebas para demostrar lo contrario.

 
SanSanych Fomenko:

Laregresión lineal en general existe y, en particular, extrapola SÓLO sobre series estacionarias con residuos del modelo distribuidos normalmente. Hay un gran número de limitaciones en su aplicación que hacen que este tipo de modelo sea inútil para las series financieras.

O uno se mete en la APLICABILIDAD de los modelos a sus datos específicos, entonces es modelización, en todos los demás casos es un juego de números.

Un gran número de mensajes en este hilo es un juego de números, ya que no se da ninguna prueba que demuestre lo contrario.


¿qué tiene que ver la regresión lineal con esto? la pregunta era cómo usar el andamiaje correctamente para evitar cometer errores estúpidos, como pensar que pueden EXTRAPOLEAR.

Se alimenta a los bosques de una serie temporal en forma de cotizaciones, y el modelo predecirá sólo el valor máximo y mínimo de la serie estudiada, si se sale del rango

 
Aliosha:

Qué lío, señores...

un poco de información de KO:


En los mercados financieros, la extrapolación/interpolación es aplicable y muy demandada.


Si es "aplicable y demandado", ¿por qué no ha hecho un TS con éxito en todos estos años?

P.D. Oigo ladrar a un gato... Cierto, ¡creo que Aliosha ha vuelto a escribir algo!

 
Aliosha:

Qué lío, señores...

un poco de información de KO:

La extrapolación y la interpolación en el contexto de la MO son lo mismo. En ambos casos necesitas obtenerel valor(int,float[]) de un punto que NO es el mismo que el del conjunto de datos de entrenamiento. Las reservas sobre la ubicación del punto en el hiperespacio, con respecto a la nube de puntos de entrenamiento, es IMPOSIBLE, ya que todo depende de las características, la estructura del espacio de características, en una proyección será un punto "fuera" de la nube de entrenamiento, en otra "dentro" no es importante, sólo tiene sentido LO QUE NO ESTÁ EN ENTRENAMIENTO, punto.

Resumiendo: Si el punto no está en el conjunto de datos de entrenamiento, el resultado de su clasificación o regresión, será tanto extrapolación como interpolación, dependiendo de la interpretación final del resultado por parte del área temática, pero para el algoritmo MO, SON UNO Y UNO.

El bosque se extrapola - ¡genial! En las manos adecuadas, mejor y órdenes de magnitud más rápidas que el NS.

En los mercados financieros, la extrapolación/interpolación es aplicable y muy demandada.


Un consejo aparte para Maxim: una persona inteligente se equivoca más a menudo que un tonto, porque hace muchas más pruebas, pero sólo el tonto está emocionalmente apegado a su punto de vista y le es difícil desprenderse de él. Tú eliges quién eres)))


ok, dame un ejemplo de al menos 1 artículo con un ejemplo que muestre lo bien que extrapola el andamiaje. No pude encontrar ninguno.

Eso, en mi opinión, no es bueno.

y cómo vas a saber cuándo el punto está dentro y cuándo está fuera de la nube, cuando tienes un montón de características diferentes, y cómo es eso importante cuando el rango de valores del objetivo en el entrenamiento, cuando todos los árboles están construidos entonces el objetivo NUNCA puede salir de este rango


 
Maxim Dmitrievsky:

la regresión lineal es excelente en la extrapolación, mientras que cualquier cosa con árboles de decisión NO PUEDE extrapolar

La extrapolación consiste en predecir nuevos datos más allá de los valores del predictor conocidos durante el entrenamiento.

Aquí hay un trozo de una imagen antigua, todo lo sombreado en verde es extrapolación, y la imagen muestra que el bosque puede hacerlo, de lo contrario estaría coloreado en blanco (como en el caso de algunos modelos SVM)


Tanto el bosque como la red neuronal y el modelo lineal pueden extrapolar. Si quieres predecir lejos de los valores conocidos, entonces todos estos modelos darán una predicción y todos tienen algún tipo de algoritmo para esos casos.

Pero, ¿por qué crees que si un modelo lineal extrapola usando la fórmula y=ax+b lo hará perfectamente pero si el bosque lo hace usando el vecino más cercano conocido no sirve? Ambos algoritmos tienen derecho a existir. Como dijo SanSanych - para cada conjunto de predictores y objetivos para llevar a cabo la investigación y comparar los modelos, sólo entonces se puede decir si el modelo hace la extrapolación perfectamente.
Lo que está escrito en los artículos sobre el hubra - también se aplica a los predictores y objetivos específicos, no es la verdad que funciona para todos los casos, es un estudio específico para un caso particular.

 
Dr. Trader:

La extrapolación implica la predicción de nuevos datos más allá de los valores del predictor conocidos durante el entrenamiento.

Aquí hay un trozo de una imagen antigua, todo lo sombreado en verde es extrapolación, y a juzgar por la imagen el bosque puede hacerlo, de lo contrario todo estaría coloreado en blanco (como en el caso de algunos modelos SVM)


Tanto el bosque como la red neuronal y el modelo lineal pueden extrapolar. Si das datos alejados de los valores conocidos para una predicción, todos estos modelos darán una predicción, todos tienen algunos algoritmos para esos casos.

Pero, ¿por qué crees que si un modelo lineal extrapola usando la fórmula y=ax+b entonces lo hace perfectamente, pero si el bosque lo hace usando el vecino conocido más cercano entonces no puede hacer nada? Ambos algoritmos tienen derecho a existir. Como dijo SanSanych - para cada conjunto de predictores y objetivos para investigar y comparar los modelos, sólo entonces se puede decir si el modelo hace la extrapolación perfectamente.
Lo que se escribe en los artículos sobre hubra - también se aplica a los predictores y objetivos específicos, no es una verdad que funciona para todos los casos, es un caso de estudio específico.


Sólo hay que hacer un estudio del árbol.