Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3142

 
СанСаныч Фоменко #:

Para un profesor nuevo, no.

Intento resolver el problema del engrosamiento de los valores predictores. Me parece que puede producirse un error de clasificación si el valor del predictor es ligeramente diferente del valor con el que se entrenó el modelo. Una vez intenté convertir todos los predictores en forma nominal con el mismo maestro, pero no dio ningún resultado. Sin embargo, el número de valores de las variables nominales era uno. ¿Tal vez necesitemos varios cientos? Estoy trabajando, pero hay muchas otras cuestiones interesantes en el camino.

"

Un modelo ideal debería tener un sesgo y una varianza bajos. Sin embargo, en la realidad existe un "compromiso" entre sesgo y varianza. Aumentar la complejidad del modelo (por ejemplo, añadiendo más parámetros) puede reducir el sesgo pero aumentar la varianza. A la inversa, simplificar el modelo puede reducir la varianza pero aumentar el sesgo.


"

Hipotéticamente, se puede doblar el cigüeñal hasta un nivel satisfactorio y afilar las holguras, pero eso no llegará muy lejos porque ya no es "por diseño".
 
Maxim Dmitrievsky #:

"

Un modelo ideal debería tener un sesgo y una varianza bajos. Sin embargo, en la realidad existe un "compromiso" entre sesgo y varianza. Aumentar la complejidad del modelo (por ejemplo, añadiendo más parámetros) puede reducir el sesgo pero aumentar la varianza. A la inversa, simplificar el modelo puede reducir la varianza pero aumentar el sesgo.


"

Hipotéticamente, se puede doblar el cigüeñal hasta un nivel satisfactorio y afilar las holguras, pero eso no llegará muy lejos porque ya no es "por diseño".

Por alguna razón, a menudo se olvida el tercer componente: el error irrecuperable. Si es lo suficientemente grande (y me parece que tenemos muchos por la proximidad de los precios a SB), puede ser más importante que los dos primeros.

En cualquier caso, se trata de cosas muy importantes que se pueden resumir en una pregunta: ¿Cuál es la máxima información que se puede extraer de la muestra de precios (y otros datos disponibles) que tenemos?

 
Aleksey Nikolayev #:

Por alguna razón, la gente suele olvidarse del tercer componente: el error irrecuperable. Si es lo suficientemente grande (y me parece que en nuestro país no es insignificante debido a la proximidad de los precios a la SB), puede ser más importante que los dos primeros.

En cualquier caso, se trata de cosas muy importantes que se pueden resumir en una pregunta: ¿Cuál es la máxima información que se puede extraer de la muestra de precios (y otros datos disponibles) de que disponemos?

así que no deberíamos intentar predecir todos los casos, sino extraer los que se predicen a través de mo

esto se denomina "efecto de trituración heterogénea", que puede compararse no con doblar un cigüeñal, sino con encontrar piezas que funcionen y descartar las que no.

entonces los atributos de X pasan a ser contextuales y no son "predictores" de Y en el sentido clásico. Por eso en kozul se denominan "covariables".

El resultado responderá a su pregunta (dependiendo de en qué se mida) sobre el máximo de información. Normalmente se mide en ATE o CATE.


 
Aleksey Nikolayev #:

Una pregunta: ¿cuál es la cantidad máxima de información que se puede extraer de la muestra de precios disponible (y de otros datos disponibles)?

Creo que hay que plantear bien la tarea.

Definir la información

Definir la "información máxima" (al menos para saber cuándo parar).

Comprender que cada objetivo tendrá un conjunto diferente, por lo que necesitamos declarar el objetivo.


Pero es una pregunta interesante, me gusta.
 
Aleksey Nikolayev #:

Por alguna razón, la gente suele olvidarse del tercer componente: el error irrecuperable. Si es lo suficientemente grande (y me parece que en nuestro país no es insignificante debido a la proximidad de los precios a la SB), puede ser más importante que los dos primeros.

En cualquier caso, se trata de cosas muy importantes que se pueden resumir en una pregunta: ¿Cuál es la máxima información que se puede extraer de la muestra de precios (y otros datos disponibles) de que disponemos?

Esa es una cuestión de investigación disertable, no de construir un robot que acribille pasta.

No necesitamos un máximo de información, sino un mínimo suficiente. Por lo tanto, podemos limitarnos a lo siguiente:

1. Crear un modelo que dé un error de clasificación inferior al 20% en la fase de clasificación. Y debe entenderse que el "modelo" incluye el preprocesamiento completo de los predictores, así como las herramientas para la evaluación del modelo.

2. 2. Inserte el modelo en un Asesor Experto que ofrezca al menos la misma proporción de operaciones perdedoras/rentables. Si el factor de beneficio es superior a 4, queda un paso más por dar.

3. Asegúrese de que en el OOS nada ha cambiado, y entender las razones de tal estabilidad en el OOS, que se encuentra en el preprocesamiento, no en el modelo.

Y qué errores se metieron en el 20% - ¿es interesante?

 

¿No sería más fácil clasificar los errores?

cuantos más errores encontremos, mejor quedará el modelo. no maximización de la información, sino cualitativa (perdón por el juego de palabras).

 
mytarmailS #:
Creo que Snalo tiene que definir bien la tarea.

Definir la información

Definir la "información máxima" (al menos para saber cuándo parar).

Comprender que cada objetivo tendrá un conjunto diferente, por lo que necesitamos declarar el objetivo.


Pero es una pregunta interesante, me gusta.

En mi opinión, la opción de Maxim arriba es muy buena. Como bien señaló San Sanych, lo importante no es la información en sí, sino cómo ayuda a multiplicar el depósito).

Si para simplificar consideramos una estrategia comercial como un tritente e Y como un beneficio, entonces la definición (TS maximizando la expectativa de beneficio) se vuelve bastante banal.

 
СанСаныч Фоменко #:

Se trata de una investigación disertable, no de crear un robot que acribille masa.

No necesitamos la máxima información, sino un mínimo suficiente. Así que podemos limitarnos a lo siguiente:

1. Crear un modelo que dé un error de clasificación inferior al 20% en la fase de clasificación. Y debe entenderse que el "modelo" incluye el preprocesamiento completo de los predictores, así como las herramientas para la evaluación del modelo.

2. 2. Inserte el modelo en un Asesor Experto que ofrezca al menos la misma proporción de operaciones perdedoras/rentables. Si el factor de beneficio es superior a 4, queda un paso más por dar.

3. Verifique en el OOS que nada ha cambiado, y comprenda las razones de tal estabilidad en el OOS, que reside en el preprocesamiento, no en el modelo.

Y qué errores se metieron en el 20% - ¿es interesante?

Uno no interfiere con el otro de ninguna manera. Obviamente, el máximo no sólo es inalcanzable, sino incluso imposible de calcular, pero podemos intentar estimarlo de alguna manera y compararlo al menos aproximadamente con la dispersión, por ejemplo. Me refiero a una variante del máximo como la propuesta por Maxim.

 
Aleksey Nikolayev #:

Uno no interfiere con el otro en modo alguno. Obviamente, el máximo no sólo es inalcanzable, sino incluso imposible de calcular. Pero podemos intentar estimarlo de algún modo y, al menos, compararlo aproximadamente con la dispersión, por ejemplo. Me refiero a una variante del máximo como la propuesta por Maxim.

La información está en la cabeza de una persona, pero no hay información fuera de la cabeza.

Cada persona tiene diferentes cabezas: alguien ve tendencias en una cotización, que, por cierto, hay muchas diferentes, y alguien ve incrementos. Y personas diferentes ven muchas otras cosas en la cotización inicial.

Si es por tendencias, ¿entonces el volante es más informativo que la ZZ, porque se apoya en el borde derecho, mientras que la ZZ no?

Completamente vaga declaración del problema, que es innecesario. Así que tal vez no hay tal problema?

 
СанСаныч Фоменко #:

La información está en la cabeza de una persona, y no hay información fuera de la cabeza.

Pues bien, no es exactamente así, o incluso no lo es en absoluto) La información, como concepto mensurable, suele estudiarse en el contexto de su transmisión de un lugar a otro) Y si algunos lugares no la reciben, no es problema de la información, sino de su posible receptor).