Aprendizaje automático en el trading: teoría, práctica, operaciones y más - página 3353

 
СанСаныч Фоменко #:

¡No hay otra forma de pensar! Utilizamos algoritmos de MO listos para usar que van acompañados de un conjunto de funciones adicionales. Todo junto se denomina "paquete".

¿Qué son las"probabilidades de clase reales"? Por ejemplo, la función

devuelve "probabilidades de clase estimadas". El algoritmo no puede contener otras probabilidades que no sean "estimaciones".
La pregunta no es sobre lo que puede. Se trata de cómo obtener probabilidades de clase fiables. De forma que se pueda estar seguro de que con una probabilidad de clase de 0,8, el 80% de los casos se predijeron correctamente. Y usted podría utilizar un umbral, por ejemplo. La salida del clasificador no hace eso en la mayoría de los casos, repito otra vez. O sobreestiman o subestiman "por diseño". Por eso el umbral no funciona. Las probabilidades reales son cuando ni sobrestiman ni subestiman.

Ya has demostrado que no lo sabes. Así que hay más cosas que aprender. Así que "tenemos que dominar todos los MOE" y deshacernos del pensamiento por lotes.
 

Parece que no se trata de la estimación puntual de la probabilidad, sino de su estimación por intervalos. Para matstat, este es un enfoque común - no sólo para obtener una estimación numérica específica de la probabilidad, sino también para obtener un intervalo en el que el verdadero valor de esta probabilidad estimada cae con una precisión dada (probabilidad). Aquí hay cierta dificultad de comprensión, porque el concepto de probabilidad participa de dos hipóstasis diferentes - tanto el valor estimado en sí como la precisión de su estimación. Y se trata de probabilidades bastante diferentes)

Aunque no he estudiado en detalle la previsión conforme, puedo estar equivocado.

 
Maxim Dmitrievsky #:
La cuestión no es qué puede hacer. Se trata de cómo obtener probabilidades de clase fiables. Para que pueda estar seguro de que con una probabilidad de clase de 0,8, el 80% de los casos se predicen correctamente. Y podrías usar un umbral, por ejemplo. La salida del clasificador no es cierta en la mayoría de los casos, repito otra vez. O sobreestiman o subestiman "por diseño". Por eso el umbral no funciona. Las probabilidades reales son cuando ni sobrestiman ni subestiman.

Eso no es lo que tienes. La cifra de 0,8 citada es una de las probabilidades de clase. Aquí tienes un histograma de las probabilidades de clase.


Y yo lo tengo exactamente así y de ninguna otra manera, porque si es de otra manera, significa sobreentrenamiento. Para mí, en un umbral fijo, el desajuste de error de predicción en el OOV y OOS y en el archivo VNE es el principal signo de sobreentrenamiento. El umbral me funciona bien. Y las "probabilidades reales" pertenecen al reino de la ficción que no tiene nada que ver con el código real y la terminología utilizada en este caso.

 
СанСаныч Фоменко #:

Se equivoca. la cifra de 0,8 indicada es uno de los valores de probabilidad de clase. aquí tiene un histograma de las probabilidades de clase.


Lo tengo exactamente así y de ninguna otra manera, porque si es diferente, significa sobreentrenamiento. Para mí, en un umbral fijo, la falta de coincidencia de error de predicción en el OOV y OOS y en el archivo VNE es el principal signo de sobreentrenamiento. El umbral me funciona bien. Y lo de las "probabilidades reales" es una ficción que no tiene nada que ver con el código del mundo real ni con la terminología que se utiliza en él.

¿Cómo te has dado cuenta de que tu umbral funciona perfectamente?
Para ti es fantasía, y para otra persona es algo común.
 
Aleksey Nikolayev #:

Parece que no se trata de la estimación puntual de la probabilidad, sino de su estimación por intervalos. Para matstat, este es un enfoque común - no sólo para obtener una estimación numérica específica de la probabilidad, sino también para obtener un intervalo en el que el verdadero valor de esta probabilidad estimada cae con una precisión dada (probabilidad). Aquí hay cierta dificultad de comprensión, porque el concepto de probabilidad participa de dos hipóstasis diferentes - tanto el valor estimado en sí como la precisión de su estimación. Y se trata de probabilidades muy diferentes)

Aunque no he profundizado en la previsión conforme y puedo estar equivocado.

Estamos hablando de un enfoque ligeramente diferente, antes de que alguien lo buscara en Google :)
 
Maxim Dmitrievsky #:
¿Cómo te diste cuenta de que tu umbral funcionaba perfectamente?
Para ti es fantástico y para algunos es habitual.
Error de predicción de coincidencia en el OOV y OOS y en el archivo INE
 
СанСаныч Фоменко #:
Error de predicción de coincidencia en los ficheros ALE y OOS y en el fichero SNE
¿Cómo se ha dado cuenta de que el clasificador da las probabilidades correctas? No sólo los valores del intervalo. ¿Está leyendo lo que se le escribe?

Si fijas un umbral de 0,8, ¿el 80% de las operaciones serán rentables? ¿Y si es 0,51?

Es casi seguro que no. Compruébalo.
 
Maxim Dmitrievsky #:
¿Cómo te diste cuenta de que el clasificador da las probabilidades correctas? No sólo los valores del intervalo. ¿Estás leyendo lo que te escriben?

Las probabilidades de los modelos vienen dadas por las estadísticas de la muestra de entrenamiento.

En consecuencia, sin una muestra representativa no son precisas, así que supéralo :)

O averiguas en qué consiste el modelo y vuelves a ponderar las hojas según el algoritmo que hayas ideado...

 
Aleksey Vyazmikin #:

Las probabilidades del modelo vienen dadas por las estadísticas de la muestra de entrenamiento.

En consecuencia, sin una muestra representativa no son precisas, así que supéralo :)

O averiguas en qué consiste el modelo y vuelves a ponderar las hojas según el algoritmo que hayas ideado....

Las probabilidades del modelo vienen dadas por la sigmoidea, no por esto. Por simplificar, coges la vía y el eje, da igual lo que haya fuera. E incluso allí, se obtiene un tartamudeo.
 
Maxim Dmitrievsky #:
Las probabilidades del modelo vienen dadas por la sigmoidea, no por esto.

Sí, bueno, ¿qué número pones en la función, de dónde viene?