Una correlación muestral nula no significa necesariamente que no exista una relación lineal - página 42

 

Sí... La palabra mágica "correlación" engaña a mucha gente.

Correlación == dependencia probabilística. Es decir, el autoengaño. Busca una relación lineal.

 
C-4: ¿Qué harán los logaritmos por ti? Los logaritmos sólo pueden utilizarse cuando los puntos inicial y final de una serie son demasiado diferentes en su volatilidad y nivel. Es decir, si se analizan los DowJons de 1900 a 2013, no se puede prescindir de él, pero en otros casos no se puede utilizar.

De nuevo, parece que en este hilo ya se ha hablado de ello.

Piense en la definición de correlación: en palabras sencillas, es la relación de dos conjuntos. Para los conjuntos del espacio lineal esta correlación se puede estimar a través del producto escalar de los vectores (equivalente al QC de Pearson), y por ejemplo es lógico que para los vectores ortogonales dicha correlación sea cero. Para los conjuntos que no pertenecen al espacio lineal, esta relación debe estimarse de forma diferente. ¿Cómo? Ya depende de las características del espacio. Como ejemplos podríamos considerar otros coeficientes de correlación.

Si las lecturas están en una escala relativa, como es el caso de las cotizaciones (que muestran cuántas veces una moneda es "más valiosa" que otra), entonces es incorrecto aplicar métodos lineales (producto escalar) "directamente" a los datos brutos. El logaritmo transfiere las lecturas de una escala relativa a una escala de intervalo, donde ya se puede estimar la misma correlación mediante el CC de Pearson.

 
GaryKa:

De nuevo, parece que en este hilo ya se ha hablado de ello.

Piense en la definición de correlación: en palabras sencillas, es una relación de dos conjuntos. Para los conjuntos del espacio lineal esta correlación se puede estimar a través del producto escalar de los vectores (equivalente al QC de Pearson), y por ejemplo es lógico que para los vectores ortogonales dicha correlación sea cero. Para los conjuntos que no pertenecen al espacio lineal, esta relación debe estimarse de forma diferente. ¿Cómo? Ya depende de las características del espacio. Como ejemplos podríamos considerar otros coeficientes de correlación.

Si las lecturas están en una escala relativa, como es el caso de las cotizaciones (que muestran cuántas veces una moneda es "más valiosa" que otra), entonces es incorrecto aplicar métodos lineales (producto escalar) "directamente" a los datos brutos. El logaritmo transfiere las lecturas de una escala relativa a una escala de intervalo, donde ya se puede estimar la misma correlación mediante el CC de Pearson.


¿Puede dar un ejemplo concreto en el que la toma de logaritmos cambie la lectura del control de calidad de forma clave? Por favor, dame un ejemplo en el que la serie original dé un QC cercano a cero, mientras que sus logaritmos pongan milagrosamente el QC en una estimación significativa.

Hasta aquí, pongamos un ejemplo:

Correlación de Pearson entre los precios del oro y el interés abierto calculado sobre las primeras diferencias sin logaritmo: 0,1968

Correlación de Pearson entre los precios del oro y el interés abierto calculado para ln(Pi/Pi-1): 0,2067

Ahora, por la diferencia del 1% puedes gritar de alegría y decir en cada esquina que no hay manera sin logaritmo.

 
alsu:

El tipo de distribución de la matriz de correlación depende de las propiedades de ambas series y de la relación entre ellas, es decir, no tiene por qué ser la misma para todas las series posibles... Para SB es uno, para algunas erupciones solares otro...
que es una medida del error. Si la distribución es como C-4 ha mostrado, el error es enorme y la probabilidad de obtener una desviación mayor del valor real es casi inexistente. ¿Qué sentido tiene un indicador de este tipo si con independencia real se puede obtener una correlación de -0,6 a +0,6 con igual probabilidad?
 
C-4: ¿Puede dar un ejemplo concreto en el que la toma de los logaritmos cambie la lectura del control de calidad de forma clave? Por favor, dame un ejemplo en el que la serie original dé un QC cercano a cero, mientras que sus logaritmos pongan milagrosamente el QC en una estimación significativa.

Intentaré hacerlo.

C-4: Mientras coges un ejemplo:
  • Correlación de Pearson entre los precios del oro y el interés abierto calculado sobre las primeras diferencias sin logaritmo: 0,1968
  • Correlación de Pearson entre el precio del oro y el interés abierto calculado para ln(Pi/Pi-1): 0,2067

Ahora, por la diferencia del 1% se puede gritar con alegría y decir en cada esquina que sin logaritmo no se puede ir a ninguna parte.

No cuento las primeras diferencias... décimas tampoco )

Sobre los datos de tu ejemplo:

  • La correlación de Pearson en los datos brutos es de 0,767687.
  • La correlación de Pearson en los logaritmos de los datos brutos es de 0,819971.

Parece estar bastante de acuerdo con la observación visual. La diferencia es superior al 5%.

Archivos adjuntos:
 
GaryKa:

Intentaré hacer uno.

No cuento las primeras diferencias... décimas también...)

...

En primer lugar, averigüemos si es correcto utilizar el control de calidad en las series de precios regulares. Hasta ahora he aportado datos que dicen que el control de calidad en I(1) no se puede contar.
 
C-4:
En primer lugar, averigüemos si es correcto utilizar el QR en una serie de precios regular. Hasta ahora he aportado datos diciendo que parece que no se puede calcular el control de calidad en I(1).

¿Dónde ha visto un requisito de normalidad para calcular el control de calidad? Una vez más, es un requisito para utilizar el análisis de correlación.

Qué tontería: el control de calidad es sólo para valores con distribución normal.......... Resulta que no se puede calcular el control de calidad entre, por ejemplo, las cotizaciones del oro y la plata.........

 
Demi:

¿Dónde ha visto un requisito de normalidad para calcular el control de calidad? Una vez más, es un requisito para el uso del análisis de correlación.

Qué tontería: el control de calidad es sólo para valores con distribución normal..........

¿Qué tiene que ver la normalidad con esto? De nuevo, I(1) es la suma consecutiva de una serie de la forma I(0). I(0) son los incrementos normales, o retornos. El tipo de rendimientos no es importante. Lo importante es que el control de calidad sólo puede calcularse sobre las devoluciones, pero no sobre el precio en sí.
 
C-4:
Lo importante es que el control de calidad sólo se puede contar con los rendimientos, no con el precio en sí.

De nuevo, ¿por qué?
 
Demi:
De nuevo, ¿por qué?


Porque sí: 1. ver la imagen de arriba.

2. 2. Lea lo que escribe Avals:

Avals:
es una medida del error. Si la distribución es como la mostrada por C-4, el error es enorme y la probabilidad de obtener una desviación mayor del valor real apenas disminuye. ¿Qué sentido tiene un indicador de este tipo si se puede obtener una correlación de -0,6 a +0,6 con independencia real?