Una correlación muestral nula no significa necesariamente que no exista una relación lineal - página 39

 


Aquí de los comentarios en el enlace de hrenfx 22.03.2011 00:43 le gustó:

¡hay una correlación! :)
no significa que una sea consecuencia de la otra.
pero los fenómenos están relacionados.
(y entonces uno puede empezar a inventar explicaciones).
pero esa no es la cuestión.
La cuestión es que, con cierta perspectiva, es posible predecir la relación de uno con el otro. hasta cierto punto. )
Por supuesto, una comprensión clara del mecanismo de la conexión permitirá predecir cuándo terminará la conexión.
pero...
pero también sólo con el análisis constante de la correlación, es posible predecir cuándo terminará. )

 
Como Grove : hay una correlación - no puede ser))))))))))
 
Neutron:

Estoy de acuerdo en parte, pero en absoluto con todo. Si quieres tener una discusión de fondo sobre el tema que has planteado, primero tendrás que leer algunos de mis posts que revelan mi opinión sobre el tema. He tenido que repetirme mucho, así que no lo haré más. Acabo de enviarte dos enlaces a mis posts por MP.

 
hrenfx

Buenas tardes, he estado siguiendo sus hilos y me interesa su lógica,

Tengo una pregunta - ¿ha tratado de reescribir el indicador de correlación de recycle2 a mt5

 

En mi investigación necesitaba evaluar cualitativamente la relación entre las series, por lo que decidí utilizar el coeficiente de correlación. Las conclusiones son decepcionantes: los métodos que la estadística clásica sugiere utilizar son prácticamente inútiles para encontrar relaciones no evidentes entre series. Por ejemplo, tomemos un gráfico semanal de futuros del oro y su Interés Abierto:

Obviamente, hay una correlación directa. Sí, no es muy fuerte y obvio, pero cuando el precio del oro sube, el valor del interés abierto de los futuros del oro es más alto, cuando baja - más bajo.

Más adelante, encontraremos los coeficientes de correlación entre el precio del oro y su OI. Pero primero, veamos la fórmula de correlación de Pearson más común:

Si se observa con atención, queda claro que la fórmula detrae los datos (mediana de x - x), alinea las volatilidades por desviación estándar a lo largo de toda la muestra y, a continuación, cuenta cuánto tiempo han estado ambas series en la misma dirección. Evidentemente, el cálculo requiere las primeras diferencias de la forma I(0), porque en el caso de I(1) estamos ante una emboscada, ya que las series con las que tratamos son siempre positivas (el precio es siempre mayor que cero), pero sobre eso también más adelante.

Correlación de Pearson: 0,02234314

Correlación de Kendel: 0,002866038

Correlación de Spearman: 0,002046104

Es decir, de hecho, no se encontró ninguna correlación en todos los casos. Pero, ¿qué pasa con nuestros agudos ojos? ¿Nos lo estamos imaginando todo? ¿Y la correlación entre el oro y el interés abierto es la misma que la correlación entre las importaciones de plátanos de Marruecos y la tasa de natalidad del país?

Tal vez la razón sea el retraso de un indicador con respecto al otro. Los desfases no coinciden. ¿Y si la OI sube primero y sólo entonces lo hace el oro? - Oh, entonces se podría ganar dinero con eso :) Probemos la idea con una función de correlación cruzada:

Algo poco convincente. Hay algunos dos valores que sobresalen de la muestra, en general y aquí la imagen es como si no hubiera relación y por lo tanto el retraso no juega ningún papel.

DE ACUERDO. Intentemos entonces calcular la correlación en la serie I(1). ¿Quién dice que no debe hacerse en cualquier caso? Que haya una sobreestimación del resultado - pero mejor una sobreestimación que ningún resultado. Para ello se ha realizado un experimento, generemos 100 BPs y calculemos la matriz de correlación para ellos. El valor medio mostrará cuánto se sobreestimará la estimación, y simplemente cuando trabajemos con la serie I(1), ¿tendremos esto en cuenta, o no?

Aquí hay un script en R que lo hace todo:

#
# corexp - эксперимент выявляющий особенности корреляционных функций при работе с I(1) рядами
# exp - количество экспериментов
# lenght - длинна каждой серии
# cortype - тип корреляции (pearson - КК Пирсона, kendall - КК Кендалла, spearman - КК Спирмана)
# retrange - Истина, если требуется сгенерировать I(1) ряды
#
corexp <- function(exp = 10, lenght = 1000, cortype = 'pearson', retrange = TRUE)
{
   bp <- matrix(ncol = exp, nrow = lenght)
   for(i in 1:exp)
   {
      bp[,i] <- rnorm(lenght, mean = 0.000117, sd = 0.0048)
      if(retrange == FALSE)
            bp[,i] <- cumsum(bp[,i])
   }
   #Рассчитываем матрицу корреляций
   mcor <- matrix(ncol=exp, nrow=exp)
   for(k in 1:exp)
   {
      for(i in 1:exp)
      {
         mcor[k,i] <- cor(bp[,k], bp[,i], method = cortype)
      }
   }
   return(mcor)
}

# Статистика корреляций
# При желании считаем здесь все что угодно
corstat <- function(m)
{
   m[m == 1] <- NaN
   mean(m, na.rm = TRUE)
}

Veamos esta "media": 0,153359. Parece que está bien: se sobreestima hasta en un 15%. Pero hay otra trampa. Observamos la distribución de la matriz de correlación:

El valor medio en este caso no está definido en absoluto, o más bien cualquier valor de correlación es tan frecuente como cualquier otro valor. Se trata del sesgo positivo de nuestra PA, que se establece mediante el parámetro resaltado en negrita. Al fin y al cabo, todos los precios que manejamos tienen valores positivos, es decir, están en la zona positiva.

1. Como puede ver, la serie I(1) no se puede utilizar en absoluto. Para las series cuya relación no es obvia y no es rígidamente funcional, los coeficientes de correlación son absolutamente inútiles.

2. La elección de una implementación particular de un coeficiente de correlación no afecta fundamentalmente a nada. Ninguno de los tres coeficientes comunes ha sido capaz de revelar la relación entre el oro y su interés abierto, aunque es evidente que existe dicha relación.

 
C-4:

Correlación de Pearson: 0,02234314

Correlación de Kendel: 0,002866038

Correlación de Spearman: 0,002046104

¿Podemos echar un vistazo a la serie original? ¿Están disponibles en Excel, por ejemplo?
 
Las filas originales no se guardan. Aquí está una de las generaciones en formato CSV.
Archivos adjuntos:
bp.txt  2010 kb
 
C-4:
Las filas originales no se guardan. Aquí está una de las generaciones en formato CSV.
¿Cuál es su fila de fuentes de datos de interés abierto?
 
Aquí están los datos de OI alineados con el precio del oro.
Archivos adjuntos:
gold_oi_2.txt  19 kb
 
Coeficiente de correlación = 0,766654