Correlación, asignación en una cartera. Métodos de cálculo - página 5

 
Aleksey Nikolayev:
Hay un problema con el cálculo de la correlación trivial. Debido a lano estacionariedad inherente a los incrementos de precios, da resultados erróneos (a menudo inflados). Por ello, la econometría suele tomar el difícil camino de construir un modelo autorregresivo para las series.
¿Podría ampliar la pregunta en un MP?
 
CHINGIZ MUSTAFAEV:
¿Podría ampliar la pregunta en un mensaje privado?

He aquí un ejemplo sencillo de este efecto. No estoy preparado para describir cómo tratarla en términos generales, ya que es esencialmente un curso de econometría)

Generemos cuatro muestras independientes de la misma longitud con diferentes ganancias esperadas: las dos primeras tienen cero y el resto tienen uno. Se espera que todas las correlaciones por pares sean cercanas a cero. Ahora hagamos dos muestras de ellas, una de la primera y la tercera, y otra de la segunda y la cuarta. Por supuesto, son independientes y, por tanto, no están correlacionados, pero la correlación de la muestra es notablemente superior a cero. El código en R y su resultado:

n <- 1000
v1 <- rnorm(n, mean = 0, sd = 1)
v2 <- rnorm(n, mean = 0, sd = 1)
v3 <- rnorm(n, mean = 1, sd = 1)
v4 <- rnorm(n, mean = 1, sd = 1)

v5 <- c(v1, v3)
v6 <- c(v2, v4)

print(cor(v1, v2))
print(cor(v3, v4))
print(cor(v5, v6))

0.01907343
0.01391064
0.2173542
 
Aleksey Nikolayev:

He aquí un ejemplo sencillo de este efecto. No estoy preparado para describir cómo tratarla en términos generales, ya que es esencialmente un curso de econometría)

Generemos cuatro muestras independientes de la misma longitud con diferentes ganancias esperadas: las dos primeras tienen cero y el resto tienen uno. Se espera que todas las correlaciones por pares sean cercanas a cero. Ahora hagamos dos muestras de ellas, una de la primera y la tercera, y otra de la segunda y la cuarta. Por supuesto, son independientes y, por tanto, no están correlacionados, pero la correlación de la muestra es notablemente mayor que cero. El código en R y su resultado:

¿No se hace en el RNG?
 
CHINGIZ MUSTAFAEV:
¿No se hace en RNG?

Más bien se trata de un PRNG, pero se puede conectar a un RNG cuántico si se quiere).

Sí, la función rnorm() en R genera una muestra independiente normalmente distribuida con los parámetros especificados.

 
CHINGIZ MUSTAFAEV:
Responde a la pregunta, o vete a los otros hilos.
No sé lo que estás contando, pero no me parece correcto.
De eso iba el post.
Y tu respuesta huele a gafas de color de rosa.
Al fin y al cabo, los pares 100% correlativos que tienes están fuera de la mesa.
Los pares están pre-sincronizados, espero.
 
Aleksey Nikolayev:

Más bien PRNG, pero puedes conectarte a un RNG cuántico si quieres).

Sí, la función rnorm() en R genera una muestra independiente normalmente distribuida con unos parámetros determinados.

una pregunta muy-muy quisquillosa: ¿restan/utilizan la entropía? el proceso técnico (función) que lleva un tiempo desagradablemente largo. ella (la entropía) se acumula lentamente, y sin ella nada es cripto-resistente

sobre la mezcla - ¿qué resultado se esperaba? me parece que incluso en teoría la correlación parcial será obligatoria.

 
Maxim Kuznetsov:

muy-muy quisquilloso: ¿leen/utilizan la entropía? el proceso (función) lleva un tiempo desagradablemente largo. se acumula lentamente (entropía), y sin ella las cosas no son a prueba de criptografía.

sobre la mezcla - ¿qué resultado se esperaba? me parece que incluso en teoría la correlación parcial será obligatoria.

Hay algún paquete en R que te permite conectarte a un ordenador cuántico y tomar verdaderos SF. En algún lugar del foro ya los coloqué para tu tocayo) Para el PRNG en R puedes elegir entre un montón de algoritmos (puedes leer la ayuda), pero no entró en la pregunta.

La correlación y la correlación selectiva son cosas muy diferentes. Por ejemplo, la correlación puede ser inexistente, mientras que la correlación de la muestra puede calcularse para casi cualquier muestra. El problema es una total incomprensión del simple hecho de que la correlación muestral no es la definición de correlación (sino sólo una estimación de la misma, no siempre exacta).

 
Aleksey Nikolayev:

Hay algún paquete en R que permite conectarse a un ordenador cuántico y tomar verdaderos SF. En algún lugar del foro ya los coloqué para tu tocayo) Para el PRNG en R puedes elegir entre un montón de algoritmos (puedes leer la ayuda), pero no entré en la cuestión.

La correlación y la correlación selectiva son cosas muy diferentes. Por ejemplo, la correlación puede ser inexistente, mientras que la correlación de la muestra puede calcularse para casi cualquier muestra. El problema es una total incomprensión del simple hecho de que la correlación muestral no es la definición de correlación (sino sólo una estimación de la misma, no siempre exacta).

Gsc solía estimarlo trazando la distribución del número de recuentos generados idénticos. Cuanto más plana sea la línea, lógicamente mejor. Tomó unos cuantos millones de generaciones. Y puedes ver claramente todo. Por lo general, el mismo algoritmo da siempre una copia de la distribución, por muy supuestamente aleatoria que sea.
 
Renat Akhtyamov:
Gsc se suele estimar trazando la distribución del número de ss idénticos generados. Cuanto más plana sea la línea, lógicamente mejor. Llevó varios millones de generaciones. Y puedes ver claramente todo. Por lo general, el mismo algoritmo da una copia de la distribución todo el tiempo, sin importar lo supuestamente aleatorio que sea.

Un ejemplo típico de cómo la intuición humana no funciona bien en los problemas teóricos. La probabilidad de que haya coincidencias es muy alta (la paradoja de los cumpleaños)

 
Aleksey Nikolayev:

Hay algún paquete en R que permite conectarse a un ordenador cuántico y tomar verdaderos SF. En algún lugar del foro ya los coloqué para tu tocayo) Para el PRNG en R puedes elegir entre un montón de algoritmos (puedes leer la ayuda), pero no entré en la cuestión.

La correlación y la correlación selectiva son cosas muy diferentes. Por ejemplo, la correlación puede ser inexistente, mientras que la correlación de la muestra puede calcularse para casi cualquier muestra. El problema es una total incomprensión del simple hecho de que la correlación muestral no es la definición de correlación (sino sólo una estimación de la misma, no siempre exacta).

¿que es lo que la ciencia se atreve a decir? ¿que es exactamente el resultado insatisfactorio?