샘플 상관 관계가 0이라고 해서 선형 관계가 없는 것은 아닙니다. - 페이지 46

 

내가 그림으로 예를 들어줄 차례.

간격 t = -10 ... 10에서 두 프로세스의 샘플이 있다고 가정합니다(임의가 아니지만 비임의 프로세스는 임의 프로세스의 퇴화 사례이므로 예를 들어 그렇게 할 것입니다).

x1(t) = cos(2*pi*t)

x2(t) = sint(2*pi*t) + h(t), 여기서 h(t)는 헤비사이드 단계,

또한 샘플 샘플링 주파수는 상당히 큽니다(사인 및 코사인 자체의 주파수보다 훨씬 높음) fd >> 1

다음은 이러한 프로세스의 그래프입니다.


분명히 사인/코사인의 직교성으로 인해 전체 샘플의 순시 상관 계수 값은 프로세스의 불연속성으로 인해 어떤 식 으로든 QC를 결정하기 어려운 점 0을 제외하고는 0입니다.

그러나 주어진 프로세스를 선형 QC에 대한 공식으로 어리석게 대체하면 말도 안 됩니다. 시간이 지남에 따라 두 번째 프로세스에 대한 시간의 산술 평균은 0이 아니라 1/2로 밝혀졌고 0 값과 다른 출력을 갖는 수식에 이름을 입력하고 더 많은 경우 더 짧은 샘플을 취합니다(구간 [-10;10]의 경우 이러한 방식으로 계산된 계수는 1이 되고 구간의 경우 , 예를 들어 [-3;3] - 다른). Excel을 포함하여 모든 패키지에 내장된 QC 계산 절차를 사용하여 이를 쉽게 확인할 수 있습니다.

여기서 모순이 직관적으로 발생해야 합니다. 결국 샘플을 t=0 지점으로 반으로 나누고 각 부분에 대한 QC를 같은 방식으로 계산하면 두 경우 모두 0을 얻지만 두 개의 "제로" 부분을 함께 꿰매어 우리는 0이 아닙니다 ??? 어떻게 이럴 수있어?

그 이유는 프로세스 x2(t)의 비정상성이 고려되지 않고 결과적으로 이 경우 시간 경과에 따른 산술 평균을 평균의 추정치로 취하는 것이 불가능하기 때문입니다. 또한 구성을 통해 이 평균이 실제로 시간이 지남에 따라 어떻게 변하는지 알고 있습니다. 따라서 계산 절차는 프로세스에 대한 사전 지식을 기반으로 두 부분을 모두 정상성을 주장할 수 있는 형식으로 가져오는 것으로 정확하게 축소되어야 합니다.

즉, x1(t) 및 x2(t) 대신 x1(t) 및 x2'(t) = x2(t)-h(t)를 선형 QC 공식에 대입해야 합니다. 즉, 두 번째 과정에서 고정 항을 분리합니다. 그러면 공식에 따른 계산 결과가 예상과 일치합니다.

 
Integer :

어떤 것에 대해서도 필요하지 않으며 특히 교과서의 이름, 정의가있는 인용문이 필요합니다. 그렇다고 해도 정의를 제대로 이해했다고 확신하는가? 그런 확신은 어디서 오는 걸까? 상관계수가 무엇인지 이해하고, 깨닫고, 느끼기 위해 직접 손(실험, 놀이)으로 상관계수를 느껴보셨나요?

어떻게 그렇게 세게 흔들 수 있습니까?

나는 비틀기가 무엇인지 알지 못합니다(어떤 종류의 춤을 제외하고). Wikipedia에서 상관 관계의 정의를 살펴보았습니다.

울타리 어딘가에 쓰여진 내용을 비판적으로 평가하려고 하십니까? 확률 변수는 어떻습니까? 오직 어떤 멍청이만이 이 정의를 쓸 수 있습니다. 힙합 에 관한 모든 교과서든 뭐든 간에, 이 모든 교과서는 상관관계가 무엇인지 스스로 이해하지 못하고 학생들의 두뇌가 망할 놈들이 쓴 것입니다.


TViST(확률이론과 통계는 줄여서)는 내 전공의 주요 과목이고, 나는 그것을 연구소에서 가르쳤고 5학기 동안 시험에 훌륭하게 합격했다. 글쎄, 솔직히, 나는 여기에 공증된 스크린샷을 게시하지 않을 것입니다. 누구나 손에 있는 교과서, 심지어 우리의 교과서, 심지어 외국의 교과서를 열 수 있으며 상관 관계를 결정할 때 문제가 되는 것과 그렇지 않은 것을 확인할 수 있습니다. 그것들이 모두 병신들이 썼다고 가정한다면, 그것들을 읽을 가치가 전혀 없다는 것이 밝혀졌습니까? 아니요, 감사합니다. 울타리 범주에서 이 포럼을 선택하고 여기에 쓰여진 내용을 먼저 비판적으로 평가한 다음 거기에 무엇이 있는지 비판적으로 평가할 것입니다.

 
alsu :


여기에서 모순이 직관적으로 발생해야 합니다. 결국 샘플을 t=0 지점으로 반으로 나누고 각 부분에 대한 QC를 같은 방식으로 계산하면 두 경우 모두 0을 얻지만 두 개의 "제로" 부분을 함께 꿰매어 우리는 0이 아닙니다 ??? 어떻게 이럴 수있어?

아니요. 찾고 있지 않습니다. 절반은 0이고 다른 절반은 0이 아닙니다.
 
alsu :

TViST(확률이론과 통계는 줄여서)는 내 전공의 주요 과목이고, 나는 그것을 연구소에서 가르쳤고 5학기 동안 시험에 훌륭하게 합격했다. 글쎄, 솔직히, 나는 여기에 공증된 스크린샷을 게시하지 않을 것입니다. 누구나 손에 있는 교과서, 심지어 우리의 교과서, 심지어 외국의 교과서를 열 수 있으며 상관 관계를 결정할 때 문제가 되는 것과 그렇지 않은 것을 확인할 수 있습니다. 그것들이 모두 병신들이 썼다고 가정한다면, 그것들을 읽을 가치가 전혀 없다는 것이 밝혀졌습니까? 아니요, 감사합니다. 울타리 범주에서 이 포럼을 선택하고 여기에 쓰여진 내용을 먼저 비판적으로 평가한 다음 거기에 무엇이 있는지 비판적으로 평가할 것입니다.

이상하지만 상관관계의 역학을 가르쳐주신 선생님이 이 교과서를 읽지 않은 것 같습니다... 다행히도 그의 학생들을 위해 :)

 
alsu : ... 분명히 사인/코사인의 직교성으로 인해 전체 샘플에 대한 순시 상관 계수 값은 0입니다. 프로세스의 불연속성.
정수 : 아니요. 찾고 있지 않습니다. 절반은 0이고 다른 절반은 0이 아닙니다.

예, 두 번째는 0이 아닙니다. 시각적 속임수.


후속 질문:

친애하는, 가격 시계열 (FX)에 대한 어떤 종류의 데이터를 사용하여 정상성, 분포, ergodicity, 상관 관계 및 기타 통계에 대한 결론을 내릴 때 사용합니까? 조각? 농담이 아닌 질문. 천문학적 시간으로 양자화된 최고의 밴드 중 하나의 증언을 자주 듣습니까? 하지만 이것은... 어떻게 말하면... 용납할 수 없는 일입니다. 실제 거래량을 고려하여 "실제" 거래의 가격 표시 순서를 분석하는 것이 논리적입니다. 분석을 위한 데이터 준비의 요점일 수도 있습니다.

 

흥미로운 토론. 아마도 그들은 여기에서 진실의 바닥에 도달할 것입니다.

나는이 질문을 찾기 위해 반복적으로 시도하고 똑똑한 (외견상) 사람들과 이야기했지만 아무도 이해하지 못하는 것 같습니다. 그들은 뺨을 부풀리기 만합니다)))

상관 관계의 물리적 의미는 벡터 간의 각도 코사인입니다(여기서 벡터의 좌표는 모두 원본 샘플임).

따라서 QC는 실제로 곡선의 모양만 "비교"하며 스케일링(벡터의 길이 변경) 또는 오프셋(벡터의 시작 부분 전송)의 영향을 받지 않습니다.

견적은 어떻게 되는지 모르겠지만 신호 처리에서 QC는 I(1)에만 해당되며 유효합니다. 특히 신호의 주기성을 상당히 질적으로 드러낼 수 있습니다.

I(0)에 대한 QC의 사용이 의미하는 바를 이해하고 싶습니다. 이것은 거의 완전히 무작위적인 두 시리즈의 "모양"을 비교한 것이기 때문에 정의상 모양의 유사성은 있을 수 없습니다.

그리고 이것은 모두 로컬 사용을 위한 것입니다.


이와 별도로 전체 시리즈에 대한 QC, 분포 및 기타 통계 계산의 의미를 한 번에 이해하고 싶습니다. 결국 이것은 N년 동안의 병원 평균 온도인데 그게 무슨 의미가 있단 말인가?

시장에서 I(1) 또는 I(0)에는 정상성이 없습니다.

 
airbas : 시장에서 I(1) 또는 I(0)에는 정상성이 없습니다.

시장에 대한 I(1) 및 I(0)에 대해 이야기하고 있습니까?

I(0)은 정의상 고정 프로세스입니다. 그는 인용문 어디에 있습니까?
 
Demi :
예? 그리고 코사인과 사인의 상관계수가 -1에서 +1로 부드럽게 변한다고 배운 적이 있습니다. 그리고 그것은 밝혀졌습니다 - 0 ........

상호 상관 _function_은 -1에서 +1로 변경됩니다. 그리고 표본 상관 계수는 _숫자_입니다. 그리고 이 숫자는 미리 정의된 두 개의 샘플에 대한 상수입니다. 균일 한 그리드에서 한 쌍의 직교 함수 값을 샘플로 취하면 계수는 0과 같습니다. 이것은 직교 함수의 정의에 따른 것입니다. 합으로 작성된 정의의 적분은 놀랍게도 표본 공분산의 정의와 유사합니다.

정수 :

상관 계수는 더 이상 표시되지 않으며 상관 계산은 정규성 또는 에르고딕성 또는 정상성과 아무 관련이 없습니다. 어떤 교과서를 읽고 있습니까?

가장 중요한 것이 수식에 숫자를 대입하고 숫자를 얻는 것이라면 고정성과 에르고딕성은 중요하지 않습니다.

ergodicity 속성을 사용하면 샘플을 기반으로 일반 모집단에 대한 상관 함수를 평가할 수 있습니다. 이 속성이 충족되지 않으면 공식으로 얻은 숫자가 버려질 수 있습니다.

고정성을 사용하면 예를 들기가 더 쉽습니다. 확률적 미분의 형식이 다음과 같은 한 쌍의 무작위 프로세스를 사용합니다.

dX(t) = mu_1 * dt + 시그마_1 * dW_1;

dY(t) = mu_2 * dt + 시그마_2 * dW_2;

dW_1, dW_2 - 상관 Wiener 프로세스(rho 상관 포함);

mu_1, mu_2, sigma_1, sigma_2는 양의 상수입니다.

예를 들어, 미분 계열 쌍의 상관 계수는 증분 간의 상관 관계에 관계없이 샘플 크기가 증가함에 따라 일치하는 경향이 있습니다(모든 mu_1 및 mu_2에 대해 - to sign(mu_1 * mu_2) ). 전체 농담은 I(1) 프로세스에서 표본 평균이 상수로 수렴하지 않는다는 것입니다.

mu_1=0.01; mu_2=0.05; 시그마_1=1; 시그마_2=1; rho=0.5:

mu <- c( 0.01 , 0.05 )
sigma <- matrix(c( 1 , 0.5 , 0.5 , 1 ), 2 , 2 )

simulate.random.walks <- function (num.points, integrated = T) {
  ret.val <- matrix(rnorm(num.points * 2 ), num.points, 2 ) %*% chol(sigma)
  ret.val <- do .call(cbind, lapply( 1 : 2 , function (i) { ret.val[, i] + mu[i] } ))
   if (integrated) ret.val <- apply(ret.val, 2 , cumsum)
  ret.val
}

num.points.grid <- trunc(exp(seq(log( 10 ^ 2 ), log( 10 ^ 6 ), length. out = 25 )))
cor.integrated <- sapply(
  num.points.grid,
  function (num.points) { cor(simulate.random.walks(num.points, T))[ 1 , 2 ] }
  )
cor.non.integrated <- sapply(
  num.points.grid,
  function (num.points) { cor(simulate.random.walks(num.points, F))[ 1 , 2 ] }
  )

png(filename= 'c:/Users/User/Desktop/bgg.png' , 800 , 600 )
par(mfrow = c( 2 , 1 ))
plot(num.points.grid, cor.integrated, xlog = T, t = 'o' )
abline(h = 1 , col = 'red' , lty = 'dashed' )
plot(num.points.grid, cor.non.integrated, xlog = T, t = 'o' )
abline(h = 0.5 , col = 'red' , lty = 'dashed' )
dev.off()

공군기지 :

견적은 어떻게 되는지 모르겠지만 신호 처리에서 QC는 I(1)에만 해당되며 유효합니다. 특히 신호의 주기성을 상당히 질적으로 드러낼 수 있습니다.

어느 대학을 졸업했는지 알려주실 수 있나요? 면접 시 지각의 적절성을 위해 더 주의 깊게 확인해야 하는 사람이 누구인지 알 것입니다.

정수, 그것이 어렵지 않다면 당신에게도 같은 질문입니다.

게리 카 :

친애하는, 가격 시계열(FX)에 대한 어떤 종류의 데이터를 사용하여 정상성, 분포, ergodicity, 상관 관계 및 기타 통계에 대한 결론을 내릴 때 사용합니까? 조각? 농담이 아닌 질문. 천문학적 시간으로 양자화된 최고의 밴드 중 하나의 증언을 자주 듣습니까? 하지만 이것은... 어떻게 말하면... 용납할 수 없는 일입니다. 실제 거래량을 고려하여 "실제" 거래의 가격 표시 순서를 분석하는 것이 논리적입니다. 분석을 위한 데이터 준비의 요점일 수도 있습니다.


교과서의 정의를 읽고 요점을 파악하십시오. 당신이 입찰/매도/중가를 사용한다면 그것은 정말로 중요하지 않습니다. 수치적 특성은 약간 다를 수 있지만, 정상성에 대한 결론은 동일할 것입니다.

 

이 후에 적절성을 확인하십시오.

Свойство эргодичности позволяет оценивать корреляционную функцию для генеральной совокупности на основе выборки из оной. Если это свойство не выполняется - число, полученное по формуле, можно выкинуть.

 
익명이지만 정기적으로 포럼을 읽고 거의 모든 포럼에서 적절한 게시물을 본 적이 없습니다.