인용 부호의 종속성 통계(정보 이론, 상관 관계 및 기타 기능 선택 방법) - 페이지 2

 
alexeymosc :

첫째, 주기는 일별 차트가 아니라 시간별 차트입니다! 그건 그렇고, 나는 거기에 썼다.

그리고 며칠 동안 결과가 주기적이지 않을 것입니다. 당신 말이 맞습니다.

죄송합니다. 파수꾼을 위해 반복합니다.

120시간 동안의 초기 일정

차트에 따르면 순환성이 보이지 않고 추세가 있습니다. 정규성을 확인합시다.

Zharkov-Beru에 따르면 - 전혀 정상이 아닙니다. ACF를 확인해보자:

추세는 있지만 주기성은 없습니다. 다른 결과입니다.

추세가 있으면 통계를 다루어도 소용이 없습니다. 같은 Hodrick을 사용하여 추세 감소:

외견상 나머지는 백색소음이다. 그 안에 있는 주기를 보십시오.


Krnechno, 파도가 있지만 당신에 비해 단단하지 않고 전혀 아름답지 않습니다. 모든 차이는 추세를 줄이는 데 있다고 생각합니다. 결정적 구성 요소를 제거하지 않고는 통계를 만들 수 없습니다.

 
당신은 뭔가를하고 있습니다. 일반적으로 내가하고있는 일과 관련이 없습니다.))) 내가 여러 증분으로 작업한다는 사실부터 시작하겠습니다. 그런 다음 이 계열의 값(즉, 플러스와 마이너스)을 취하고 자기상관도를 작성하면 내기 - 기간이 24인 아름다운 주기가 나올 것입니다. 이것은 논리적으로 내 비즈니스에 더 가깝습니다. .
 
어제 나는 Habré에 관한 기사에 정보 이론에 대한 요약을 추가했습니다. 중요한 변수를 찾는 과정을 이해하는 데 도움이 될 수 있습니다.
 
alexeymosc :
당신은 뭔가를하고 있습니다. 일반적으로 내가하고있는 일과 관련이 없습니다.))) 내가 여러 증분으로 작업한다는 사실부터 시작하겠습니다. 그런 다음 이 계열의 값(즉, 플러스와 마이너스)을 취하고 자기상관도를 작성하면 내기 - 기간이 24인 아름다운 주기가 나올 것입니다. 이것은 논리적으로 내 비즈니스에 더 가깝습니다. .

당신이 원하는대로. 나는 증분을 이전과의 차이로 계산합니다. 나는 그래프를 얻는다 :

이러한 증분에 대해 ACF를 계산합니다.

마지막 열에 주의하십시오. 이것은 막대 사이에 상관 관계가 없을 확률입니다.

나는 증가의 제곱을 취합니다. 차트는 다음과 같습니다.

이것은 변동성 변화의 정점이며, 주기적인 증분은 변동성과 어떤 관련이 있습니까? 주기적인 변동성일 수 있습니까? 이것도 흥미롭다. 증분 주기를 확인합시다.

글쎄, 여기에는 순환성이 없으며 마지막 열에주의를 기울입니다. 상관 관계가 부족할 가능성이 매우 높습니다.

관심 있는 두 개의 다른 그림이 있습니다. 증분의 정규성을 확인합시다.

Zhark-Ber에 따르면 정규성 확률은 0입니다!

이 분포는 무엇입니까? 노멀이었으면 합니다. 다음과 이전의 차이로 얻은 증분으로 작업한다는 아이디어는 항상 나에게 모호한 것처럼 보였습니다.

드디어. 어떤 이유로 나는 당신의 결과를 얻을 수 없습니다.

 

faa1947 , 귀하의 이러한 계산은 topicstarter가 이야기하기 시작한 평균 정보 흐름 과 아무 관련이 없습니다. 지난 5일 동안의 데이터를 처리하고 있고 Alexey의 그래프는 10년 동안 시간당 데이터를 처리한 결과입니다. Alexei 에게 이것은 통계이며, 당신에게 이것은 토론의 맥락에서 아무것도 증명하지 못하는 특별하고 고립된 사례입니다.

topicstarter가 표시하는 빈도는 변동성 또는 수익과 직접적인 관련이 없습니다. 이것은 가격의 주기성이 아니라 in-for-ma-qi-on-on-ya 입니다. 가로축은 지연이고 세로축은 비트 단위의 평균 상호 정보입니다. 그리고 Alexey 는 모든 사람을 완전히 혼란스럽게 하기 위해 자기상관도를 다루었습니다. :) 이것은 반환값의 자기상관이 아닙니다! 우리는 그것에 대해 전혀 이야기하지 않습니다. 왜냐하면. 이러한 정보 종속성은 대부분 분명히 비선형적이며 수익의 ACF에 의해 전혀 드러나지 않습니다.

Habré에 대한 기사를주의 깊게 읽었습니까? 그것은 당신이 선호하는 고정성, 수익률 흐름의 정규성, 심지어 변동성의 조건부 주기성과도 아무 관련이 없습니다. 물론 여기서 고정성을 확인하는 것이 좋지만 완전히 다른 종류의 정보 제공(있는 경우)입니다.

2 Avals: 유감스럽게도 당신의 의지 가설을 직접 테스트할 깊은 진드기 기록 을 찾을 수 없습니다. 그리고 여기서 계산은 볼륨면에서 완전히 미쳤을 것입니다 (이미 매우 방대합니다). 우리는 직접적인 예측을 시도하여 발견된 것을 판단할 것입니다(물론 가능하다면; 많은 함정이 있습니다).

 
Mathemat :

Alexei 에게 이것은 통계이며, 당신에게 이것은 토론의 맥락에서 아무것도 증명하지 못하는 특별하고 고립된 사례입니다.

관찰 횟수가 30개를 초과하면 t-통계량이 z-통계량으로 수렴된다는 점에 유의하고 싶습니다. 저에게 큰 뉴스는 10,000개의 관찰이 반드시 1,000보다 낫다는 것입니다. 시간별 데이터의 주간 주기성을 나타내려면 몇 시간이 걸립니다. 그러나 이것은 그런데입니다.


topicstarter가 표시하는 빈도는 변동성 또는 수익과 직접적인 관련이 없습니다. 이것은 가격의 주기성이 아니라 in-for-ma-qi-on-on-ya 입니다.

훨씬 더 중요한 것은 접근 방식의 방법론적 가치입니다. 나에게 있어 모든 수학적 계산에는 질적 경제적 해석이 있어야 한다는 것이 공리입니다. 정보 주기성은 본질적으로 증분 관계인 데이터의 주기성을 나타내는 공식입니다. 돌아가서 원래 시계열로 돌아가서 이러한 장소를 찾고 경제적 설명, 즉 가격으로의 복귀는 의무적이며, 그렇지 않으면 하나의 수학적 추론일 뿐입니다. 그래서 이 주제를 일반 루프에 연결했습니다.
 
Mathemat : 이것은 수익률의 자기상관이 아닙니다! 우리는 그것에 대해 전혀 이야기하지 않습니다. 왜냐하면. 이러한 정보 종속성은 대부분 분명히 비선형적이며 수익의 ACF에 의해 전혀 드러나지 않습니다.

실제로 기사 말미에는 일반적인 수학적 통계 방법이 적용되었습니다.

내 오해를 만회하고 이웃 가격의 비율을 취합니다.

가격 비율 차트:

정상인지 확인

놀랍게도 정규성은 강력하게 거부됩니다.

우리는 ACF를 구축합니다. 이는 지연 + 개인 ACF 간의 종속성으로 ACF에서 종속성이 제거됩니다.

우리는 종속성이 없을 가능성이 매우 높은 마지막 열에주의를 기울입니다.

나는 이 그림들에 대한 명확한 경제적 설명을 가지고 있으며, 시세 차트로 잘 확인됩니다. 그리고 정보 의존성이란 무엇입니까? 초기 인용문에서 어떻게 확인됩니까? 경제적 정당성은 무엇입니까? 이러한 질문에 대한 답이 없으면 "정보 의존성"의 의미를 이해할 수 없습니다.

 
당신을 위한 가장 쉬운 대답. 자기 상관 을 사용하고 있습니다. 즉, 순전히 선형 관계를 찾고 있습니다. 상호 정보는 임의 유형 의 종속성이 있음을 나타냅니다. 여기에서 모든 차이가 발생합니다. 그런데도 통계적으로 중복되는 샘플을 수천, 수만 증분으로 실험했는데 일주일이 걸렸습니다. 예, 이번 주에 어떤 일이 발생할 수 있습니다. 이것은 특별한 경우입니다. 결과에 의미가 없습니다.
 
faa1947 : 정보 주기성은 본질적으로 증분 비율인 데이터의 주기성을 나타내는 공식입니다.

핵심이 틀립니다. 증분 비율 유형의 데이터에서 주기성에 대해서는 의문의 여지가 없습니다.

정보 의존성이 드러났는데, 이는 증분 비율의 주기성으로 이어질 의무가 전혀 없습니다. 그것이 표면에 있지 않은 특정 구조를 식별하는 것이 가능해지는 데이터 마이닝의 트릭입니다.

돌아가서 원래 시계열로 돌아가서 이러한 장소를 찾고 경제적 설명, 즉 가격으로의 복귀는 의무적이며, 그렇지 않으면 하나의 수학적 추론일 뿐입니다. 그래서 이 주제를 일반 루프에 연결했습니다.

네, 그렇게 해야 합니다. 저는 논쟁하지 않습니다. 경제적 설명은 전혀 필요하지 않다. 가격으로 돌아가기에 충분합니다. 그러나 여기에서 이 현상을 일반적인 주기와 연결하는 것은 잘못된 것입니다. 나는 차트에 뚜렷한 주기성이 없다는 사실을 눈치채지 못할 정도로 장님이 아닙니다.

Aleksey 는 이미 선형 종속성과 비선형 종속성의 차이점에 대해 설명했습니다.

 
alexeymosc :
당신을 위한 가장 쉬운 대답. 자기 상관을 사용하고 있습니다. 즉, 순전히 선형 관계를 찾고 있습니다. 상호 정보는 임의 유형 의 종속성이 있음을 나타냅니다. 여기에서 모든 차이가 발생합니다. 그런데도 통계적으로 중복되는 샘플을 수천, 수만 증분으로 실험했는데 일주일이 걸렸습니다. 예, 이번 주에 어떤 일이 발생할 수 있습니다. 이것은 특별한 경우입니다. 결과에 의미가 없습니다.

그런데도 통계적으로 중복되는 샘플을 수천, 수만 증분으로 실험했는데 일주일이 걸렸습니다. 예, 이번 주에 어떤 일이 발생할 수 있습니다. 이것은 특별한 경우입니다. 결과에 의미가 없습니다.

표본 크기를 늘리는 것은 확률이 정상 법칙에 수렴한다는 극한 정리의 틀 에서만 관심이 있는 것 같습니다. 우리가 그러한 작업을 스스로 설정하지 않으면 샘플을 단순히 증가시켜도 아무 것도 제공하지 않는다는 사실을 실망시키고 싶습니다. 아래는 샘플이 10배 증가한 것입니다.

이전 가격에 대한 다음 가격의 비율로 증분 그래프:

이 그래프의 제곱:

차트가 당신과 비슷합니다. 이 그래프의 경제적 해석에 대해 질문을 받았는데 답변을 하지 않으셨습니다


더 나아가:


10배 작은 샘플과 비교하면 아무것도 바뀌지 않았습니다!



여기에 새로운 것이 있습니다. 연결이 없을 확률은 0입니다.


상호 정보는 임의 유형 의 종속성이 있음을 나타냅니다. 여기에서 모든 차이가 발생합니다.

"선형성"과 "비선형성"을 희생시키면서 나는 같은 것에 대해 주의를 기울일 것입니다. 왜냐하면 이 질문은 시계열을 근사화하는 모델의 프레임워크 내에서 제기될 수 있고 또 그래야 하기 때문입니다. 이 모델의 계수를 분석하면 이러한 계수가 상수(또는 거의 상수), 결정적 함수 또는 확률적 함수라는 결론에 도달할 수 있습니다. 이것은 종속성 유형을 분석하는 매우 구체적이고 건설적인 프로세스입니다 . 그리고 이러한 정보 의존성이 발견될 때 건설적인 것은 무엇입니까? 그리고 다시 한 번, 원래 시계열에서 어떻게 볼 수 있습니까?