Matstat 계량 경제학 마탄

 
수학 통계 , 계량 경제학 및 미적분학 분야의 모든 전문가에게 오신 것을 환영합니다.
나열된 과학 분야의 다양한 주제에 대한 건설적인 대화를 위한 지점입니다.
커뮤니케이션의 적절성에 오신 것을 환영합니다!
 

거래, 자동 거래 시스템 및 거래 전략 테스트에 관한 포럼

이론부터 실습까지. 2 부

알렉세이 니콜라예프, 2021.05.05 22:38

대략적으로 말하면 혼합은 의존성을 약화시키지만 완전히 제거하지는 않습니다.
사실, 확률적 의존성은 실제 적용 측면에서 이론의 가장 중요한 부분입니다.
YouTube에서 엔지니어를 위한 MIT의 이론 과정을 보았을 때 모든 것이 그녀를 중심으로 돌아갔습니다.


결정 계수 r2를 의미합니까?
아니면 확률적 의존성 아래 다른 무엇인가?

r2 y에 대한 변수 x의 "영향력"을 평가하기 위해 실시간으로 고려합니다.
놀랍게도 일부 통화 시리즈에서는 높은 비율로 꾸준히 유지됩니다.

r2

 
그리고 확률만으로는 충분하지 않습니까? 확률론이라면..
 
Dmitry Fedoseev :
그리고 확률만으로는 충분하지 않습니까? 확률론이라면..

이러한 맥락에서 평가 기준이 무엇을 의미하는지 명확히 하고 싶었습니다.
상관 관계가 정상이면 r2로 계산에 차이가 있고 각각 다른 추정치가 있습니다.
통계에서는 일반적으로 r2가 더 안정적이므로 사용하는 것이 좋습니다.

아르 자형

그리고 말 그대로 10분 후

르르

 
Roman :

결정 계수 r2를 의미합니까?
아니면 확률적 의존성 아래 다른 무엇인가?

확률적(확률적) 의존성은 이론과 matstat에서 가장 중요한 개념 중 하나입니다. 개념은 먼저 무작위 이벤트에 대해 조건부 확률을 통해 정의된 다음 조건부 분포의 형태로 무작위 변수로 전달됩니다. 종속은 조건 분포와 무조건 분포가 일치하지 않는 것이며 독립은 우연의 일치입니다. 중독에 대한 대중적인 설명 p. 에. - 자신이 받은 가치에 대한 지식. 에. 다른 s의 의미에 대한 정보를 전달합니다. c.. 의존성은 두 가지 극단 상태인 독립성과 경직된 기능적 연결 사이에 있습니다.

일반적인 의미는 특정 종속성 메트릭이 구축되는 기반으로 항상 무작위 변수의 공동 분포로 시작한다는 것입니다. 코퓰러, 상호 엔트로피, 상관 관계 등이 될 수 있습니다.

상관관계, R2 등은 합동 분포가 다변량 정규일 때만 합리적으로 적용할 수 있습니다. 실제로는 정규성에 대한 확신이 없는 경우에도 (단순함 때문에) 사용되지만 그 유용성은 경험에 의해서만 결정됩니다.

 
Aleksey Nikolayev :

확률적(확률적) 의존성은 이론과 matstat에서 가장 중요한 개념 중 하나입니다. 개념은 먼저 무작위 이벤트에 대해 조건부 확률을 통해 정의된 다음 조건부 분포의 형태로 무작위 변수로 전달됩니다. 종속은 조건 분포와 무조건 분포가 일치하지 않는 것이며 독립은 우연의 일치입니다. 중독에 대한 대중적인 설명 p. 에. - 자신이 받은 가치에 대한 지식. 에. 다른 s의 의미에 대한 정보를 전달합니다. c.. 의존성은 두 가지 극단 상태인 독립성과 경직된 기능적 연결 사이에 있습니다.

일반적인 의미는 특정 종속성 메트릭이 구축되는 기반으로 항상 무작위 변수의 공동 분포로 시작한다는 것입니다. 코퓰러, 상호 엔트로피, 상관 관계 등이 될 수 있습니다.

상관관계, R2 등은 합동 분포가 다변량 정규일 때만 합리적으로 적용할 수 있습니다. 실제로는 정규성에 대한 확신이 없는 경우에도 (단순함 때문에) 사용되지만 그 유용성은 경험에 의해서만 결정됩니다.

오, 이것은 교활한 배포이며 항상 잊어 버립니다))
모든 통계가 나옵니다. 모델에 이 기준이 필요합니까?
그리고 가격 시리즈에 정규성이 없기 때문에 데이터 준비에서 시련이 시작됩니다.
원래 속성을 잃지 않고 어떻게 든 정규 분포에 더 가깝게 가져옵니다.

이것은 이 데이터를 준비하는 방법의 문제를 제기합니다.
표준화, kusum, 파생상품 등 내가 이해하는 한, 그것들은 고품질 결과로 이어지지 않습니다.
이것에, 그들은 얇아지기 시작합니다. 일반적으로 어떤 방법이 있습니까?

일반적으로 통계 모델을 위한 고품질 데이터 준비는 광범위한 연구 주제라는 결론에 다시 도달합니다.
이 주제에 대한 튜토리얼을 찾고 있었지만 빅데이터, MO, 뉴런은 어디에나 있지만 어떤 이유로 고품질 데이터 를 준비하는 방법을 공개하지 않았습니다.

 

왜 이런 일이 일어나고 있는지 다음과 같은 예외를 이해할 수 없습니다.
이론상 최소제곱보다 더 나은 직교 모델을 계산했습니다.
시작 확률을 얻었습니다.
또한, 모델 매개변수(계수)는 중앙값 알고리즘, 즉 이상치로부터 일종의 강건성(robustness)에 따라 선택된다.
모델은 원본 시리즈를 질적으로 설명합니다.

파란색 원래 행입니다.
회색 모델입니다.

p1

그러나 역사의 한 섹션에는 위의 스크린샷과 같이 정확한 불일치가 수렴됩니다.

p2


그게 아니라 진실을 볼 수 없는데 왜 이런 일이 일어나는 걸까요? 그리고 이것에 기여하는 것은 무엇입니까?
결국 계수는 각 단계에서 다시 계산되며 이론상 (x)에서 (y)로 조정해야 합니다.
이것은 정말 피팅 오류입니까? 나는 오류가 하나 또는 둘에있을 수 있다는 것을 이해합니다. 음, 세 가지 계산 단계로 가십시오.
그러나 오류가 너무 오래 지속되는 것이 이상하게 보입니다. 맞는 오류가 아닌 것은 아닐까? 다른 무엇?

 
Roman :

왜 이런 일이 일어나고 있는지 다음과 같은 예외를 이해할 수 없습니다.
이론상 최소제곱보다 더 나은 직교 모델을 계산했습니다.
시작 확률을 얻었습니다.
또한, 모델 매개변수(계수)는 중앙값 알고리즘, 즉 이상치로부터 일종의 강건성(robustness)에 따라 선택된다.
모델은 원본 시리즈를 질적으로 설명합니다.

파란색 원래 행입니다.
회색 모델입니다.



그러나 역사의 한 섹션에는 위의 스크린샷과 같이 정확한 불일치가 수렴됩니다.


그게 아니라 진실을 볼 수 없는데 왜 이런 일이 일어나는 걸까요? 그리고 이것에 기여하는 것은 무엇입니까?
결국 계수는 각 단계에서 다시 계산되며 이론상 (x)에서 (y)로 조정해야 합니다.
이것은 정말 피팅 오류입니까? 나는 오류가 하나 또는 둘에있을 수 있다는 것을 이해합니다. 음, 세 가지 계산 단계로 가십시오.
그러나 오류가 너무 오래 지속되는 것이 이상하게 보입니다. 맞는 오류가 아닌 것은 아닐까? 다른 무엇?

귀하의 모델이 구현된(또는 이와 유사한) 통계 패키지를 찾고 데이터에서 어떻게 작동하는지 확인하는 것이 좋습니다. 이것은 잘못된 모델 선택 또는 구현 오류에서 문제가 무엇인지 이해하는 데 도움이 될 수 있습니다.

 
Roman :

그리고 가격 시리즈에 정규성이 없기 때문에 데이터 준비에서 시련이 시작됩니다.
원래 속성을 잃지 않고 어떻게 든 정규 분포에 더 가깝게 가져옵니다.

로그 증분 - 작동하지 않습니까?
 
Aleksey Nikolayev :

귀하의 모델이 구현된(또는 이와 유사한) 통계 패키지를 찾고 데이터에서 어떻게 작동하는지 확인하는 것이 좋습니다. 이것은 잘못된 모델 선택 또는 구현 오류에서 문제가 무엇인지 이해하는 데 도움이 될 수 있습니다.

아이디어 감사합니다 생각지도 못했는데

 
secret :
로그 증분 - 작동하지 않습니까?

예, 원칙적으로 어느 정도 적절한 옵션으로 수행합니다.
또 다른 유사한 모델에서 나는 때때로 작은 불일치, 즉 어떻게 발산이 얻어지는지를 관찰했습니다.
그러나 위의 화면처럼 오래 지속되지는 않지만 매우 단기적입니다. 왜 이런 일이 일어나고 있는지 궁금하게 만들었습니다.
나는 이 모델을 시도했고, 훨씬 더 오래 지속된 다이버를 보았습니다.

나는 이 차이가 어디서 오는지 이해가 되지 않는다. 모델이 잘못되었거나 입력 데이터의 품질이 좋지 않습니다.
논리가 이해가 안됩니다.
또는 원본 데이터를 거의 정상으로 조정하고,
또는 다른 모델을 삽질하십시오.
하지만 먼저 이 모델을 작성해 보고, 확인하고 버리기가 쉽지가 않습니다.))