베르누이의 정리, Moivre-Laplace; Kolmogorov의 기준; 베르누이 계획; 베이즈 공식; 체비쇼프의 불평등; 포아송 분포 법칙; Fisher, Pearson, Student, Smirnov 및 기타 정리, 공식 없이 일반 언어로 된 모델. - 페이지 7

 
sever31 : 배포판의 "꼬리"는 무엇입니까? 이러한 이상값이 전체 분포 패턴을 명확하게 제거합니까?

글쎄, 그런 것 같지만 완전히는 아닙니다. 예, 우리는 평균 값과 매우 다른 랜덤 변수의 값에 대해 이야기하고 있습니다.

일반적으로 꼬리는 두껍고 가늘다. 다음은 꼬리에 대한 매우 느슨한 정의입니다. 이는 주어진 편차보다 큰 편차의 확률입니다.

꼬리의 두께는 분출 자체의 크기에 의해 결정되지 않습니다. 평균으로부터의 편차, 그러나 그러한 강한 편차의 확률. 높을수록 꼬리가 두꺼워집니다.

정규 분포는 일반적으로 꼬리가 얇은 것으로 간주됩니다. 꼬리가 일반 분포보다 얇은 실용적인 분포를 알지 못합니다.

그리고 지금 - 꼬리의 훨씬 더 정확한 정의. 그러나 먼저 사진과 약간의 소개:

이것은 종의 유명한 그림입니다. 가우스 분포. 여기에 그려진 곡선은 분포 밀도(여기서는 normal)의 함수입니다. 맨 아래에는 표준 편차인 시그마가 그려집니다. 시그마는 분포가 (무엇이든) 얼마나 좁거나 넓은지를 측정한 것입니다.

모든 분포 밀도 함수(df, 영문 문헌 - pdf, 확률 분포 함수) 아래의 면적은 항상 1과 같습니다.

모든 f.p.r. 음수가 아닙니다. 이것은 실제로 확률이 항상 음이 아니라는 사실을 반영합니다.

확률 변수가 시그마와 두 시그마 사이에 있을 확률(평균 오른쪽)을 찾아야 하는 경우 수직선 "+ 시그마" 및 "+ 2*시그마". P(sigma <= X < 2*sigma)와 같이 표시합시다. +1000*sigma에서도 이 함수는 여전히 0이 아님을 명심하십시오. 예, 매우 빠르게 감소하지만(예: mathExp(-x^2)) 0으로 바뀌지 않습니다.

이제 꼬리로 돌아갑니다. 오른쪽 꼬리는 함수 right_tail( X; X0 ) = P( X0 <= X < infinity ) 입니다. 꼬리가 정확히 X0의 함수라는 사실에 다시 한 번 주목하십시오. X0(오른쪽)이 클수록 일반적으로 함수가 작아집니다. 저것들. 일반적으로(항상 그런 것은 아니지만 항상 점근적으로) 이 함수는 X0에서 감소하고 0이 되는 경향이 있습니다.

정규 분포의 경우 right_tail_normal( X; X0 ) ~ mathExp(-X0^2) 또는 이와 유사한 것(기억이 나지 않습니다. 기본 함수가 아님).

그러나 Laplace 분포의 경우(이전 게시물의 그림에 있는 기능 참조):


right_tail_laplace( X; X0 ) ~ mathExp(-a*X0). 이것은 정규 분포의 꼬리보다 훨씬 빠르게 0이 되는 경향이 있는 또 다른 함수입니다!

그리고 여기에 또 다른 하나가 있습니다 - Cauchy 분포:


그를 위해 right_tail_cauchy( X; X0 ) ~ 1 / X0. 이 함수는 x가 증가함에 따라 훨씬 더 느리게 0이 되는 경향이 있습니다.

우리는 세 가지 다른 함수 right_tail( X; X0 )을 보았습니다. 다른 pdf의 꼬리 사이의 실제 차이점은 다른 pdf에 대한 이 함수의 다른 감쇠율입니다. 정규 분포의 경우 함수는 매우 빠르게 감소합니다(얇은 꼬리), Laplacian의 경우 - 다소 빠르지만 첫 번째 것보다 무한히 빠릅니다(이미 뚱뚱한 꼬리), Cauchy의 경우 - 첫 번째 둘 모두보다 무한히 빠름(매우 뚱뚱한 꼬리).

 
Mathemat :

정규 분포를 설명하는 데 그다지 좋은 아이디어가 아닙니다. 예를 들어 10000에서 프로세스를 중지하면 횡단면에서 정확히 정규 분포를 얻을 수 있는지 확신할 수 없습니다. 또한이 분포 매개 변수는 지속적으로 변경됩니다.

가능하면 여기에서 더 자세히. 솔직히 말해서 베틀 벨이 왜 정상이 아닌지 이해가 안 가나요? 의미는 각 선이 입자의 방황 궤적이며 모든 입자는 동일한 이항 증분 프로세스와 유한하고 동일한 수의 단계를 가지므로 모든 수집 프로세스는 컬렉션의 동일한 속성을 가집니다. 설정은 어떻게 변경될 수 있습니까?
 
C-4 :
가능하면 여기에서 더 자세히. 솔직히 말해서 베틀 벨이 왜 정상이 아닌지 이해가 안 가나요? 요점은 각 선이 입자의 방황 궤적이며 모든 입자는 동일한 이항 증분 프로세스와 유한하고 동일한 수의 단계를 갖는다는 것입니다. 설정은 어떻게 변경될 수 있습니까?

물론 여기에서도 세부 사항을 원합니다.

1. "모든 입자는 동일한 이항 증분 과정을 갖는다" - 이것이 의미하는 바를 설명하십시오. 그런 과정은 처음 듣습니다. 증분분포함수란?

2. "따라서 집합체의 모든 과정은 집합체의 동일한 속성을 가지고 있습니다." - 글쎄, 이것은 또한 완전히 이해할 수 없으며 전혀 수학적이지 않습니다.

가로 좌표에 이 전체 궤적 세트의 "섹션"(예: 10000)을 그리면 각 궤적이 거기에 점을 표시합니다. 이 모든 점들이 정규 법칙에 따라 정확하게 분포되어 있다고 어떻게 확신할 수 있습니까?

 
Mathemat :

가로 좌표에 이 전체 궤적 세트의 "섹션"(예: 10000)을 그리면 각 궤적이 거기에 점을 표시합니다. 이 모든 점들이 정규 법칙에 따라 정확하게 분포되어 있다고 어떻게 확신할 수 있습니까?


중심극한정리. 고려되는 랜덤 변수는 많은 수(10000)의 독립 랜덤 변수의 합으로, 분포가 정규에 가깝습니다.
 

1. "все частицы обладают одним и тем же биноминальным процесоом приращения" - поясните, что это означает. Я впервые слышу о таком процессе. Какова функция распределения приращений?

어쩌면 내가 내 자신을 명확하게 표현하지 못했을 수도 있습니다. 이것은 이산 확률 변수(-1 및 +1)의 누적에서 차례로 얻어 짐을 의미 했습니다.

가로 좌표에 이 전체 궤적 세트의 "섹션"(예: 10000)을 그리면 각 궤적이 거기에 점을 표시합니다. 이 모든 점들이 정규 법칙에 따라 정확하게 분포되어 있다고 어떻게 확신할 수 있습니까?

이제 나는 각각의 RMS와 동일한 수의 10,000 단계가 있는 경우 이러한 포인트가 비정상적으로 분포될 수 있는 이유를 전혀 이해하지 못합니다. 실험을 설정하고 확률 적중 그래프를 작성해야 합니다. 종 모양의 상단이 0인 상태에서 정상일 것이라고 장담합니다.

 

확신한다, 아발스 .

당신의 잘못을 찾았습니다, C-4 . 사실, " 이항 증분 과정"에 대해 이해하지 못했습니다. 글쎄, 우리는 당신이 유한 m을 가진 어떤 법칙에 따라 분포된 증분을 의미한다고 가정할 것입니다. 및 분산.

 
연구의 일환으로 무작위 OHLC 주식 차트를 생성해야 했습니다. 반품에 관해서는 모든 것이 단순해 보입니다. 주어진 MO 및 분산 한계 내에서 난수를 생성합니다(Excel에서는 이러한 작업을 수행할 수 있음). 그러나 동일한 수익에서 OHLC 유형 그래프를 만드는 방법은 다음과 같습니다. 문제. 어려움은 Open 및 Close와 관련된 High 및 Low의 정상 범위를 정확하게 결정하는 데 있습니다. 따라서 전문가들에게 반품에서 OHLC를 올바르게 만드는 방법을 제안해 달라고 요청합니다. 물론 각 틱을 무작위로 생성하고 틱 기록 에서 OHLC 양초를 "수집"할 수 있지만 이것은 매우 느리고 무의미한 방법입니다.
 
C-4 : 물론, 모든 틱을 무작위로 생성하고 틱 기록에서 OHLC 양초를 "수집"할 수 있지만 이것은 매우 느리고 무의미한 방법입니다.
하지만 매우 정확하기 때문입니다. 여러 임의 매개변수의 도입이 필요하지 않습니다. 하지만 틱 과정의 통계적 특성을 알아야 할 필요가 없어지는 것은 아닙니다. :) 그리고 어떤 면에서는 위너의 것과 비슷하지도 않습니다. 예를 들어, 표준 Wiener보다 훨씬 더 반응성입니다.
 

네, 정말 정확합니다. 그러나 문제는 속도입니다. 저는 그냥 C# + WealthLab으로 작성했습니다. 이것은 매우 느린 무리입니다. 나는 각각 3000틱씩 100개의 막대를 생성하려고 시도했지만 결국 8-10초가 걸렸습니다. 그리고 최소 500,000개, 바람직하게는 3-400만 개(약 10년의 분 기록)를 생성해야 합니다.

분산, MO, 틱 수는 공식의 입력에 공급되어야 하고 출력은 OHLC 막대를 가져야 함을 알 수 있습니다. 이 같은.

첫 번째 근사치로 작업을 단순화해 보겠습니다. 완전히 "정상적인" OHLC를 생성합니다. 그것을 고전적인 규범으로 삼으십시오. 분포. 또 다른 것은 이 공식을 기반으로 실제 시장 분포에 가까운 분포를 생성하고 싶습니다. 예를 들어 상품의 실제 변동성을 가져 와서 이를 기반으로 임의의 OHLC를 생성합니다.

 
원하는 대로 하세요. 조언할 수 없기 때문에 틱 프로세스의 특성을 모르겠습니다.