베이지안 회귀 - 이 알고리즘을 사용하여 Expert Advisor를 만든 사람이 있습니까? - 페이지 35

 

뭐, 또 부족해????

글쎄, 더 많은 것을 위해:

종속: AUDNZD 배수 R = .83469441 F = 3845.556

R?= .69671476 df = 1.1674

아니요. 경우의 수: 1676 조정 R?= .69653358 p = 0.000000

추정치의 표준 오차: .053321255

절편: 6.047516031 Std.Error: .0782142 t(1674) = 77.320 p = 0.0000


 

머리 속의 체크리스트:

종속: NZDCAD 다중 R = .87619213 F = 5532.591

R?=.76771265df =1.1674

아니요. 경우의 수: 1676 조정 R?= .76757389 p = 0.000000

추정치의 표준 오차: .032035522

절편: -2.664033151 Std.Error: .0469913 t(1674) = -56.69 p = 0.0000


 
Дмитрий :

이미 R^2가 "매우 낮음"입니까?

관계가 존재합니까?

관계가 확인되지 않았습니다. R은 약하다. 나는 나 자신이 내 전략의 형평성을 평가할 때 매우 적극적으로 R2를 사용했고, 여기에서 제시된 것과 거의 동일한 R2를 가진 수백 개의 차트를 충분히 보았습니다. 이 완전한 주석은 SB와 구별할 수 없습니다.

 
Vasiliy Sokolov :

관계가 확인되지 않았습니다. R은 약하다. 나는 나 자신이 내 전략의 형평성을 평가할 때 매우 적극적으로 R2를 사용했고, 여기에서 제시된 것과 거의 동일한 R2를 가진 수백 개의 차트를 충분히 보았습니다. 이 완전한 주석은 SB와 구별할 수 없습니다.

)))))))))))))))))))))))))))))) 0
 

R-project에서 다음 작업을 수행한 것을 기억합니다. 각각 천 개의 측정값이 있는 천 개의 무작위 시장 궤적을 생성했습니다. 그런 다음 각각에 대해 선형 회귀 를 던지고 R ^ 2를 얻었습니다. 결과적으로 R^2 값의 결과 벡터는 0에서 0.99까지 균일하게 분포된 값으로 밝혀졌습니다. 평균은 약 0.5입니다. 나는 모든 사람들이 내가 얻은 결과를 반복하고 우리가 믿는 것의 본질에 대해 생각하도록 초대합니다.

추신 R이나 이러한 코드가 모두 가까이 있지 않은 것이 유감입니다. 그래서 한 장의 사진은 천 마디 말의 가치가 있습니다 ...

 
Vasiliy Sokolov :
R-project에서 다음 작업을 수행한 것을 기억합니다. 각각 천 개의 측정값이 있는 천 개의 무작위 시장 궤적을 생성했습니다. 그런 다음 각각에 대해 선형 회귀 를 던지고 R ^ 2를 얻었습니다. 결과적으로 R^2 값의 결과 벡터는 0에서 0.99까지 균일하게 분포된 값으로 밝혀졌습니다. 평균은 약 0.5입니다. 나는 모든 사람들이 내가 얻은 결과를 반복하고 우리가 믿는 것의 본질에 대해 생각하도록 초대합니다.

그리고?

쓰여진 것의 의미는 무엇입니까? 생성된 PRNG 계열의 n번째 수 중 하나가 큰 R^2를 나타낼 수 있다는 이유로 회귀 분석을 사용해서는 안 됩니다.

따라서 수학적 통계와 예측의 모든 방법을 버려야합니다.

 
Vasiliy Sokolov :

나는 적용 가능성의 원칙에 대한 완전한 오해의 배경에 대해 토론 참가자의 수학적 방법에 대한 높은 수준의 숙달에 놀랐습니다. 모든 회귀는 관련 데이터를 분석합니다. 관계가 없으면 회귀를 적용할 수 없습니다. 연구량의 분포가 정규분포와 다른 경우에는 모수통계법도 적용할 수 없다. 시장에는 정상성의 속성이 없습니다. 또한 시장은 과정으로서 시간에 의존하지 않습니다. 그것과 다른 것은 그것이 근본에 무엇이 있든 회귀 분석의 바로 그 아이디어를 지웁니다.

문제는 당신을 포함한 많은 참가자들이 회귀의 본질을 이해하지 못하고 어디에서 기억하지 못하는 정의를 사용한다는 것입니다. 회귀 분석의 올바른 정의에는 오류 분포에 대한 제한이 없습니다. 중요한 것은 전체 회귀 오류가 개별 오류 함수의 합으로 표시될 수 있도록 오류가 통계적으로 서로 독립적이어야 한다는 것입니다. 다른 모든 것은 회귀의 특별한 경우입니다. 예를 들어, 오류 정규성 요구 사항은 평균 제곱 회귀에만 적용됩니다. 총 회귀 오류가 개별 오류의 제곱의 합으로 표시되는 경우. 이것은 선형 방정식 시스템의 솔루션으로 이어지기 때문에 회귀하는 가장 간단한 방법입니다. 오류의 정규성에 대해 가정하지 않으려면 다른 분포를 사용하십시오. 제곱합 대신 총 오차는 다른 개별 오차 함수의 합이 됩니다.

나는 이것을 이렇게 설명하려고 노력할 것이다. 측정값 y와 입력 데이터 x가 있다고 가정해 보겠습니다. x에서 y의 그래프를 작성해 보겠습니다. 점 y(x)는 일종의 구름을 형성합니다. 이 구름이 모든 방향에서 균일한 밀도의 점으로 둥글면 오류 분포로 아무리 비틀고 비틀어도 y와 x는 독립적이므로 모델 y(x)는 존재하지 않습니다. 이 구름이 어떤 방향으로 늘어나면 모델을 만들 수 있습니다. 이 경우 몇 가지 모델을 선택할 수 있습니다.

1. 선형 y_mod(x) = a + b*x 또는 비선형 y_mod(x) = F(x) = example = a0 + a1*x + a2*x^2 +... 모델을 만듭니다.

2. 측정 오류 e[i] = y[i] - y_mod[i]의 독립성을 가정하고 정규성 err_sum = SUM e[i]^2 또는 이상 err_sum = SUM G(e[i])라고 가정합니다. 여기서 G () "비제곱" 함수, 예를 들어 G(e) = |e| 또는 일반적으로 G(e) = |e|^p입니다. 예를 들어 y[i]의 음수 값에 더 많은 가중치가 부여되는 오류 함수를 왜곡하고 만들 수 있습니다. 우리가 선택하는 G(e)는 x의 함수로서 y의 예측 가능성에 영향을 미치지 않습니다. y(x) 구름을 통해 직선을 그리는 방법에만 영향을 줍니다. 예를 들어, G(e) = e^10이면 이 선은 y의 더 큰 값에 더 가깝습니다.

선형 y_mod(x) = a + b*x 또는 다항식 y_mod(x) = a0 + a1*x + a2*x^2 +... 모델의 선택은 길쭉한 구름의 모양에 따라 다릅니다. 두 경우 모두, 제곱 평균 제곱근 회귀를 사용할 수 있으며, 이는 신속하게 풀 수 있는 선형 방정식 시스템으로 이어집니다.

이제 시간에 대해 이야기해 봅시다. y(t)와 x(t)가 시간에 의존하는 경우. 회귀의 거의 모든 경우에 발생하는 것은 측정이 다른 시점에서 수행되기 때문에 문제의 본질을 변경하지 않는다는 것입니다. 이전과 마찬가지로 회귀 y(t) = F(x(t))에 대해 이야기할 수 있습니다. 함수 y(t) = F(x(t))가 시간에 의존하는 경우, 즉 y(t) = F(x(t),t)인 경우 전체 시간 간격에 대한 정적 회귀 y=F(x)를 적용할 수 없습니다. 동적 모델 y=F(x,t)를 사용해야 합니다.

 
Vladimir :
수학자 중 한 사람의 연구에 따르면(그의 성은 기억나지 않습니다. 그는 FINAM에서 일합니다), 분포는 꼬리가 길어 정상에 가깝습니다(그러나 이것이 이해할 수 있는 이유입니다). 그래서 선형 회귀 , IMHO는 꽤 바위입니다.
 
Yuriy Asaulenko :
수학자 중 한 사람의 연구에 따르면(그의 성은 기억나지 않습니다. 그는 FINAM에서 일합니다), 분포는 꼬리가 길어 정상에 가깝습니다(그러나 이것이 이해할 수 있는 이유입니다). 그래서 선형 회귀 , IMHO, 꽤 바위입니다.
다양한 오류 분포를 시도했습니다. 결과에서 특별한 차이를 느끼지 못했으며 계산 시간만 크게 늘어납니다. 그래서 제곱 평균 제곱근 회귀를 사용합니다. 함수 y(x)가 x에서는 비선형일 수 있지만 모델 계수에서는 선형일 수 있기 때문에 선형이라고 부르기가 두렵습니다. 이 경우 평균 제곱근 회귀는 여전히 눈에 띄는 계산 가속을 제공합니다. 정규성과 회귀에 대한 적용 가능성 이론에 너무 많은 시간을 소비하는 대신 이 y(x) 클라우드를 끌어내거나 x 입력의 간단한 변환으로 둥글게 만들 수 있도록 입력 데이터를 준비하는 것에 대해 이야기하는 것이 훨씬 더 중요합니다. 및 y 차원. 이 구름을 통해 직선이나 포물선을 그리고 시뮬레이션 오류(제곱 또는 절대값으로)를 계산하는 방법은 부차적인 문제입니다.
 

저는 회의론자들과 이야기하고 있습니다.

신사 숙녀 여러분, 신사 숙녀 여러분, 동지 여러분! 알코올 순환계에 혈액이 너무 많습니다. (C)

Bayes 공식에 대한 개념적 질문을 결정하지 않은 경우 R에서 수학적으로 모델링할 수 있는 것은 무엇입니까? 0 막대 오른쪽에 있는 시장은 무엇입니까? 그리고 시장은? 아니면 적절한 알고리즘을 갖춘 좋은 게임 시뮬레이터일까요? 어떤 분포와 우도 함수를 취할 것인가?

예, 빛은 정규 분포의 쐐기처럼 수렴하지 않았습니다. Bayes는 Gauss가 태어났을 때 이미 사망했습니다. 나는 회의론자인 당신이 이것을 설득력 있게 보여주었기 때문에 증분의 정규 분포를 취하는 것을 제안했습니다. 그리고 회의론자인 당신이 어떤 것이 적합하지 않거나 적용되지 않는다고 말하면 이미 제안된 것 외에 적용 가능한 것을 제안하십시오. 예를 들어, 내가 꽃다발 아래 3월 8일자 포스트의 31페이지에서 설명한 대로 확률 함수인 분포 법칙을 Bayes 공식으로 대체할 수 있습니다. 그리고 무슨 일이 일어나는지 보십시오.