거시경제 지표에 기반한 시장 예측 - 페이지 51

 
Vladimir :
동의합니다. 여기 어딘가에 직접 썼습니다. 전체 역사에서 예측 변수를 선택한 다음 동일한 역사에서 순방향 테스트를 사용하는 것은 거래자에서 과학자에 이르기까지 모든 사람이 하는 자기기만입니다. 경제 예측에 대해 작성된 많은 기사는 선택된 예측 변수 목록으로 시작한 다음 "훌륭한" 결과를 보고합니다. 트레이더는 "과거에 일했다"는 이유로 바운스 또는 브레이크 아웃과 같은 전략을 선택하고 전략 자체의 선택이 전체 역사에 대한 연구를 기반으로한다는 것을 깨닫지 않고 미래에 작동하고 과거의 앞으로 테스트를 보여주기를 바랍니다. 순방향 테스트에 대한 기록을 포함합니다. 저에게 GDP 및 시장 모델의 전방 테스트는 미래가 될 것이므로 이 스레드를 열었습니다. 예측을 게시하고 실시간으로 어떻게 실현되는지 확인합니다. 작업이 완료되지 않았습니다. 비선형 데이터 변환에 대한 많은 아이디어가 있습니다. 예를 들어, HOUST와 같은 일부 예측 변수는 일부 임계값 함수를 통해 GDP 성장에 영향을 미칩니다.

비선형성 - 예.

그리고 비선형 함수를 선택하는 방법은 무엇입니까? 다양한 옵션이 있습니까? 아니면 그냥 신경망 을 사용합니까?

 
Дмитрий :

비선형성 - 예.

그리고 비선형 함수를 선택하는 방법은 무엇입니까? 다양한 옵션이 있습니까? 아니면 그냥 신경망을 사용합니까?

Random Forest를 사용해 볼 수도 있습니다. 사용하기 쉽고 비선형성도 모델링할 수 있습니다.

예: https://www.quora.com/How-does-random-forest-work-for-regression-1

결과 함수의 형태는 내장 도구를 사용하여 추정할 수도 있습니다.

How does random forest work for regression? - Quora
  • www.quora.com
I think the first step would be to understand how decision trees work in a regression problem. You might be aware of CART - Classification and Regression Trees. When dealing with regression problem you try to predict real valued numbers at the leaf nodes which would look something like this for singular scale feature: Now the question comes how...
 
Alexey Burnakov :

Random Forest를 사용해 볼 수도 있습니다. 사용하기 쉽고 비선형성도 모델링할 수 있습니다.

예: https://www.quora.com/How-does-random-forest-work-for-regression-1

결과 함수의 형태는 내장 도구를 사용하여 추정할 수도 있습니다.

고마워 랜덤 포레스트는 나에게 친숙하다
 
Дмитрий :

비선형성 - 예.

그리고 비선형 함수를 선택하는 방법은 무엇입니까? 다양한 옵션이 있습니까? 아니면 신경망을 사용하시겠습니까?

함께 생각합시다. 간단한 단계 기능을 선택하고 싶었습니다.

out = 입력 < 임계값인 경우 -1, 입력 > 임계값인 경우 +1

여기서 임계값은 예측 변수에 따라 다른 알 수 없는 임계값입니다. 예를 들어, S&P500 및 GDP 증분 임계값 = 0, 즉 이러한 지표 자체의 하락은 일부 임계값의 억제가 아니라 중요합니다. 다른 경제 지표의 경우 그렇게 간단하지 않습니다. 임계값을 선택해야 합니다. 시뮬레이션은 다음과 같을 수 있습니다.

1. 데이터 유형 결정: 역사의 시작과 끝의 값을 비교하여 성장(S&P500, GDP,...) 또는 범위(실업률, 연준 금리,...) - 필요한 데이터를 결정하기 위한 강력한 자동 방법에 대해 생각합니다.

2. 데이터가 증가하면 x[i] - x[i-1] 증분으로 대체합니다. 범위인 경우 변경하지 마십시오.

3. 시뮬레이션된 출력, 예를 들어 GDP의 증분(성장률)을 선택하고 임계값이 0인 단계 함수를 적용합니다. GDP 성장은 바이너리 시리즈 +/-1로 대체됩니다.

4. 이런 식으로 예측 능력을 위해 모든 예측 변수와 지연 버전을 정렬하기 시작합니다. 포인트 2에 따라 예측자 또는 증분을 취하고 전체 기록에 대한 범위를 측정하고 이 범위를 예를 들어 10으로 나누고 임계값 9개를 얻습니다. 9개의 임계값을 각각 적용하여 이 예측자를 이진 계열 +/-1로 바꾸고 시뮬레이션된 계열(GDP)의 +1 및 -1과 일치하는 예측자의 +1 및 -1 수를 계산하면 다음을 얻습니다. M은 스토리의 N개의 총 막대 수 와 일치합니다. 우리는 9개 프로그램 각각에 대해 일치 빈도 M/N의 함수를 계산하고 가장 높은 일치 빈도를 제공한 임계값을 그대로 둡니다. 그리고 각 예측 변수에 대해 이것을 반복합니다. 빠른 계산이어야 합니다.

누군가 도움을 원하면 여기에 몇 페이지를 다시 넣고 시도하십시오. 지금은 선형 모델을 끝내고 비선형 모델로 넘어가고 싶습니다.

추신: S&P 500 및 GDP 증분에는 음수(-1) 값보다 양수(+1) 값이 더 많기 때문에 위의 방법을 수정하여 음수 일치에 더 큰 가중치를 두는 방법을 생각해 낼 수 있습니다. 따라서 이러한 지표의 증가보다는 하락에 초점을 맞춥니다. 예를 들어, 양호 점수는 다음과 같을 수 있습니다.

J = M(+1)/N + W*M(-1)/N

여기서 W는 GDP 성장의 음수 값이 양수 값보다 얼마나 적은지를 반영하는 가중치> 1입니다.

예측 변수가 2개 이상인 모델을 찾으려면 큰 문제가 발생합니다. 여기에서 AND, OR 또는 XOR 함수를 통해 이러한 예측 변수를 연결하는 방법에 대해 생각해야 합니다. 연결되면 임계값을 다시 최적화해야 합니다.

 
Vladimir :

예측 변수가 2개 이상인 모델을 찾으려면 큰 문제가 발생합니다. 여기에서 AND, OR 또는 XOR 함수를 통해 이러한 예측 변수를 연결하는 방법에 대해 생각해야 합니다. 연결되면 임계값을 다시 최적화해야 합니다.

그리드에 데이터를 제출하면 입력 벡터에 포함된 모든 예측 변수에 대해 "자동으로" 임계값을 즉시 찾습니다.
 
Vladimir :

누군가 도움을 원하면 여기에 몇 페이지를 다시 넣고 시도하십시오.

동일한 데이터를 csv로 변환할 수 있습니까?
 
Stanislav Korotky :
동일한 데이터를 csv로 변환할 수 있습니까?
동봉합니다. 첫 번째 열에는 1959년 1분기부터 2015년 4분기까지 matlab 형식의 날짜가 포함되어 있습니다. 나머지 열에는 변환되지 않은 경제 및 재무 수치 가 포함되어 있습니다. 1168번째 열의 GDP.
파일:
Data.zip  1037 kb
 

GDP의 선형 예측을 완료했습니다. 다음은 두 블록입니다.


모델에는 4개의 예측 변수가 있지만 3개로 충분합니다. 3-4개의 예측 변수 후에 나머지는 노이즈처럼 보입니다. GDP와 동일한 방법을 사용하여 S&P500을 예측하는 것은 잘 작동하지 않습니다. 보여주지도 않습니다. 또한 앞서 설명한 대로 비선형 단계 함수 변환을 빠르게 시도했습니다. 이것은 선형 회귀보다 더 나쁘게 작동합니다.

4월 말에 새로운 GDP 값이 발표되기를 기대합니다. 지금은 쉬고 있어요.

 
Vladimir :
동봉합니다. 첫 번째 열에는 1959년 1분기부터 2015년 4분기까지 matlab 형식의 날짜가 포함되어 있습니다. 나머지 열에는 변환되지 않은 경제 및 재무 수치가 포함되어 있습니다. 1168번째 열의 GDP.
고맙습니다. 그러나 모든 열의 이름을 갖는 것이 바람직합니다. 또한 내가 이해하는 한 날짜가 정확하게 복사되지 않았기 때문에(숫자 의 정밀도가 손실 됨) 레코드는 동일한 날짜의 11개 그룹에 있습니다.
 
Vladimir :

GDP의 선형 예측을 완료했습니다. 다음은 두 블록입니다.

그림은 아름답지만 각 단계에서 실제 변화로 예측된 변화의 곱을 대신 계산하고 전체 기간에 대해 합산하고 동일한 제품으로 나눌 수 있지만 예측 및 실제 변화는 모듈로 가져옵니다.