트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 179

 
트레이더 박사 :


PCA 구성 요소 분석을 말하는 것입니까, 아니면 다른 것입니까? 여기에 게시 한 모든 예가 기억나지 않습니다. :)

PCA에 관한 경우 - 쓰레기의 사탕은 여전히 작동하지 않습니다. 아주 좋은 예측 변수와 나쁜 예측 변수를 섞어야 PCA가 좋은 예측 변수를 제거할 수 있습니다.

당신은 경험의 긍정적인 결과를 과소평가합니다. 성배가 없습니다. 그리고 재훈련과 같은 악과 싸울 수 있는 포괄적인 도구가 있습니다.

맨 처음 단계에서 완전히 솔직한 쓰레기를 제거해야합니다. 재교육에 결정적인 영향을 미치는 사람은 바로 그 사람입니다. 그리고 이 첫 번째 단계에서 PCA는 매우 유용합니다. 이 단계가 끝나면 대상 변수와 관련된 예측 변수는 남고 모든 환상은 사라집니다. 그러나이 단계의 중요성을 과대 평가하지 마십시오. 이것이 첫 번째 단계입니다. 그 후에는 다음 단계가 필요합니다.

  • 각 훈련 전에 rfe
  • 각각의 새 막대 (이상적으로는) 또는 주말에 모델을 재교육합니다.

그리고 PCA에 대한 귀하의 경험은 매우 유용할 것입니다.

추신.

나는 모델 자체로 작업하는 것에 대해 의도적으로 침묵을 지켰습니다.

 
산산이치 포멘코 :

당신은 경험의 긍정적인 결과를 과소평가합니다. 성배가 없습니다. 그리고 재훈련과 같은 악과 싸우기 위한 포괄적인 도구가 있습니다.

맨 처음 단계에서 완전히 솔직한 쓰레기를 제거해야합니다. 재교육에 결정적인 영향을 미치는 사람은 바로 그 사람입니다. 그리고 이 첫 번째 단계에서 PCA는 매우 유용합니다. 이 단계가 끝나면 대상 변수와 관련된 예측 변수는 남고 모든 환상은 사라집니다. 그러나이 단계의 중요성을 과대 평가하지 마십시오. 이것이 첫 번째 단계입니다. 그 후에는 다음 단계가 필요합니다.

  • 각 훈련 전에 rfe
  • 각각의 새 막대 (이상적으로는) 또는 주말에 모델을 재교육합니다.

그리고 PCA에 대한 귀하의 경험은 매우 유용할 것입니다.

추신.

나는 모델 자체로 작업하는 것에 대해 의도적으로 침묵을 지켰습니다.

RSA에 대해 자세히 알려주실 수 있습니까? 어떻게 쓰레기를 분류할 수 있습니까?
 
산산이치 포멘코 :

당신은 당신의 경험의 긍정적인 결과를 과소평가합니다. 성배가 없습니다. 그리고 재훈련과 같은 악과 싸우기 위한 포괄적인 도구가 있습니다.

맨 처음 단계에서 완전히 솔직한 쓰레기를 제거해야합니다. 재교육에 결정적인 영향을 미치는 사람은 바로 그 사람입니다. 그리고 이 첫 번째 단계에서 PCA는 매우 유용합니다. 이 단계가 끝나면 대상 변수와 관련된 예측 변수는 남고 모든 환상은 사라집니다. 그러나이 단계의 중요성을 과대 평가하지 마십시오. 이것이 첫 번째 단계입니다. 그 후에는 다음 단계가 필요합니다.

  • 각 훈련 전에 rfe
  • 각각의 새 막대 (이상적으로는) 또는 주말에 모델을 재교육합니다 .

그리고 PCA에 대한 귀하의 경험은 매우 유용할 것입니다.

추신.

나는 모델 자체로 작업하는 것에 대해 의도적으로 침묵을 지켰습니다.

각 막대에서 모델 재훈련.... 이것은 하나의 막대가 전체 모델에 영향을 미친다는 것을 의미합니까? 학습에서 각 막대의 중요성에 비추어 볼 때 오버트레이닝과의 끝없는 투쟁은 이해가 됩니다...
 
안드레이 딕 :
각 막대에서 모델 재훈련.... 이것은 하나의 막대가 전체 모델에 영향을 미친다는 것을 의미합니까? 학습에서 각 막대의 중요성에 비추어 볼 때 오버트레이닝과의 끝없는 투쟁은 이해가 됩니다...

내가 지금 마음에 떠올리려고 하는 모델 - 예, 나는 각각의 새로운 바에서 재교육을 받고 있습니다. 솔직히 말해서 큰 영향은 보이지 않습니다... 때때로 수십 개의 막대가 연속으로 모델이 이전과 동일하게 유지됩니다(모델 과적합으로부터 보호 메커니즘이 트리거됨). 그러나 뉴스의 일부 은행가가 잘못된 내용을 말하고 가격이 잘못된 곳으로 가면 몇 개의 막대에서 모델이 모든 최신 변경 사항을 따라 잡을 것이라는 희망이 있습니다. 바마다 모델을 커스터마이징하는 것은 말이 안되지만, 변화에 빠르게 대응할 수 있는 방법이 있다면 사용하지 않는 것이 죄입니다.

마이클 마르쿠카이테스 :
RSA에 대해 자세히 알려주실 수 있습니까? 어떻게 쓰레기를 분류할 수 있습니까?

이 스레드의 약 100페이지에서 San Sanych는 "주요 구성 요소 분석"과 같은 기사에 대한 링크를 게시했습니다. 나는 그것에 대해 몇 가지 코드를 작성했고 또한 여기에서 주제를 해킹했습니다. 그것을 찾으려면 많은 페이지를 읽어야 합니다.

또한 이 기사가 마음에 들었습니다. R 또는 MQL이 포함되어 있지 않고 Excel만 있습니다. 그러나 행동의 원리는 조금 더 명확하게 설명됩니다. http://www.chemometrics.ru/materials/textbooks/pca.htm

 
마이클 마르쿠카이테스 :
RSA에 대해 자세히 알려주실 수 있습니까? 어떻게 쓰레기를 분류할 수 있습니까?

주요 구성 요소의 작동 방식 보기

그러나 이 방법이 일부 응용 프로그램 작업에서 작동하지 않는 이유를 설명하는 darkAlert 의 흥미로운 의견도 있습니다. 나는 인용한다:

" PCA(다차원 데이터 축소의 다른 고전적인 방법과 마찬가지로)는 선형 종속성만 찾습니다 .

거래와 관련하여 이 방법은 적합하지 않습니다. 여기에서 입력에 제공되는 칠면조 및 오실레이터 값의 형태로 예측 변수의 속성은 분명히 비선형입니다.

Как работает метод главных компонент (PCA) на простом примере
Как работает метод главных компонент (PCA) на простом примере
  • habrahabr.ru
В этой статье я бы хотел рассказать о том, как именно работает метод анализа главных компонент (PCA – principal component analysis) с точки зрения интуиции, стоящей за ее математическим аппаратом. Максимально просто, но подробно. Математика вообще очень красивая и изящная наука, но порой ее красота скрывается за кучей слоев абстракции...
 

^GSPC는 http://finance.yahoo.com에서 가져왔습니다, 믿을만 하다고 생각합니다

UNRATE, PAYEMS, GDP는 FRED(아마도 https://fred.stlouisfed.org/)에서 가져옵니다. 그러면 경고에 감사드립니다.

일반적으로 나중에 시간 유로화에 시도하는 것이 좋습니다.

*누군가가 무언가를 문지르면 이러한 모든 상태 지수가 때때로 재계산되어 역사적 가치를 변경한다는 사실에 대한 응답이었습니다.

 
마법사_ :
가능하지만 말하지 않겠습니다.
유의성은 분산에 도입된 가중치에서 계산됩니다. 그게 다야. 사용할지 말지
치수를 줄여야하는지 여부, 아이를 물로 버릴 수 있는지 여부,
어쨌든 적용하거나 전처리 ... 다른 질문 ...

전처리를 별로 하지 않는데 일부 데이터가 삭제되면서 윙윙거리지 않는 것 같아요..... 차량의 각 신호를 지우지 않고 줘야 하기 때문입니다. 출력 변수를 입력으로 캐스팅하는 한 가지 아이디어가 있습니다. 그러한 일부, 피팅의 일부 요소 :-) 하지만

출력 변수가 차량의 이익 금액에 의해 조절된다는 점을 고려하면 이 매개변수를 변경하여 입력 데이터의 품질을 최소한 알아낼 수 있습니다. 흠 .... 설명하겠습니다. 출력 변수를 선택하는 철학이 있습니다. 간단한 예는 두 개의 신호가 있다는 것입니다.

이익 파란색 1핍. 설치 조건에서 50핍 이상의 신호는 1로 표시해야 한다고 말씀드렸습니다. 이 파란색 신호는 0으로 표시되지만 시장 자체는 상승 추세에 있고 이 파란색 신호는 1로 표시될 수 있습니다. 이익 매개변수를 조정하여 최대 일반화 능력을 얻기 위해 출력 세트에서 추가 매개변수를 켜고 끕니다. 이것은 100핍 플랫 스프레드를 뺀 범위에서 수행할 수 있습니다. 무차별 대입 방법으로 이것은 10 단계로 최소 10 번은 최적화를 실행 해야 하는 기간을 피펫팅하는 것입니다. 일반적으로 질문은 열려 있습니다.

 
마이클 마르쿠카이테스 :
RSA에 대해 자세히 알려주실 수 있습니까? 어떻게 쓰레기를 분류할 수 있습니까?

나는 이 스레드에서 당신을 위한 링크를 찾는 것이 너무 게으를 뿐만 아니라 필요하지도 않습니다.

이 스레드를 통해 볼 수 있도록 친절하십시오. 마찬가지로 PCA는 쓰레기를 걸러내지 않습니다. 미묘한 차이가 있습니다. 따라서 보는 것이 합리적입니다.

 
Dr.Trader :

내가 지금 마음에 떠올리려고 하는 모델 - 예, 나는 각각의 새로운 바에서 재교육을 받고 있습니다. 솔직히 말해서 큰 영향은 보이지 않습니다... 때때로 수십 개의 막대가 연속으로 모델이 이전과 동일하게 유지됩니다(모델 과적합으로부터 보호 메커니즘이 트리거됨). 그러나 뉴스의 일부 은행가가 잘못된 내용을 말하고 가격이 잘못된 곳으로 가면 몇 개의 막대에서 모델이 모든 최신 변경 사항을 따라 잡을 것이라는 희망이 있습니다. 바마다 모델을 커스터마이징하는 것은 말이 안되지만, 변화에 빠르게 대응할 수 있는 방법이 있다면 사용하지 않는 것이 죄입니다.


나는 나에게 분명한 한 가지 생각을 밀어붙이기 위해 이런 식으로 여러 번 시도합니다. 작은 오류가 있는 과적합되지 않은 모델을 얻는 데 사용할 수 있는 단일 도구는 없습니다.

한 번에 한 알갱이: 그들은 명백한 쓰레기를 청소하고, 크기를 조정했습니다. 아마도 Woh-Soh, 예측 변수를 선택하고 모델을 집어 들었습니다. 그런 다음 대상이 그냥 완전 개소리....

제 연습에서는 말 그대로 각 단계에서 마이너스에 3-5%의 오차가 있습니다. 그리고 초기에 모델이 40% 이상의 오류를 제공하고 다시 학습된 경우 재학습되지 않은 모델을 20%로 이동하는 것이 가능했습니다. 약 6개월의 작업.

 

여기 MQL 전문가가 있나요???? 우리 모두 여기 있기 때문에 :-)

옵션을 알려주세요. 한 변수를 최적화하여 다른 변수가 0이 되도록 하려면 어떻게 해야 합니까 ???? 글쎄, 또는 제로를 열망하는 .....

일반적으로 최적화는 다른 변수에 따라 가변적입니다....

사유: