트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 804

 
유리 아사울렌코 :

슬퍼하지 마십시오. 알고 있습니다.)) 더 편안하다고 느끼면 계속할 수 있습니다.

그리고 다른 면에서는 당신이 옳습니다.

 
알렉세이 비아즈미킨 :
초기 단계에서 데이터 선택을 위해 대상 데이터와의 상관 관계를 찾는 것으로 충분합니다. 그렇다면 어떤 상관 임계값을 사용해야 하나요?
상관 관계는 선형 방법입니다. 그것이 존재한다면 국회에서 정원을 울타리로 묶는 것은 의미가 없습니다. 선형 회귀로 충분합니다.
 
그리고리 쇼닌 :
상관 관계는 선형 방법입니다. 그것이 존재한다면 국회에서 정원을 울타리로 묶는 것은 의미가 없습니다. 선형 회귀로 충분합니다.

답변 해주셔서 감사합니다.

그리고 추가 기능을 추가하여 가장 안정적인 관계를 식별하기 위해 선형 회귀를 적용하는 방법은 무엇입니까?

 
질문을 이해하지 못했습니다. 그런데 선형 회귀 는 fin에 대해 작동하지 않습니다. 시장.
 

그리고 나는 지금 막이 뉘앙스에 대해 생각했습니다 .... 실제로.

우리는 10x10 행렬을 가지고 있습니다. 그것에 대해 무엇을 말할 수 있습니까?

데이터의 양은 100입니다. 계산됨

다음으로, 우리는 이 데이터의 정보량을 계산할 수 있으며, 이는 또한 모든 단위로 표시됩니다. 이 데이터 세트에는 데이터의 양과 정보의 양 외에 무엇이 포함되어 있습니까???? 나는 대답으로 괴로워하지 않고 스스로 대답 할 것입니다. 지식의 양. 이 모든 것은 대상과 관련하여 자연스럽습니다. 따라서 인과관계를 바탕으로 고려하면 다음과 같은 모형을 얻을 수 있다.

지식의 양 -> 데이터의 양 -> 정보의 양.

따라서 예측을 위해서는 정보의 양이 아니라 원하는 값에 대한 정확한 KNOWLEDGE를 데이터 세트에서 찾아야 합니다.

지식 자체는 부적절한 데이터 변환 으로 인해 손실될 수 있는 매우 취약한 것입니다. 한 항목의 사소한 변경이라도 완전히 제거하지 않으면 이 수치를 크게 줄일 수 있습니다.

그렇기 때문에 입력 데이터를 변환으로 복잡하게 만드는 것은 권장되지 않습니다. 변환이 복잡할수록 결국 남는 지식은 줄어듭니다.

글쎄, 그것은 너무 ... 높은 물질에 대해 큰 소리로 생각하면서 일부는 이것을 이해하지 못하고 최종 스테이션에 도달하지 않고 여행을 계속할 것입니다....

 
마이클 마르쿠카이테스 :

그리고 나는 지금 막이 뉘앙스에 대해 생각했습니다 .... 실제로.

우리는 10x10 행렬을 가지고 있습니다. 그것에 대해 무엇을 말할 수 있습니까?

데이터의 양은 100입니다. 계산됨

다음으로, 우리는 이 데이터의 정보량을 계산할 수 있으며, 이는 또한 모든 단위로 표시됩니다. 이 데이터 세트에는 데이터의 양과 정보의 양 외에 무엇이 포함되어 있습니까???? 나는 대답으로 괴로워하지 않고 스스로 대답 할 것입니다. 지식의 양. 이 모든 것은 대상과 관련하여 자연스럽습니다. 따라서 인과관계를 바탕으로 고려하면 다음과 같은 모형을 얻을 수 있다.

지식의 양 -> 데이터의 양 -> 정보의 양.

따라서 예측을 위해서는 정보의 양이 아니라 원하는 값에 대한 정확한 KNOWLEDGE를 데이터 세트에서 찾아야 합니다.

지식 자체는 부적절한 데이터 변환으로 인해 손실될 수 있는 매우 취약한 것입니다. 하나의 항목을 조금만 변경해도 완전히 제거되지 않으면이 숫자를 크게 줄일 수 있습니다.

그렇기 때문에 입력 데이터를 변환으로 복잡하게 만드는 것은 권장되지 않습니다. 변환이 복잡할수록 결국 남는 지식은 줄어듭니다.

글쎄, 그것은 너무 ... 높은 물질에 대해 큰 소리로 생각하면서 일부는 이것을 이해하지 못하고 최종 스테이션에 도달하지 않고 여행을 계속할 것입니다....

또한 이제 생각하고 숫자를 수십으로 반올림했지만 일부 데이터는 손실되지만 생각은 일반적으로 해롭고 일부는 계속 ...

 
알렉세이 비아즈미킨 :

답변 해주셔서 감사합니다.

그리고 추가 기능을 추가하여 가장 안정적인 관계를 식별하기 위해 선형 회귀를 적용하는 방법은 무엇입니까?

https://www.mql5.com/ru/articles/349

Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
Множественный регрессионный анализ: генератор стратегий и тестер в одном флаконе
  • 2011.12.07
  • ArtemGaleev
  • www.mql5.com
Один мой знакомый, посещая учебные курсы о торговле на форекс, получил домашнее задание - построить торговую систему. Повозившись с этим с недельку, он сказал, что эта задача, пожалуй, сложнее, чем написать диссертацию. Тогда я предложил ему попробовать множественный регрессионный анализ. В итоге за вечер была создана "с нуля" торговая система...
 
그리고리 쇼닌 :
질문을 이해하지 못했습니다. 그런데 선형 회귀 는 fin에 대해 작동하지 않습니다. 시장.

저것들. 상관관계가 없다? 그리고 질문은 Maxim Dmitrievsky 가 아래에 답변한 것 같습니다.

막심 드미트리예프스키 :

https://www.mql5.com/ru/articles/349

답변 해주셔서 감사합니다.

 
가격 데이터에 자동 수정 차트를 그려보면 상관 관계가 있는지 여부를 즉시 알 수 있습니다. 지표를 추가하는 것은 쓸모가 없습니다. 지표는 가격의 함수입니다. 따라서 가격 데이터만 기반으로 구축합니다.
 

교차 검증, 테스트 샘플, OOS 및 기타 게임을 좋아하는 분들을 위해 다음을 반복하는 데 지치지 않을 것입니다.

특히 SanSanych와 Vladimir Perervenko

샘플 외 테스트
이것은 가장 인기 있고 남용되는 유효성 검사 방법입니다. 간단히 말해서, out-of-sample 테스트는 전략이 개발된 후 테스트에 사용할 데이터의 일부를 따로 남겨두고 미래 성과에 대한 편견 없는 추정치를 얻어야 합니다. 그러나 샘플 외 테스트
더 작은 표본으로 인해 검정력 감소
전략이 다중 비교를 통해 개발되면 결과가 편향됨
즉, 표본 외 검정은 고유한 가설의 경우에만 유용합니다. 데이터 마이닝을 통해 개발된 전략에 대한 샘플 외 테스트의 사용은 프로세스에 대한 이해 부족을 보여줍니다. 이 경우 테스트는 전략을 거부하는 데 사용할 수 있지만 어떤 것도 수락하지 않습니다. 이러한 의미에서 테스트는 여전히 유용하지만 거래 전략 개발자는 다중 비교를 통해 개발된 전략에 대한 샘플 외의 좋은 성과가 대부분의 경우 무작위 결과라는 것을 알고 있습니다.
다중 비교 편향의 존재에 대한 표본 외 유의성을 수정하기 위해 몇 가지 방법이 제안되었지만 거의 모든 실제 사례에서 결과는 중요하지 않은 전략입니다. 그러나 Ref. 1 두 가지 주요 시장 체제에 해당하는 두 가지 예에서 편향 수정을 적용한 후에도 매우 중요한 전략은 시장 변화로 인해 실패할 수 있습니다. 따라서 표본 외 검정은 미래 수익률이 과거 수익률과 동일한 방식으로 분배되는 경우에만 미래 성과에 대한 편견 없는 추정치입니다. 즉, 비정상성은 샘플 외 테스트의 결과를 무효화할 수 있습니다.


결론: 표본 외 검정은 고유한 가설에만 적용되며 정상성을 가정합니다. 이 경우 유용하지만 이러한 조건이 충족되지 않으면 상당히 오도될 수 있습니다 .

FOS는 가설을 취소하거나 분명히 고정된 문제에만 사용할 수 있습니다.

단, 전략수색 및 기능선택 / 시스템 안정성 평가용은 아님