트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 388

 
막심 드미트리예프스키 :


이상하게도 이미 예측 변수가 있습니다. 실생활에 있는 기성 봇이 있으며, 한 달도 채 안 되어 작성됩니다. 가장 중요한 것은 예측 변수입니다. 이것은 논의되지 않습니다. 그렇습니다. 글쎄, 누가 무엇에 대한 경험이 있는지.. 예를 들어, 내 불타오르는 상상력으로 한 번에 예측 변수를 선택하고 5 년 동안 분석가로 일했습니다 :) 예측 변수 선택은 NN 아키텍처를 공부하는 것만큼 어려운 작업이 아니라고 봅니다. , 가장 중요한 것은 앉아서 픽업하고 2-3 주를 보내는 것입니다 :)



그리고 숫자로?

훈련 샘플에서 테스트 및 검증.

가장 중요한 것은 원래 이전 세 파일과 분리된 새 파일에 있다는 것입니다.

이 네 가지 값은 모두 서로 크게 다르지 않아야 합니다. 실수로 10% 이상 차이가 나는 경우(예: 30%와 35%의 편차) 퍼니스로 이동합니다.


그리고 실생활에있는 것은 전혀 아무것도 아니며 신호가 있으며 1-2 년 안에 죽어 가고 있습니다 ...

 
산산이치 포멘코 :

그러나 증분이 어떤 식으로든 추세를 나타내지 않는다는 사실은 어떻습니까?

네, 안돼요.

모델은 증분 또는 방향을 예측합니다. 이것이 분류 모델의 목적입니다.

나는 뉴스에서 움직임을 인식할 분류 모델을 모릅니다. 그리고 GARCH의 경우 이것이 모델의 의미입니다. 즉, 발생한 움직임을 해결하는 것입니다. 뚱뚱한 꼬리 - 결국 이것은 뉴스의 움직임입니다. 추세가 깨지면 급격한 반전이 발생합니다.


그리고 다른 시간 샘플에서 증분을 볼 수 있습니다.

여러 시간대에서 작동하는 흥미로운 GARCH 모델이 있습니다. 의미는 이것입니다.

H1의 증분을 예측한다고 가정합니다. 모델에는 분포를 특성화하는 입력 데이터가 필요합니다. 이러한 입력 데이터(보통 변동성)로 이전 시간이 아니라 현재 시간 내의 분을 사용합니다.

제 생각에는 전체 스토리를 동일한 동작을 가진 섹션으로 나누는 것이 중요합니다. 예를 들어, 여기에 5년 동안 EURUSD의 당일 종가가 있습니다. 14의 2/4분기까지 하나의 추세가 있었고 나머지 14 및 15의 시작이 다른 추세임을 알 수 있습니다. , 그리고 그 이후에 시작되어 오늘날까지 계속되고 있는 세 번째 것입니다. 병원의 평균 온도를 얻으려고 시도하는 것과 같이 하나의 힙에 있는 모든 것을 방해하고 이를 기반으로 단일 환자의 상태를 진단하는 것 - IMHO는 잘못되었습니다.


예를 들어 15일 초부터 현재까지의 현재 추세를 취하고 최소한 추세, 정기 간행물을 강조 표시/외삽하면 IMHO는 상당히 그럴듯한 결과를 얻습니다. 여기 그림이 있습니다. 녹색은 다음 몇 주 동안의 종가 예측입니다.


 
산산이치 포멘코 :


그리고 숫자로?

훈련 샘플에서 테스트 및 검증.

가장 중요한 것은 원래 이전 세 파일과 분리된 새 파일에 있다는 것입니다.

이 네 가지 값은 모두 서로 크게 다르지 않아야 합니다. 실수로 10% 이상 차이가 나는 경우(예: 30%와 35%의 편차) 퍼니스로 이동합니다.


그리고 실생활에있는 것은 전혀 아무것도 아니며 신호가 있으며 1-2 년 안에 죽어 가고 있습니다 ...


숫자로 따지면 괜찮아, 쓸데없는 샘플이 그렇게 많이 필요하지 않아, 이 정도면 훈련과 테스트에 충분하고, 매개변수는 GA를 통해 선택한 다음, 앞뒤로 최대한 비슷한 결과를 선택한다. . 당신은 호가의 전체 기록에 대한 모델을 훈련하지 않을 것이며 최대 3개의 독립적인 기간을 제공하고 4일에 거래하는 것은 시장에서 거래하는 경우 완전히 넌센스이기 때문입니다. 이 기간 동안 시장이 바뀝니다. 따라서 훈련 샘플 외부 영역에서 모델이 과적합되지 않았는지 확인하는 것으로 충분합니다.

나는 매주 재훈련을 하고 두 번째 주는 가치가 + 35%입니다. 실생활에서 그것은 실제 돈에 관한 것입니다)

 
산산이치 포멘코 :

그리고 실생활에있는 것은 전혀 아무것도 아니며 신호가 있으며 1-2 년 안에 죽어 가고 있습니다 ...

진심으로 앞으로 몇 년 동안 시장 모델을 만들고 싶습니까?
 
막심 드미트리예프스키 :


이상하게도 이미 예측 변수가 있습니다. 실생활에 있는 기성 봇이 있으며, 한 달도 채 안 되어 작성됩니다. 가장 중요한 것은 예측 변수입니다. 이것은 논의되지 않습니다. 그렇습니다. 글쎄, 누가 무엇에 대한 경험이 있는지.. 예를 들어, 내 불타오르는 상상력으로 한 번에 예측 변수를 선택하고 5 년 동안 분석가로 일했습니다 :) 예측 변수 선택은 NN 아키텍처를 공부하는 것만큼 어려운 작업이 아니라고 봅니다. , 가장 중요한 것은 앉아서 픽업하고 2-3 주를 보내는 것입니다 :)

어떤 예측 변수를 사용하는지 알려주실 수 있습니까?
 
막심 드미트리예프스키 :


숫자로 따지면 괜찮아, 쓸데없는 샘플이 그렇게 많이 필요하지 않아, 이 정도면 훈련과 테스트에 충분하고, 매개변수는 GA를 통해 선택한 다음, 앞뒤로 최대한 비슷한 결과를 선택한다. . 당신은 호가의 전체 기록에 대한 모델을 훈련하지 않을 것이며 최대 3개의 독립적인 기간을 제공하고 4일에 거래하는 것은 시장에서 거래하는 경우 완전히 넌센스이기 때문입니다. 이 기간 동안 시장이 바뀝니다. 따라서 훈련 샘플 외부 영역에서 모델이 과적합되지 않았는지 확인하는 것으로 충분합니다.

나는 매주 재훈련을 하고 두 번째 주는 가치가 + 35%입니다. 실생활에서 그것은 실제 돈에 관한 것입니다)

샘플을 희생하면 더 잘 알 수 있습니다.
 
팬츄럴 :
어떤 예측 변수를 사용하는지 알려주실 수 있습니까?
나 혼자 여기에서 회귀선의 기울기 값을 이미 설명했고 심지어 봇의 예를 버리고 나머지는 비밀입니다. :)
 
이반 네그레쉬니 :
진심으로 앞으로 몇 년 동안 시장 모델을 만들고 싶습니까?

물론 아닙니다.

나는 미래에 대한 보장을 받기 위해 바쁩니다.

 
막심 드미트리예프스키 :


숫자로 따지면 괜찮아, 쓸데없는 샘플이 그렇게 많이 필요하지 않아, 이 정도면 훈련과 테스트에 충분하고, 매개변수는 GA를 통해 선택한 다음, 앞뒤로 최대한 비슷한 결과를 선택한다. . 당신은 호가의 전체 기록에 대한 모델을 훈련하지 않을 것이며 최대 3개의 독립적인 기간을 제공하고 4일에 거래하는 것은 시장에서 거래하는 경우 완전히 넌센스이기 때문입니다. 이 시간 동안 시장이 바뀝니다. 따라서 훈련 샘플 외부 영역에서 모델이 과적합되지 않았는지 확인하는 것으로 충분합니다.

나는 매주 재훈련을 하고 두 번째 주는 +35%의 가치가 있습니다. 실생활에서 그것은 실제 돈에 관한 것입니다)

저도 2개 가지고 있습니다.

첫 번째 섹션: 3개의 샘플이 무작위로 만들어지고 이에 대한 학습-테스트-테스트가 이루어집니다. 첫 번째 섹션에 이어지는 마지막 섹션은 여기에서 가급적 테스터에 의해 순차적으로 실행됩니다.

나는 전에 여러 번 썼지만 완전히 잊어 버렸습니다.

위의 단계는 두 번째 단계입니다.

첫 번째 단계는 대상 변수와 "관련된" 예측 변수를 선택 하는 것입니다. 나는 목표 변수인 노이즈와 아무 관련이 없는 예측자가 우세한 예측자 세트에 의해 매우 좋은 결과가 제공된다는 것을 증명할 수 있습니다. 훈련 중 소음으로 매우 좋은 결과를 얻을 수 있습니다. 게다가 위에서 언급한 세 부분의 첫 번째 섹션에서 10% 미만, 최대 3%의 오류를 얻었습니다! 그리고 두 번째 섹션에서 완전히 임의의 오류가 발생했습니다.

노이즈 예측자를 필터링하기 시작하면 오류는 훈련 중에 증가하지만 두 번째 섹션에서는 감소합니다. 노이즈 예측자를 제거하면 거의 동일한 오류 값을 얻습니다. 내 예측 변수 집합에서 30% 미만

 
기계를 훈련할 필요가 없습니다. 우선 수익성 있는 거래를 위해서는 가장 높은 권력층에 철심과 인맥이 있어야 합니다.