트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1532

 
알렉세이 니콜라예프 :

또는 롤링 목록 시스템의 포트폴리오와 같은 것입니다.

정확히 무엇을 계산합니까?

 
알렉세이 니콜라예프 :

또는 롤링 리스트 시스템의 포트폴리오와 같은 것.

다음은 다중 클래스입니다. 현재 거래하는 것이 더 나은 시트를 선택할 두 번째 모델을 만드십시오. 이점은 명확하지 않고 만들기가 더 어렵습니다.

 
막심 드미트리예프스키 :

자, 이론부터 시작하겠습니다. 예를 들어 판매용 모델과 구매 모델을 따로 선택하는 것이 무슨 의미가 있을까요?

구매 - 판매가 아닌 모든 것, 그리고 그 반대의 경우도 마찬가지입니다.

내 이념은 기본 거래 전략을 개선하는 것이며 전략이 추세이므로 처음부터 역전을 제공하지 않습니다. 플랫에서 시장 진입 및 "입력하지 않음"은 본질적으로 잘못된 플랫 브레이크아웃을 제거합니다.

또한 긴 ZZ 세그먼트의 정점 주변에서 수익성 있는 포지션을 청산하는 모델을 실험했지만 결과가 만족스럽지 않습니다. 예측 능력이 낮거나 예측자가 잘 작동하지 않거나 둘 다일 수 있으므로 반전 전략을 사용하지 않습니다. 오히려 여기에서 서로 다른 두 가지 모델을 훈련시키는 것이 더 낫다고 생각합니다.

막심 드미트리예프스키 :

더 높은 임계값을 통해 입력을 필터링할 수 있을 때. "거래 금지" 클래스는 모델에 의해 과도한 가중치가 부여될 수 있으며, 이로 인해 모델의 오류가 줄어들고 일반적으로 예측(일반화) 능력이 저하됩니다.

저는 CatBoost를 사용한 실험에서 모델의 임계값에 의해 결정되는 거래/거래하지 않기 위해 이진 분류와 함께 거의 그러한 접근 방식을 사용하지만 문제는 모델이 진공 청소기는 좋고 나쁨을 가리지 않고 모든 것을 빨아들입니다. 그리고 출력에서 나는 활발할 수 있지만 입력의 수가 적은 모델을 얻습니다.

막심 드미트리예프스키 :

두 번째 모델의 의미는 첫 번째는 첫 번째 및 두 번째 종류의 오류(가양성 및 위음성)가 있다는 것입니다. 우리는 그것들을 제거하는 데 관심이 있습니다. 이를 위해 두 번째 모델의 입력에 동일한 기능을 제공하고 첫 번째 모델의 거래 결과가 출력됩니다. 여기서 0 - 거래가 수익성이 있었고 1 - 거래가 수익성이 없었습니다. 두 번째 분류기를 훈련하고 0이 표시될 때만 거래합니다. 첫 번째 모델의 신호를 필터링합니다. 수익성이 없는 거래는 기차에서 거의 사라질 것이므로 테스트에서 테스트해야 합니다. 바로 지금입니다.

두 번째 모델은 기차에서 훈련할 수 있을 뿐만 아니라 OOS도 캡처할 수 있습니다. 그러면 새 데이터에 대한 트랜잭션이 수정됩니다. 이 두 가지입니다. 자, 그럼 테스트.

그래서 그것이 내가 한 일입니다. 연결이 끊긴 예측자를 사용하지 않고 이미 시트를 예측자로 사용했습니다. 여기서 1은 예측자에 있는 시트의 신호이지만 대상에서는 올바른 분류 답변입니다. 물론 내 방법은 새로운 예측자 관계를 찾는 것을 허용하지 않지만 기존 관계 간의 관계를 찾는 것은 허용합니다.

방법을 시도해 보겠습니다. 감사합니다. 하지만 이 개념에서는 CatBoost 모델의 형태로만 구현될 수 있는데, 분명히 시간을 절약하기 위해 모든 것을 다시 잘라낼까 두렵습니다.

 
막심 드미트리예프스키 :

다음은 다중 클래스입니다. 현재 거래하는 것이 더 나은 시트를 선택할 두 번째 모델을 만드십시오. 이점은 명확하지 않고 만들기도 어렵습니다.

아니요, 시트가 너무 많아서 이러한 분류가 작동하지 않습니다 ...

 
알렉세이 비아즈미킨 :

내 이념은 기본 거래 전략을 개선하는 것이며 전략이 추세 이므로 처음부터 역전을 제공하지 않습니다 . 플랫에서 시장 진입 및 "입력하지 않음"은 본질적으로 잘못된 플랫 브레이크아웃을 제거합니다.

또한 긴 ZZ 세그먼트의 정점 주변에서 수익성 있는 포지션을 청산하는 모델을 실험했지만 결과가 만족스럽지 않습니다. 예측 능력이 낮거나 예측자가 잘 작동하지 않거나 둘 다일 수 있으므로 반전 전략을 사용하지 않습니다. 오히려 여기에서 서로 다른 두 가지 모델을 훈련시키는 것이 더 낫다고 생각합니다.

저는 CatBoost를 사용한 실험에서 모델의 임계값에 의해 결정되는 거래/거래하지 않기 위해 이진 분류와 함께 거의 그러한 접근 방식을 사용하지만 문제는 모델이 진공 청소기는 좋고 나쁨을 가리지 않고 모든 것을 빨아들입니다. 그리고 출력에서 나는 활발할 수 있지만 입력의 수가 적은 모델을 얻습니다.

그래서 그것이 내가 한 일입니다. 연결이 끊긴 예측자를 사용하지 않고 이미 시트를 예측자로 사용했습니다. 여기서 1은 예측자에 있는 시트의 신호이지만 대상에서는 올바른 분류 답변입니다. 물론 내 방법은 새로운 예측자 관계를 찾는 것을 허용하지 않지만 기존 관계 간의 관계를 찾는 것은 허용합니다.

방법을 시도해 보겠습니다. 감사합니다. 하지만 이 개념에서는 CatBoost 모델의 형태로만 구현될 수 있는데, 분명히 시간을 절약하기 위해 모든 것을 다시 잘라낼까 두렵습니다.

반전은 그렇게 되어서는 안 되며, 잘못된 신호는 두 번째 모델에 의해 단순히 필터링됩니다. 글쎄, 그것은 구현과 당신이 원하는 것에 달려 있습니다.

그러면 왜 잃는 거래가 많은지 이상하거나 OOS의 사진입니까? 네, 두 번째 거래 모델을 사용하려면 필터링할 항목이 많아야 합니다. 이를 위해 인위적으로 거래를 추가할 수도 있습니다(오버샘플링).

 
막심 드미트리예프스키 :

반전은 그렇게 되어서는 안 되며, 잘못된 신호는 두 번째 모델에 의해 단순히 필터링됩니다. 글쎄, 그것은 구현과 당신이 원하는 것에 달려 있습니다.

그러면 왜 잃는 거래가 많은지 이상하거나 OOS의 사진입니까? 네, 두 번째 거래 모델을 사용하려면 필터링할 항목이 많아야 합니다. 이를 위해 인위적으로 거래를 추가할 수도 있습니다(오버샘플링).

위의 스크린샷에는 어떤 식으로든 모델 학습에 참여하지 않은 데이터에 대한 테스트가 있었습니다.

다음은 교육 결과, 스크린샷입니다. 교육이 있었던 데이터에 대한 첫 번째 시트 라인업(1/5의 세그먼트만 가져옴)

수익성 있는 장기 거래는 52.86%입니다.

다른 시트의 답변에 기반한 트리를 추가했습니다.

그리고 결과는 개선되었고 수익성 있는 장기 거래는 이미 79.56%가 되었습니다.

결과적으로 접근 방식은 전체적으로 작동하지만 실제 응용 프로그램의 출력은 그리 크지 않습니다. 왜 그런가요? 아마도 교육이 수행된 일부 시트가 안정적인 연결을 제공하지 않거나 이러한 연결이 거의 없을 것입니다. 각 잎은 샘플에서 1%-3%의 영역에서 반응을 보입니다.

 
나는 또한 분류가 아닌 회귀를 시도하고 수익성이 높은 잎 조합을 선택하는 옵션을 생각합니다. 아마도 돈 측면에서 더 나은 효과가 있을 것입니다.
 
알렉세이 비아즈미킨 :

위의 스크린샷에는 어떤 식으로든 모델 학습에 참여하지 않은 데이터에 대한 테스트가 있었습니다.

다음은 교육 결과, 스크린샷입니다. 교육이 있었던 데이터에 대한 첫 번째 시트 라인업(1/5의 세그먼트만 가져옴)

수익성 있는 장기 거래는 52.86%입니다.

다른 시트의 답변에 기반한 트리를 추가했습니다.

그리고 결과는 개선되었고 수익성 있는 장기 거래는 이미 79.56%가 되었습니다.

결과적으로 접근 방식은 전체적으로 작동하지만 실제 응용 프로그램의 출력은 그리 크지 않습니다. 왜 그런가요? 아마도 교육이 수행된 일부 시트가 안정적인 연결을 제공하지 않거나 이러한 연결이 거의 없을 것입니다. 각 잎은 샘플에서 1%-3%의 영역에서 반응을 보입니다.

글쎄, 당신이 가진 것을 개선하려고한다면 이것은 접힌 변형이 있습니다. 그것을 여러 조각으로 나누고 일부 조각에서 첫 번째 조각을 훈련하고 나머지 조각에서 두 번째 조각을 훈련합니다. 500번까지 해봤습니다. 물론 더 적을 수도 있습니다. 약간의 개선을 제공합니다.

 
막심 드미트리예프스키 :

글쎄, 당신이 가진 것을 개선하려고한다면 이것은 접힌 변형이 있습니다. 그것을 여러 조각으로 나누고 일부 조각에서 첫 번째 조각을 훈련하고 나머지 조각에서 두 번째 조각을 훈련합니다. 500번까지 해봤습니다. 물론 더 적을 수도 있습니다. 약간의 개선을 제공합니다.

샘플을 분할하고 여러 모델을 훈련시키거나 무엇을 하시겠습니까?

사실, 나는 약 14,000 행만 선택했습니다 ...

 
알렉세이 비아즈미킨 :

샘플을 분할하고 여러 모델을 훈련시키거나 무엇을 하시겠습니까?

사실, 나는 약 14,000 행만 선택했습니다 ...

위에 썼습니다. 조각의 절반은 메인 모델이고 다른 절반은 두 번째 수정 사항입니다.

그런 다음 5-10 폴드로 충분합니다. 아마도 더 많을 것입니다.
사유: