트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3356

 
Maxim Dmitrievsky #:
누군가 구글에서 이 팁을 찾아주길 바랐습니다.

훈련에 확률 곡선이 있더라도 어떤 새로운 데이터에 대해 이야기 할 수 있습니까? 그리고 부스팅과 포레스트는 이걸로 큰 죄를 지었어요. 버스팅은 자신감이 넘치고 포레스트는 자신감이 부족합니다. 물론 임계값을 전혀 사용하지 않는다는 전제하에 말입니다.

나는 임계 값을 높이면 훈련에서도 거래의 질이 향상되지 않는다는 것을 관찰했습니다. 그렇다면 모델이 무엇을 반환 할 확률은 무엇입니까? 아무것도 :)

Sanych의 그림에서 자신감있는 부스팅은 가장자리 열 이상값으로 볼 수 있습니다. 물마루가 더 부드러워야 합니다. 이것은 오버트레이닝 모델입니다.

0.05단계의 '확률' 범위에 대한 모델의 결과를 보여줍니다. CatBoost는 클래스 구분을 0.5로 매우 정확하게 설정합니다(마그넷타는 1, 아쿠아는 0).

지느러미 결과가 0.35부터 양수인 것을 볼 수 있습니다. 녹색 곡선이 빨간색 곡선 위로 올라갑니다.

클래스 분리 지점을 수익 창출 지점으로 이동하여 보정하려는 것이 이 보정의 목적인가요?

 
Aleksey Vyazmikin #:

등급 구분 지점을 소득 창출 지점으로 옮기는 것이 바로 여러분이 보정하고자 하는 것이 맞나요?

아니요.
 
La. 30번은 물어볼 수 있지만 구글에서 검색할 수는 없습니다.
 
Maxim Dmitrievsky #:
아니요.

그렇다면 목적은 무엇인가요?

 

누구나 보정에 대해 들어봤을 것 같지만 샘플이 대표성이 없기 때문에 실용적이지 않습니다.

제 생각에는 개별 잎의 확률적 추정이 모델의 잎 합계에 가중치를 부여하는 것보다 더 합리적인 결과를 제공합니다.

 
Aleksey Vyazmikin #:

캘리브레이션에 대해 들어본 적은 있지만, 샘플이 대표성이 없기 때문에 실제적으로 사용할 수 있는 방법은 없다고 생각합니다.

제 생각에는 개별 잎에 대한 확률적 추정이 모델의 잎 합계에 가중치를 부여하는 것보다 더 합리적인 결과를 제공합니다.

모두가 모든 것을 들었지만 아무도 응답하지 않았습니다. 공개되지 않은 다른 뉘앙스는 말할 것도없고 그것이 사실로 밝혀 졌다고 추측 할뿐입니다.

그리고 약하지만 (기대치가 낮지 만) OOS 모델에서 안정적이라면 보정하는 것도 의미가 없습니까? 그리고 당신이 그것에 대해 생각한다면.
 
Maxim Dmitrievsky #:
모두가 모든 것을 들었지만 아무도 대답하지 않았습니다. 드러나지 않은 다른 뉘앙스는 말할 것도 없고, 이것으로 밝혀졌다고 추측할 뿐입니다.

그리고 약하지만 (기대치가 낮지 만) OOS 모델에서 안정적이라면 보정하는 것도 의미가 없습니까? 그리고 당신이 그것에 대해 생각한다면.

이제 저는 각 간격마다 EMA와 같은 약간의 가중치를 사용하여 일정한 보정에 대한 아이디어를 생각해 냈습니다. 그러면 적어도 시장 변동성과 모델 노후화에 대한 적응 효과가 있을 것입니다.

일부 개별 데이터에 대한 정적 보정은 의미가 없다고 생각합니다. 예측 지표에 대해 통계 지표의 안정성 문제를 조사했는데 그러한 지표가 거의 없으며 모델에는 그러한 불규칙한 예측 지표로 가득 차 있습니다. 그래서 저는 이와 같은 것을 적용 할 수있는 안정성을 찾고 있습니다.....

위의 스크린 샷에서 섹션의 모델을 보여 드렸습니다. 가장자리의 리콜이 일반적으로 얼마나 낮은 지 알 수 있으며, 이는 이미 동일한 가중치에 대해 동일한 통계적 측정이 아니라는 것을 이미 말하고 있으며 종종 이론적으로도이 "확률"범위의 안정성에 대해 이야기하기에 충분하지 않을 것입니다. 따라서 이러한 관점에서 볼 때도 합계를 보정하는 것은 모호한 아이디어처럼 보입니다.

나는 잎의 값에 가중치를 부여하는 아이디어에 더 관심이 있지만 이전에 그것에 대해 썼지 만 여기에서 피드백을받지 못했기 때문에 모두 내 자신의 것입니다....

 
다시 몇 가지 새로운 정의가 있습니다.
마지막으로, 분류기가 잘못된 확률을 출력하기 때문에 보정됩니다. 원래의 형태로는 의미가 없습니다. 잊어버리세요.
 
캣버스타에는 공개 코드가 있으므로 이를 보고 정확히 어떤 것이 제공되고 있는지 확인할 수 있습니다.