Maxim Dmitrievsky #: 모두가 모든 것을 들었지만 아무도 대답하지 않았습니다. 드러나지 않은 다른 뉘앙스는 말할 것도 없고, 이것으로 밝혀졌다고 추측할 뿐입니다.
그리고 약하지만 (기대치가 낮지 만) OOS 모델에서 안정적이라면 보정하는 것도 의미가 없습니까? 그리고 당신이 그것에 대해 생각한다면.
이제 저는 각 간격마다 EMA와 같은 약간의 가중치를 사용하여 일정한 보정에 대한 아이디어를 생각해 냈습니다. 그러면 적어도 시장 변동성과 모델 노후화에 대한 적응 효과가 있을 것입니다.
일부 개별 데이터에 대한 정적 보정은 의미가 없다고 생각합니다. 예측 지표에 대해 통계 지표의 안정성 문제를 조사했는데 그러한 지표가 거의 없으며 모델에는 그러한 불규칙한 예측 지표로 가득 차 있습니다. 그래서 저는 이와 같은 것을 적용 할 수있는 안정성을 찾고 있습니다.....
위의 스크린 샷에서 섹션의 모델을 보여 드렸습니다. 가장자리의 리콜이 일반적으로 얼마나 낮은 지 알 수 있으며, 이는 이미 동일한 가중치에 대해 동일한 통계적 측정이 아니라는 것을 이미 말하고 있으며 종종 이론적으로도이 "확률"범위의 안정성에 대해 이야기하기에 충분하지 않을 것입니다. 따라서 이러한 관점에서 볼 때도 합계를 보정하는 것은 모호한 아이디어처럼 보입니다.
나는 잎의 값에 가중치를 부여하는 아이디어에 더 관심이 있지만 이전에 그것에 대해 썼지 만 여기에서 피드백을받지 못했기 때문에 모두 내 자신의 것입니다....
누군가 구글에서 이 팁을 찾아주길 바랐습니다.
0.05단계의 '확률' 범위에 대한 모델의 결과를 보여줍니다. CatBoost는 클래스 구분을 0.5로 매우 정확하게 설정합니다(마그넷타는 1, 아쿠아는 0).
지느러미 결과가 0.35부터 양수인 것을 볼 수 있습니다. 녹색 곡선이 빨간색 곡선 위로 올라갑니다.
클래스 분리 지점을 수익 창출 지점으로 이동하여 보정하려는 것이 이 보정의 목적인가요?
등급 구분 지점을 소득 창출 지점으로 옮기는 것이 바로 여러분이 보정하고자 하는 것이 맞나요?
아니요.
그렇다면 목적은 무엇인가요?
누구나 보정에 대해 들어봤을 것 같지만 샘플이 대표성이 없기 때문에 실용적이지 않습니다.
제 생각에는 개별 잎의 확률적 추정이 모델의 잎 합계에 가중치를 부여하는 것보다 더 합리적인 결과를 제공합니다.
캘리브레이션에 대해 들어본 적은 있지만, 샘플이 대표성이 없기 때문에 실제적으로 사용할 수 있는 방법은 없다고 생각합니다.
제 생각에는 개별 잎에 대한 확률적 추정이 모델의 잎 합계에 가중치를 부여하는 것보다 더 합리적인 결과를 제공합니다.
모두가 모든 것을 들었지만 아무도 대답하지 않았습니다. 드러나지 않은 다른 뉘앙스는 말할 것도 없고, 이것으로 밝혀졌다고 추측할 뿐입니다.
이제 저는 각 간격마다 EMA와 같은 약간의 가중치를 사용하여 일정한 보정에 대한 아이디어를 생각해 냈습니다. 그러면 적어도 시장 변동성과 모델 노후화에 대한 적응 효과가 있을 것입니다.
일부 개별 데이터에 대한 정적 보정은 의미가 없다고 생각합니다. 예측 지표에 대해 통계 지표의 안정성 문제를 조사했는데 그러한 지표가 거의 없으며 모델에는 그러한 불규칙한 예측 지표로 가득 차 있습니다. 그래서 저는 이와 같은 것을 적용 할 수있는 안정성을 찾고 있습니다.....
위의 스크린 샷에서 섹션의 모델을 보여 드렸습니다. 가장자리의 리콜이 일반적으로 얼마나 낮은 지 알 수 있으며, 이는 이미 동일한 가중치에 대해 동일한 통계적 측정이 아니라는 것을 이미 말하고 있으며 종종 이론적으로도이 "확률"범위의 안정성에 대해 이야기하기에 충분하지 않을 것입니다. 따라서 이러한 관점에서 볼 때도 합계를 보정하는 것은 모호한 아이디어처럼 보입니다.
나는 잎의 값에 가중치를 부여하는 아이디어에 더 관심이 있지만 이전에 그것에 대해 썼지 만 여기에서 피드백을받지 못했기 때문에 모두 내 자신의 것입니다....
https://education.yandex.ru/handbook/ml/article/veroyatnostnyj-podhod-v-ml
https://education.yandex.ru/handbook/ml/article/kak-ocenivat-veroyatnosti