Если у вас слабая на ООС модель, калибровка суммарного показателя выглядит сомнительной затеей - Общее обсуждение

mytarmailS 2023.12.24 19:51 #33541

Что такое калибровка

https://stats.stackexchange.com/questions/552146/probability-calibration-of-statistical-models

Как делать калибровку

https://www.tidymodels.org/learn/models/calibration/

https://mlr.mlr-org.com/articles/tutorial/classifier_calibration.html

Maxim Dmitrievsky 2023.12.24 19:52 #33542

Ну наконец-то.

Aleksey Vyazmikin 2023.12.24 19:52 #33543

Maxim Dmitrievsky #:
Я надеялся, что кто-нибудь хотя бы загуглит по наводке.

Даже если у вас на обучении кривые вероятности, о каких новых данных может идти речь. А бустинг и форест сильно грешат этим. Бустинг слишком самоуверен, форест недоуверен. При условии, конечно, что вообще планируете использовать порог.

Я сам наблюдал, как при увеличении порога, качество сделок не улучшается даже на трейне. Тогда вероятность чего модель возвращает? Ничего :)

На картинке Саныча самоуверенный бустинг, видно по выбросам краевых столбцов. Впадина должна быть более плавной. Это переобучения модель.

Это train - показан исход модели на диапазонах "вероятности" с шагом 0,05. CatBoost достаточно точно ставит разделение классов на 0,5 (магнетта - 1, аква - 0).

Можно видеть, что фин результат положительный начинается при 0,35 - зелёная кривая подымается над красной.

Вы именно это хотите калибровать - смещение точки разделения классов к точки получения доходов?

Алгоритм объединения диапазонов отрезка Обсуждение статьи "Метамодели в Динамическое моделирование

Maxim Dmitrievsky 2023.12.24 19:57 #33544

Aleksey Vyazmikin #:

Вы именно это хотите калибровать - смещение точки разделения классов к точки получения доходов?

Нет.

mytarmailS 2023.12.24 20:00 #33545

Ля.. Тут 30 раз спросить не лень, но раз загуглить впадлу

Aleksey Vyazmikin 2023.12.24 20:10 #33546

Maxim Dmitrievsky #:
Нет.

Тогда какая цель?

Aleksey Vyazmikin 2023.12.24 20:28 #33547

Про калибровку, думаю, все всё давно уже слышали, но практического толка в ней нет, как раз по причине не репрезентативности выборки.

Вероятностная оценка отдельных листьев, на мой взгляд, даёт более обоснованный результат, чем перевзвешивание суммы листьев модели.

Вероятность. Как сделать вывод на Ищем закономерности

Maxim Dmitrievsky 2023.12.24 20:55 #33548

Aleksey Vyazmikin #:

Про калибровку, думаю, все всё давно уже слышали, но практического толка в ней нет, как раз по причине не репрезентативности выборки.

Вероятностная оценка отдельных листьев, на мой взгляд, даёт более обоснованный результат, чем перевзвешивание суммы листьев модели.

Все все слышали, но никто ничего не ответил. Не говоря уже о других нюансах, которые не раскрыты, а только догадались что оказывается вон оно че.

А если у вас слабая (с низким матожиданием), но стабильная на ООС модель, калибровать тоже нет смысла? А если задуматься..

Повышение потолка гос. долга SSA или по-русски метод Обсуждение статьи "Графические интерфейсы

Aleksey Vyazmikin 2023.12.25 01:20 #33549

Maxim Dmitrievsky #:
Все все слышали, но никто ничего не ответил. Не говоря уже о других нюансах, которые не раскрыты, а только догадались что оказывается вон оно че.

А если у вас слабая (с низким матожиданием), но стабильная на ООС модель, калибровать тоже нет смысла? А если задуматься..

Сейчас пришла идея о постоянной каллибровке, с каким то весом - нечто типа EMA для каждого интервала. Тогда хоть будет эффект адаптации под изменчивость рынка и устаревание модели.

В статичной калибровке на каких то отдельно взятых данных - не вижу смысла. На своих предикторах я исследовал вопрос устойчивости статистических показателей, и таких мало, и модель кишит такими непостоянными предсказателями. Поэтому я и ищу устойчивость, к которой можно будет применять нечто подобное...

На скрине выше я показал модель в разрезе - можете видеть, какой низкий Recall по краям обычно, что уже говорит о не равных статистических показателях для того же взвешивания, а зачастую их будет недостаточно, что бы как то точно говорить, даже в теории, об устойчивости в этом диапазоне "вероятности". Поэтому и с этой точки зрения калибровка суммарного показателя выглядит сомнительной затеей.

Меня больше занимает идея перевзвешивания значений в листьях, впрочем, я уже писал ранее об этом, но обратной связи не получил тут - поэтому всё сам - да сам...

Есть ли закономерность в Предсказание рынка на основе Использование .NET, или как

Maxim Dmitrievsky 2023.12.25 07:03 #33550

Опять какие-то новые определения.

Последний раз: классификатор калибруется потому, что на выходе он отдает некорректные вероятности. Они бессмысленные в изначальном виде. Переспите с этим.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3355