Вспомните пакеты, которые не выдают вероятность класса - Общее обсуждение

СанСаныч Фоменко 2023.12.24 13:15 #33511

Maxim Dmitrievsky #:
Под всем МО подразумеваются распространенные подходы и практики. Например, вы можете получить вероятности классов для бинарной классификации? Если да, ко каким образом?

Не могу сразу вспомнить пакеты, которые НЕ выдают вероятность класса. Поэтому мне казалось, что это стандарт.

Maxim Dmitrievsky 2023.12.24 13:18 #33512

СанСаныч Фоменко #:

Не могу сразу вспомнить пакеты, которые НЕ выдают вероятность класса. Поэтому мне казалось, что это стандарт.

Пакетное мышление в деле. Это не те вероятности, они так называются из-за применяемых лосс ф-й, для оценки правдоподобия.

Как получить реальные вероятности классов?

СанСаныч Фоменко 2023.12.24 13:42 #33513

Maxim Dmitrievsky #:
Пакетное мышление в деле. Это не те вероятности, они так называются из-за применяемых лосс ф-й, для оценки правдоподобия.

Как получить реальные вероятности классов?

Другого мышления не бывает! Используем готовые алгоритмы МО, которые сопровождаются набором дополнительных функций. Все вместе называется "пакетом".

Что такое "реальные вероятности классов"? Например, функция

predict(object, newdata, type = c("vector", "probs", "both","F"))

возвращает "probability class estimates". Никаких других вероятностей, кроме "оценок" алгоритм содержать не может.

Баг компилятора при параметре Что такое классы? Есть ли у Вас

Renat Akhtyamov 2023.12.24 15:26 #33514

ребятки не ссортесь, мы вас читаем

открывайте локи ;)

Maxim Dmitrievsky 2023.12.24 15:43 #33515

СанСаныч Фоменко #:

Другого мышления не бывает! Используем готовые алгоритмы МО, которые сопровождаются набором дополнительных функций. Все вместе называется "пакетом".

Что такое "реальные вероятности классов"? Например, функция

возвращает "probability class estimates". Никаких других вероятностей, кроме "оценок" алгоритм содержать не может.

Вопрос не про то, что он может. А про то, как получить достоверные вероятности классов. Чтобы вы были уверены, что при вероятности класса 0.8, 80% случаев предсказывались верно. И могли бы использовать порог, например. На выходе классификатора это не так в большинстве случаев, повторяю еще раз. Они либо завышают, либо занижают оценки “by design”. Поэтому порог не работает. Реальные вероятности - это когда не завышают и не занижают.

Вы уже показали, что не знаете. Значит есть еще к чему стремиться. Поэтому «надо осваивать все МО» и избавляться от пакетного мышления.

Какая разница между 1:100, Структура массивов MQL4 и Нейро сети

Aleksey Nikolayev 2023.12.24 16:57 #33516

Вроде бы там речь не о точечной оценке вероятности, а об её интервальном оценивании. Для матстата это обычный подход - не просто получить конкретную числовую оценку вероятности, но ещё и получить интервал, в который истинное значение этой оцениваемой вероятности попадает с заданной точностью (вероятностью). Тут есть некоторая сложность в понимании, поскольку понятие вероятности участвует в двух разных ипостасях - как сама оцениваемая величина, так и точность её оценивания. И это совсем разные вероятности)

Хотя подробно в конформное прогнозирование не вникал и могу ошибаться.

Расчет вероятности тейка и Что такое достоверность вероятности Матстат Эконометрика Матан

СанСаныч Фоменко 2023.12.24 17:37 #33517

Maxim Dmitrievsky #:
Вопрос не про то, что он может. А про то, как получить достоверные вероятности классов. Чтобы вы были уверены, что при вероятности класса 0.8, 80% случаев предсказывались верно. И могли бы использовать порог, например. На выходе классификатора это не так в большинстве случаев, повторяю еще раз. Они либо завышают, либо занижают оценки “by design”. Поэтому порог не работает. Реальные вероятности - это когда не завышают и не занижают.

Это у Вас не так. приведенная цифра 0.8 - это одно из значений вероятности класса. Вот гистограмма вероятностей класса.

А у меня именно так и никак иначе, потому, что если иначе, то означает о переобучении. Для меня при фиксированном пороге несовпадение ошибки предсказания на ООВ и ООС и на файле ВНЕ - это главный признак переобучения. У меня порог прекрасно работает. А "реальные вероятности" - это из области некой фантастики, не имеющей никакого отношения к реально существующему коду и терминологии, используемой при этом.

Не стохастический индикатор в Эксперимент МТС, дающая прибыль -

Maxim Dmitrievsky 2023.12.24 17:53 #33518

СанСаныч Фоменко #:

Это у Вас не так. приведенная цифра 0.8 - это одно из значений вероятности класса. Вот гистограмма вероятностей класса.

А у меня именно так и никак иначе, потому, что если иначе, то означает о переобучении. Для меня при фиксированном пороге несовпадение ошибки предсказания на ООВ и ООС и на файле ВНЕ - это главный признак переобучения. У меня порог прекрасно работает. А "реальные вероятности" - это из области некой фантастики, не имеющей никакого отношения к реально существующему коду и терминологии, используемой при этом.

Как вы поняли, что ваш порог прекрасно работает?

Для вас фантастика, а для кого-то обыденность.

Maxim Dmitrievsky 2023.12.24 17:54 #33519

Aleksey Nikolayev #:

Вроде бы там речь не о точечной оценке вероятности, а об её интервальном оценивании. Для матстата это обычный подход - не просто получить конкретную числовую оценку вероятности, но ещё и получить интервал, в который истинное значение этой оцениваемой вероятности попадает с заданной точностью (вероятностью). Тут есть некоторая сложность в понимании, поскольку понятие вероятности участвует в двух разных ипостасях - как сама оцениваемая величина, так и точность её оценивания. И это совсем разные вероятности)

Хотя подробно в конформное прогнозирование не вникал и могу ошибаться.

Речь о немного ином подходе, пока еще никто не загуглил :)

СанСаныч Фоменко 2023.12.24 18:15 #33520

Maxim Dmitrievsky #:
Как вы поняли, что ваш порог прекрасно работает?

Для вас фантастика, а для кого-то обыденность.

Совпадение ошибки предсказания на ООВ и ООС и на файле ВНЕ

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3352