Проверьте все фичи добавлением по 1 - Общее обсуждение

Maxim Dmitrievsky 2021.04.09 13:02 #23861

Aleksey Vyazmikin:

Понятно, конструктивного обсуждения не будет - желания понять суть - нет.

нет желания страдать фигней, суть понятна (страдание фигней)

Aleksey Vyazmikin 2021.04.09 13:03 #23862

elibrarius:
Что-то мудреное.
Чем это лучше простой проверки всех фич добавлением по 1?
Сначала обучили 1000 раз (при 1000 фичах для проверки) на 1 фиче, нашли лучшую. Потом 999 раз на лучшей фиче и 999 оставшихся, выбрали вторую лучшую. Потом на 2 лучших и третьей из 998 оставшихся и т.д.
Всего 2 вложенных цикла.
Модели с малым числом фич обучаются очень быстро. Штук 20-30 лучших наберете за приемлемое время. Да и после 10-20 выбранных фич, модели обычно перестают улучшаться, добавление новых фич после них только ухудшают результат.

Надо искать не лучшую, а их сочетание между собой - именно это и является проблемой. Почему проблемой - потому что все комбинации перебрать невозможно, поэтому и нужен эврестический метод. Ещё проблемой является потенциальная сильная схожесть разных предикторов после их сплитования, а это в ансамблях приведет к завышению вероятности, так как будет много по сути коррелирующих листьев.

Любые вопросы новичков по Bayesian regression - Делал Возможности и ограничения Экспертов

Maxim Dmitrievsky 2021.04.09 13:04 #23863

человек решил заново изобрести бустинг с помощью бустинга, не будем ему мешать

призывы к здравому смыслу не помогли

Aleksey Vyazmikin 2021.04.09 13:05 #23864

Maxim Dmitrievsky:

нет желания страдать фигней, суть понятна (страдание фигней)

Почему фигней?

Дает это улучшение - да дает.

Есть теоретическое обоснование - да есть.

Конечно, это улучшение не на порядок.

И да, это может быть мало эффективно для Ваших предикторов - тут допустить я могу обоснование для отказа.

Evgeny Dyuka 2021.04.09 13:07 #23865

нейро жжет ))
забейте на торговлю, делайте из нейросети индикатор

Maxim Dmitrievsky 2021.04.09 13:22 #23866

Aleksey Vyazmikin:

Почему фигней?

Дает это улучшение - да дает.

Есть теоретическое обоснование - да есть.

Конечно, это улучшение не на порядок.

И да, это может быть мало эффективно для Ваших предикторов - тут допустить я могу обоснование для отказа.

уже все сказал, не буду мешать заниматься перебором неперебираемого

Forester 2021.04.09 13:27 #23867

Aleksey Vyazmikin:

Надо искать не лучшую, а их сочетание между собой - именно это и является проблемой. Почему проблемой - потому что все комбинации перебрать невозможно, поэтому и нужен эврестический метод. Ещё проблемой является потенциальная сильная схожесть разных предикторов после их сплитования, а это в ансамблях приведет к завышению вероятности, так как будет много по сути коррелирующих листьев.

После выбора первой лучшей фичи вторая выберется именно с наилучшим взаимодействием вместе с первой, и т.д. когда 10 наберете, следущая выберется в наилучшим взаимодействием с какой нибцдь из 10 ранее отобранных, но скорее всего со всеми ими.

Чистая математика, физика, логика Оптимизация или как (в Поговорим о функции OrderSelect

Maxim Dmitrievsky 2021.04.09 13:28 #23868

elibrarius:
После выбора первой лучшей фичи вторая выберется именно с наилучшим взаимодействием вместе с первой, и т.д. когда 10 наберете. Следущая выберестя в наиучшим взаимодействием с какой нибцдь из ранее отобранных, но скорее всего со всеми ими

да не работает это так

убери фичи с низким импортансом из модели и сломай её, потом сравни ж.. с пальцем (другими фичами), и так по кругу

Maxim Dmitrievsky 2021.04.09 13:42 #23869

улучшение на 1-2% моно получить, несколько раз переобучив одну и ту же модель )

но не 512 раз же ))

Forester 2021.04.09 13:44 #23870

Maxim Dmitrievsky:

да не работает это так

убери фичи с низким импортансом из модели и сломай её, потом сравни ж.. с пальцем (другими фичами), и так по кругу

Удаление по 1 тоже пробовал. Удаляет. Когда много мусора модель почти не замечает потери бойца)

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2387