Мне не известен подход отбора предиктортов через оценку их стационарности с заданным окном измерения - Общее обсуждение

mytarmailS 2022.01.29 13:17 #25591

Aleksey Nikolayev #:

В LightGBM можно задавать свою, но чаще всего такой возможности нет.

Уверен что не путаеш фф с кастомными метриками?

Mihail Marchukajtes 2022.01.29 13:23 #25592

Хотите я ещё раз Вам расскажу какие метрики я использую и по каким критериям отбираю модели?

Ведь это самое главное в МО, фундаментальный вопрос :-)

Aleksey Vyazmikin 2022.01.29 13:43 #25593

Maxim Dmitrievsky #:
Наверное, следует вернуться к простым определениям общепринятым.

Декомпозиция на тренд, сезонность, циклы и шум. Пытаться предсказывать можно любое из приведённого, с разной степенью успеха.

Стационарность - неизменность среднего и дисперсии, на рынке не наблюдается.

Регулярность - наличие повторяемости, некий аналог 2D циклов, либо персистентности, определенный уровень сигнала. Типа как несет в себе возможности для спекуляций. Отличается от СБ в лучшую сторону.

По поводу определения стационарности - тут явно абстракция, так как либо это одна точка без колебаний, и тогда окно измерения не имеет значения, либо это всё же колебания с минимальным окном или с диапазоном окон для измерения.

Регулярность же может порождать стационарность как раз - так как это состояние одной точки, а не окна их измерения.

Соответственно, стационарность напрямую влияет на прогнозируемость, а значит и обучение, если в этой стационарности есть информация о целевой.

Как я писал ранее, как раз я использую сейчас подход отбора предиктортов через оценку их стационарности с заданным окном измерения.

Как убрать название индикатора торговая стратегия на базе Краевой эффект на пути

Forester 2022.01.29 13:59 #25594

Aleksey Nikolayev #:

В LightGBM можно задавать свою, но чаще всего такой возможности нет.

Еще xgboost может, но свою ф-ю написать оч. сложно. Надо формулы выводить.

http://biostat-r.blogspot.com/2016/08/xgboost.html - 6-й параграф.

Maxim Dmitrievsky 2022.01.29 14:26 #25595

Aleksey Vyazmikin #:

По поводу определения стационарности - тут явно абстракция, так как либо это одна точка без колебаний, и тогда окно измерения не имеет значения, либо это всё же колебания с минимальным окном или с диапазоном окон для измерения.

Регулярность же может порождать стационарность как раз - так как это состояние одной точки, а не окна их измерения.

Соответственно, стационарность напрямую влияет на прогнозируемость, а значит и обучение, если в этой стационарности есть информация о целевой.

Как я писал ранее, как раз я использую сейчас подход отбора предиктортов через оценку их стационарности с заданным окном измерения.

вообще ничего не понял

стациноарным должен быть шум после построения модели, больше она нигде не востребована

Aleksey Vyazmikin 2022.01.29 14:33 #25596

Maxim Dmitrievsky #:

вообще ничего не понял

Есть желание понять?

Aleksey Nikolayev 2022.01.29 14:37 #25597

mytarmailS #:
Уверен что не путаеш фф с кастомными метриками?

Вроде нет - пример на питоне.

Aleksey Vyazmikin 2022.01.29 14:44 #25598

Maxim Dmitrievsky #:
стациноарным должен быть шум после построения модели, больше она нигде не востребована

Верно, именно о связи предиктора и целевой я и говорю.

Так вот, мне не известен метод построения модели, дающий оценку "стационарности" на разных интервалах выборки при сплитовании или ином механизме объединения предикторов. Все модели делают подгонку под участки выборки, оценивая только количественный показатель улучшения, но нужна его оценка по интервалам, тогда модель может быть более устойчива.

Есть ли закономерность в Ищем закономерности Группировка листьев - требуются

Aleksey Nikolayev 2022.01.29 14:45 #25599

elibrarius #:

Еще xgboost может, но свою ф-ю написать оч. сложно. Надо формулы выводить.

http://biostat-r.blogspot.com/2016/08/xgboost.html - 6-й параграф.

Ну да, посчитать на бумажке придётся) Ещё не всякая функция подойдёт - нужно чтобы была определена вторая производная, которая наверное должна быть ненулевой.

Maxim Dmitrievsky 2022.01.29 14:49 #25600

Aleksey Vyazmikin #:

Верно, именно о связи предиктора и целевой я и говорю.

Так вот, мне не известен метод построения модели, дающий оценку "стационарности" на разных интервалах выборки при сплитовании или ином механизме объединения предикторов. Все модели делают подгонку под участки выборки, оценивая только количественный показатель улучшения, но нужна его оценка по интервалам, тогда модель может быть более устойчива.

почему просто не сделать кросс-валидацию для проверки устойчивости по интервалам?

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2560