Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2560

 
Aleksey Nikolayev #:

В LightGBM можно задавать свою, но чаще всего такой возможности нет.

Уверен что не путаеш фф с кастомными метриками?
 

Хотите я ещё раз Вам расскажу какие метрики я использую и по каким  критериям отбираю модели?


Ведь это самое главное в МО, фундаментальный вопрос :-)

 
Maxim Dmitrievsky #:
Наверное, следует вернуться к простым определениям общепринятым.
Декомпозиция на тренд, сезонность, циклы и шум. Пытаться предсказывать можно любое из приведённого, с разной степенью успеха.
Стационарность - неизменность среднего и дисперсии, на рынке не наблюдается.
Регулярность - наличие повторяемости, некий аналог 2D циклов, либо персистентности, определенный уровень сигнала. Типа как несет в себе возможности для спекуляций. Отличается от СБ в лучшую сторону.

По поводу определения стационарности - тут явно абстракция, так как либо это одна точка без колебаний, и тогда окно измерения не имеет значения, либо это всё же колебания с минимальным окном или с диапазоном окон для измерения.

Регулярность же может порождать стационарность как раз - так как это состояние одной точки, а не окна их измерения.

Соответственно, стационарность напрямую влияет на прогнозируемость, а значит и обучение, если в этой стационарности есть информация о целевой.

Как я писал ранее, как раз я использую сейчас подход отбора предиктортов через оценку их стационарности с заданным окном измерения.

 
Aleksey Nikolayev #:

В LightGBM можно задавать свою, но чаще всего такой возможности нет.

Еще xgboost может, но свою ф-ю написать оч. сложно. Надо формулы выводить.

http://biostat-r.blogspot.com/2016/08/xgboost.html - 6-й параграф.

 
Aleksey Vyazmikin #:

По поводу определения стационарности - тут явно абстракция, так как либо это одна точка без колебаний, и тогда окно измерения не имеет значения, либо это всё же колебания с минимальным окном или с диапазоном окон для измерения.

Регулярность же может порождать стационарность как раз - так как это состояние одной точки, а не окна их измерения.

Соответственно, стационарность напрямую влияет на прогнозируемость, а значит и обучение, если в этой стационарности есть информация о целевой.

Как я писал ранее, как раз я использую сейчас подход отбора предиктортов через оценку их стационарности с заданным окном измерения.

вообще ничего не понял

стациноарным должен быть шум после построения модели, больше она нигде не востребована
 
Maxim Dmitrievsky #:

вообще ничего не понял

Есть желание понять?

 
mytarmailS #:
Уверен что не путаеш фф с кастомными метриками?

Вроде нет - пример на питоне.

 
Maxim Dmitrievsky #:
стациноарным должен быть шум после построения модели, больше она нигде не востребована

Верно, именно о связи предиктора и целевой я и говорю.

Так вот, мне не известен метод построения модели, дающий оценку "стационарности" на разных интервалах выборки при сплитовании или ином механизме объединения предикторов. Все модели делают подгонку под участки выборки, оценивая только количественный показатель улучшения, но нужна его оценка по интервалам, тогда модель может быть более устойчива.

 
elibrarius #:

Еще xgboost может, но свою ф-ю написать оч. сложно. Надо формулы выводить.

http://biostat-r.blogspot.com/2016/08/xgboost.html - 6-й параграф.

Ну да, посчитать на бумажке придётся) Ещё не всякая функция подойдёт - нужно чтобы была определена вторая производная, которая наверное должна быть ненулевой.

 
Aleksey Vyazmikin #:

Верно, именно о связи предиктора и целевой я и говорю.

Так вот, мне не известен метод построения модели, дающий оценку "стационарности" на разных интервалах выборки при сплитовании или ином механизме объединения предикторов. Все модели делают подгонку под участки выборки, оценивая только количественный показатель улучшения, но нужна его оценка по интервалам, тогда модель может быть более устойчива.

почему просто не сделать кросс-валидацию для проверки устойчивости по интервалам?

Причина обращения: