Попробуйте добавлять немного шума в показатели предикторов - Общее обсуждение

Vladimir Perervenko 2020.11.11 16:22 #21051

mytarmailS:

Я удалил, думал не интересно никому, могу вам скинуть код, только нужно его в читабельный вид перевести

Кстати столкнулся с нестабильностью метода отжига, даже не знаю как с ним работать, очень нестабильные результаты, сильно прыгают параметры...

дошел до такого

сначала иницыализирую рандомно стартовую точку,

потом когда какое то решение найдено я его сохраняю

потом опять запускаю отжиг но с стартовыми параметрами уже от найденного решения и так несколько раз..

Сбросьте в личку.

Отжиг нестабилен. Применяйте rgenout. Проверен, надежен.

В моделях применяется функция потерь. Напишите свою и если модель позволяет вставить свою ф-ю потерь, пробуйте.

mytarmailS 2020.11.11 16:43 #21052

mytarmailS:

просто делаю прогноз полученой модели на 500 точек вперед

но торговать думаю только первые 1-2 сделки

и нужно научиться качественно находить параметры

Aleksey Vyazmikin 2020.11.11 19:08 #21053

Maxim Dmitrievsky:

можно 2 разнонаправленные модели юзать

Пробовал учить отдельно по своей базовой стратегии - результаты были хуже, думаю, что за счет разбалансировки выборки - слишком много нулей получается и на них идет обучение.

Хочу попробовать другой вариант - отдельной моделью учить направление. Получится, что первая модель обучается на волатильность, а вторая на её вектор. Но опять же - выборка нужна большая.

Есть ли закономерность в Поиск набора индикаторов для Что подать на вход

Maxim Dmitrievsky 2020.11.11 19:15 #21054

Aleksey Vyazmikin:

Пробовал учить отдельно по своей базовой стратегии - результаты были хуже, думаю, что за счет разбалансировки выборки - слишком много нулей получается и на них идет обучение.

Хочу попробовать другой вариант - отдельной моделью учить направление. Получится, что первая модель обучается на волатильность, а вторая на её вектор. Но опять же - выборка нужна большая.

Для несбалансированных классов можно использовать оверсемплинг. Я вертел и 2 и 3 модели, разницы никакой по сути

Aleksey Vyazmikin 2020.11.11 19:22 #21055

Maxim Dmitrievsky:
Для несбалансированных классов можно использовать оверсемплинг. Я вертел и 2 и 3 модели, разницы никакой по сути

Т.е. дублировать строки с целевой "1"? Пробовал - у меня результат вообще почти не менялся на CatBoost. Возможно, нужно добавлять немного шума.

Maxim Dmitrievsky 2020.11.11 19:25 #21056

Aleksey Vyazmikin:

Т.е. дублировать строки с целевой "1"? Пробовал - у меня результат вообще почти не менялся на CatBoost. Возможно, нужно добавлять немного шума.

Не дублировать. Оверсемплинг в гугле, например SMOTE. У меня тоже не учится при большом дисбалансе. После овера все гуд

Forester 2020.11.11 19:28 #21057

Aleksey Vyazmikin:

Т.е. дублировать строки с целевой "1"? Пробовал - у меня результат вообще почти не менялся на CatBoost. Возможно, нужно добавлять немного шума.

Так и должно быть. Балансировка по классам НС нужна. Деревья и так справятся.

Aleksey Vyazmikin 2020.11.11 20:32 #21058

Maxim Dmitrievsky:
Не дублировать. Оверсемплинг в гугле, например SMOTE. У меня тоже не учится при большом дисбалансе. После овера все гуд

Ну да, по сути добавление шума в показатели предикторов. Это может повлиять на границы квантования, усилив выделение участков с единицами, но по идеи такой же эффект должен быть и при добавлении дубликатов, единственно, что предполагаю, что дубликаты режутся алгоритмом CatBoost перед началом обучения (надо проеврить), тогда да - вариант.

Есть ли закономерность в Любые вопросы от ПРОФИ Алгоритм объединения диапазонов отрезка

Aleksey Vyazmikin 2020.11.11 20:33 #21059

elibrarius:
Так и должно быть. Балансировка по классам НС нужна. Деревья и так справятся.

Ну не всегда справляются - писал уже ранее.

Aleksey Vyazmikin 2020.11.11 20:36 #21060

Похоже спалил в своей статье прибыльный советник (подход к обучению):

На графике финансовый результат модели по итогу каждого месяца, если первую модель обучить на 12 месяцах и потом добавлять к ней историю каждого нового месяца - склейка фьючерсного Si контракта на USDRUB_TOM.

Разговор с ChatGPT об Обсуждение статьи "Продвинутый ресемплинг Обсуждение статьи "Градиентный бустинг

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2106