Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3682

 
Генераторы случайного текста закономерно мигрировали в другую тему :)
 
Aleksey Nikolayev #:

Если не путаю, вы раньше много писали про бутстреп для размножения данных и, соответственно, моделей. Интересно ваше мнение насколько осмысленно это можно использовать для построения ансамбля ТС.

Генеративные модели как-то справляются. Там в комментариях то ли к этой, то ли к какой-то другой статье делал ансамблирование, уже не вспомню :)

Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом
Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом
  • www.mql5.com
В данной статье описан один из возможных подходов к трансформации данных для улучшения обобщающей способности модели, а также рассмотрен перебор моделей CatBoost и выбор лучшей из них.
 
Maxim Dmitrievsky #:

Генеративные модели как-то справляются. Там в комментариях то ли к этой, то ли к какой-то другой статье делал ансамблирование, уже не вспомню :)

Да, начиная отсюда и пара страниц с примерами. Вроде бы модели на синтетических данных (в конце попыток, на второй странице) неплохо ансамблировались.

Обсуждение статьи "Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом" - Лучшая класстеризация на хорошие плохие наборы проводится из случайного набора признаков, не полного набора.
Обсуждение статьи "Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом" - Лучшая класстеризация на хорошие плохие наборы проводится из случайного набора признаков, не полного набора.
  • 2020.11.24
  • Forester
  • www.mql5.com
Усреднение с плохим классификатором ухудшает общий результат. Надеюсь найдете время для сравнения усредненного и лучшего результатов на экзаменационной выборке. как показала практика не сильно ухудшает результат
 

Пробовал разные методы генерации, из них порадовал только GMM, поэтому статья только с его участием.

Рейтинг герераторов (по памяти):

  • GMM
  • copulas
  • autoencoders, в т.ч. условные (уже плохо), либо не хватило понимания как лучше использовать.
  • GAN (тоже плохо + медленно)
  • GAN на трансформерах и другие сложные модели. (tGAN, tsGAN) Очень медленно и очень плохо.
  • Другие очень плохие способы...
Уже есть разные пакеты для генерации синтетических табличных данных и тайм-серий, не слежу за развитием.

Можно наверное попросить какой-нибудь бредогенератор погенерить :)