Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3682

 
Генераторы случайного текста закономерно мигрировали в другую тему :)
 
Aleksey Nikolayev #:

Если не путаю, вы раньше много писали про бутстреп для размножения данных и, соответственно, моделей. Интересно ваше мнение насколько осмысленно это можно использовать для построения ансамбля ТС.

Генеративные модели как-то справляются. Там в комментариях то ли к этой, то ли к какой-то другой статье делал ансамблирование, уже не вспомню :)

Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом
Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом
  • www.mql5.com
В данной статье описан один из возможных подходов к трансформации данных для улучшения обобщающей способности модели, а также рассмотрен перебор моделей CatBoost и выбор лучшей из них.
 
Maxim Dmitrievsky #:

Генеративные модели как-то справляются. Там в комментариях то ли к этой, то ли к какой-то другой статье делал ансамблирование, уже не вспомню :)

Да, начиная отсюда и пара страниц с примерами. Вроде бы модели на синтетических данных (в конце попыток, на второй странице) неплохо ансамблировались.

Обсуждение статьи "Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом" - Лучшая класстеризация на хорошие плохие наборы проводится из случайного набора признаков, не полного набора.
Обсуждение статьи "Продвинутый ресемплинг и выбор CatBoost моделей брутфорс методом" - Лучшая класстеризация на хорошие плохие наборы проводится из случайного набора признаков, не полного набора.
  • 2020.11.24
  • Forester
  • www.mql5.com
Усреднение с плохим классификатором ухудшает общий результат. Надеюсь найдете время для сравнения усредненного и лучшего результатов на экзаменационной выборке. как показала практика не сильно ухудшает результат
 

Пробовал разные методы генерации, из них порадовал только GMM, поэтому статья только с его участием.

Рейтинг герераторов (по памяти):

  • GMM
  • copulas
  • autoencoders, в т.ч. условные (уже плохо), либо не хватило понимания как лучше использовать.
  • GAN (тоже плохо + медленно)
  • GAN на трансформерах и другие сложные модели. (tGAN, tsGAN) Очень медленно и очень плохо.
  • Другие очень плохие способы...
Уже есть разные пакеты для генерации синтетических табличных данных и тайм-серий, не слежу за развитием.

Можно наверное попросить какой-нибудь бредогенератор погенерить :)
 
Maxim Dmitrievsky #:

Да, начиная отсюда и пара страниц с примерами. Вроде бы модели на синтетических данных (в конце попыток, на второй странице) неплохо ансамблировались.

Спасибо, есть над чем задуматься.
 
Aleksey Nikolayev #:
Спасибо, есть над чем задуматься.
Ещё не додумался попробовать генерировать на данных за разные временные периоды, а затем ансамблировать. Может быть в этом тоже есть смысл. 
 

Некоторая мотивация для создания регрессионных моделей (проба пера).

Ищутся периодические компоненты в исходном ряде, затем делается попытка предсказания на новых данных. Смысл ТС сводится к торговле от границ предсказанных циклов.

Затем проверка в тостере, насколько эти циклы приносят удовлетворение.

Сделал пока что простой пример на синтетических данных. Завтра попробую на реальных.

Не видел на сайте подобных исследований, если были - дайте знать.


 
Maxim Dmitrievsky #:

Некоторая мотивация для создания регрессионных моделей (проба пера).

Ищутся периодические компоненты в исходном ряде, затем делается попытка предсказания на новых данных. Смысл ТС сводится к торговле от границ предсказанных циклов.

Затем проверка в тостере, насколько эти циклы приносят удовлетворение.

Сделал пока что простой пример на синтетических данных. Завтра попробую на реальных.

Не видел на сайте подобных исследований, если были - дайте знать.


пакет forecast

Основные функции пакета forecast :

  1. auto.arima() – автоматический подбор параметров модели ARIMA.
  2. ets() – модель экспоненциального сглаживания (ETS), которая хорошо подходит для данных с сезонностью.
  3. stlf() – разложение временного ряда на тренд, сезонность и остаток с последующим прогнозированием каждого компонента отдельно.
  4. tbats() – комплексная модель для сложных сезонных структур (например, множественная сезонность). 

  5. пакету более 30 лет, довольно популярный для предсказания экономических данных с сезонностью. Есть книжка.
 
СанСаныч Фоменко #:

пакет forecast

Основные функции пакета forecast :

  1. auto.arima() – автоматический подбор параметров модели ARIMA.
  2. ets() – модель экспоненциального сглаживания (ETS), которая хорошо подходит для данных с сезонностью.
  3. stlf() – разложение временного ряда на тренд, сезонность и остаток с последующим прогнозированием каждого компонента отдельно.
  4. tbats() – комплексная модель для сложных сезонных структур (например, множественная сезонность). 

  5. пакету более 30 лет, довольно популярный для предсказания экономических данных с сезонностью. Есть книжка.
Использую Фурье либо сингулярное разложение. Пока не определился как это должно выглядеть в конечном итоге. Как лучше подгонять циклы под ТС, а подгонять явно придется на реальных котировках. 
 
Maxim Dmitrievsky #:

Не видел на сайте подобных исследований, если были - дайте знать.

Я это делал еще черти когда, результаты тут публиковал.
Ты с меня смеялся и называл ЦОСникок , теперь делаешь то же самое, а может и примитивнее и говориш что не встречал...
:)