Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2757

 
JeeyCi #:
вот поэтому и говорю, что сначала с алгоритмом надо определяться (включая imbalance'ы - не знаю, что вы там с ними хотели сделать ?? - когда ранее советовали oversampling)... а потом искать либу, которая даёт возможности подрядить в код нужные сущности/классы... или кодить свою библиотеку со своими нужными вам классами
Ресемплинг делается чтобы удалить выбросы, гауссоизировать выборку

Я вообще предлагал осмысленный семплинг по энтропии или корреляции. Чтобы сделать фичи более информативными. Плюс взять приращения и добавить в них максимум информации из исходного ряда всяческими преобразованиями. Плюс нефиксированное запинающееся окно. Это фреш подход и такого никто не делал. Но подхватил какую-то коронавирусную херь и отдыхаю ☺️

Казуал инферннс должен было помочь выбрать информативные фичи, как вариант, но там оказалось не про это
 
JeeyCi #:
вот поэтому и говорю, что сначала с алгоритмом надо определяться (включая imbalance'ы - не знаю, что вы там с ними хотели сделать ?? - когда ранее советовали oversampling)... а потом искать либу, которая даёт возможности подрядить в код нужные сущности/классы... или кодить свою библиотеку со своими нужными вам классами

Все, что нужно, закодили до Вас.

Оболочка caret из R содержит до 200(!) моделей, в Вашей терминологии (библиотек) + вся необходимая обвязка для  data mining и выбора моделей.  

Проблема в подборе предикторов и их отборе, проблем в моделях давно нет.

 
Maxim Dmitrievsky #:
Ресемплинг делается чтобы удалить выбросы, сгладить выборку

Я вообще предлагал осмысленный семплинг по энтропии ищи корреляции. Чтобы сделать фичи более информативными. Плюс взять приращения и добавить в них максимум информации из исходного ряда всяческими преобразованиями. Плюс нефиксированное запинающееся окно. Это фреш подход и такого никто не делал. Но подхватил какую-то коронавирусную херь и отдыхаю ☺️

1. Ресемплинг выброса не удаляют. Есть программы, а можно по колхозному: меняем все, что больше +/- 0.005 из соответствующего квантиля на это значение. Статистика меняется удивительно.

2. Крайне интересно, особенно на энтропии.  Хотелось бы увидеть результат.  Корреляция - это для стационарных рядов, можно забыть.

 
Maxim Dmitrievsky #: Плюс нефиксированное запинающееся окно.

Что за нефиксированное окно? Разное количество фич/столбцов в каждой строке? Но в модель то надо подавать всегда одинаковое количество столбцов.

 
СанСаныч Фоменко #:

1. Ресемплинг выброса не удаляют. Есть программы, а можно по колхозному: меняем все, что больше +/- 0.005 из соответствующего квантиля на это значение. Статистика меняется удивительно.

2. Крайне интересно, особенно на энтропии.  Хотелось бы увидеть результат.  Корреляция - это для стационарных рядов, можно забыть.

Ресемплинг через все, где есть гауссианы внутри - удаляет 
 
elibrarius #:

Что за нефиксированное окно? Разное количество фич/столбцов в каждой строке? Но в модель то надо подавать всегда одинаковое количество столбцов.

А выше писал где-то недавно, если модеры не почистили 
 
Maxim Dmitrievsky #:
А выше писал где-то недавно, если модеры не почистили 

Поиск на " нефиксированное окно" дает только эту страницу

 
Maxim Dmitrievsky #:
Ресемплинг через все, где есть гауссианы внутри - удаляет 

Любопытно, но очень мудрено. 

 
elibrarius #:

Поиск на " нефиксированное окно" дает только эту страницу

Там где-то мысля была про фракталы и прочее, что последняя цена не всегда имеет лучшую предсказательную способность. То есть иногда надо останавливать окно по условиям или через другую нс зафитить, чтобы в прогнозе учавствовать предыдущие бары, а не последние. И так оно должно бегать туда-сюда по истории.
 
СанСаныч Фоменко #:

Любопытно, но очень мудрено. 

Через гауссовские смеси попробуйте, у меня статья есть про это. Это генеративная модель. Работает на приращениях лучше автоэнкодера.
Причина обращения: