Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2125

 
elibrarius:

Если все точки и из теста и из трейна ранжируются в один общий список (переставляются местами по некоей закономерности), то это значит что они перемешиваются. Я так понимаю. Тест не должен никоим образом смешиваться с трейном.

если точки независимы (нет автокорреляции), то мешать можно и нужно

собственно, случайный лес так и работает

 
Igor Makanu:

видел эту книгу пару лет назад

на вид... ну да, завораживает , а реально - зачем? если цель написание диплома или кандидатской - да это настольная книга

если цель временные ряды - то эта книга о другом, об изобретении случайного леса на заре развития ЭВМ

имхо, даже ансамбли НС плохо прижились для применения на практике, как ими работать с ВР? ну как вариант нагородит кучу-малу НС, а в итоге то получишь автоэкодер? - сомневаюсь, что даже сверточную сеть можно получить с помощью этой книги


старое знание, Воронцов актуальнее, ну и обработка данных - догрызаю онлайн-курсы по ВР - в этом что то  есть ;)

Шо ты мелешь ??  бухой или шо?  

Спроси у своего  Воронцова кто такой Ивахненко для него ...

 
Maxim Dmitrievsky:

если точки независимы (нет автокорреляции), то мешать можно и нужно

собственно, случайный лес так и работает

В таймсериях с каждой точкой по 2-3 с каждой стороны очень кореллированные  точки. Т.е. условие независимости не соблюдается
 
elibrarius:
В таймсериях с каждой точкой по 2-3 с каждой стороны очень кореллированные  точки. Т.е. условие независимости не соблюдается

есть специальные методы сесплирования для временных рядов, там это все учитывается 

 
elibrarius:
В таймсериях с каждой точкой по 2-3 с каждой стороны очень кореллированные  точки. Т.е. условие независимости не соблюдается

удалить дупликаты эти можно, сразу резко начнет работать на новых данных, но спред не покроет

 
Maxim Dmitrievsky:

если точки независимы (нет автокорреляции), то мешать можно и нужно

нет

АКФ не для этого предназначена при оценке ВР

автокорреляция может не быть для лага =1, но может быть для других лагов

и оценка АКФ - это не оценка есть ли зависимости какого лага, а просто один из способов идентификации модели процесса - после принятия решения к какому процессу будет относиться ВР , начинаем предобработку данных - или будем использовать сам ВР, или будем использовать его выборку лагов 

 
Igor Makanu:

нет

да

до

после декорреляции, на которую идет переобучение. Серийность меток также следует учитывать.


 
Maxim Dmitrievsky:

удалить дупликаты эти можно, сразу резко начнет работать на новых данных, но спред не покроет

И какой смысл, если спред не покроет?
 
elibrarius:
И какой смысл, если спред не покроет?

с дупликатами всегда переобуч, остатки модели автокоррелированы 

т.е. самообман. см. картинку из предыдущего сообщ.
 
Maxim Dmitrievsky:

с дупликатами всегда переобуч, остатки модели автокоррелированы 

т.е. самообман. см. картинку из предыдущего сообщ.
Картинка без пояснений - просто картинка)
Причина обращения: