Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2114

 
Maxim Dmitrievsky:

не знаю, нужна ссыль

наверное, айдишники трансформированных примеров просто

Это всё та ж статья - ничего не понятно там.

 
Aleksey Vyazmikin:

Это всё та ж статья - ничего не понятно там.

это копипизд, ссылку на оригинал я дал

 
Maxim Dmitrievsky:

можно по разному попробовать, чисто позырить

вот хороший ноутбук https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

можно копировать и проверять

Так это оригинал той статьи, что я смотрел на русском.

 
Maxim Dmitrievsky:

это копипизд, ссылку на оригинал я дал

А толку - все равно нет инфы - выдернутый код.

 
Aleksey Vyazmikin:

А толку - все равно нет инфы - выдернутый код.

все там отлично написано. У меня нет имбалансных классов, но я их искусственно делал, просто позырить

 
Maxim Dmitrievsky:

все там отлично написано. У меня нет имбалансных классов, но я их искусственно делал, просто позырить


Оказалось, что у метода "Tomek links" просто не уравнивается выборка - он уменьшил число нулевых строк с 4005 до 3402, поэтому я и думал, что не работает.
 
Aleksey Vyazmikin:


Оказалось, что у метода "Tomek links" просто не уравнивается выборка - он уменьшил число нулевых строк с 4005 до 3402, поэтому я и думал, что не работает.
Угу. Сначала надо делать оверсемплинг потом томика
 
Maxim Dmitrievsky:
Угу. Сначала надо делать оверсемплинг потом томика

Оверсемплинг пока ничего не дает, а вот "томик" улучшил малость результат - значит в данных что т есть, надо главное правильно копать.

Гистограмма моделей с разными настройками квантования на exam выборке.


 
Aleksey Vyazmikin:

Оверсемплинг пока ничего не дает, а вот "томик" улучшил малость результат - значит в данных что т есть, надо главное правильно копать.

Гистограмма моделей с разными настройками квантования на exam выборке.


он делает лучше границу между классами. Так же и данные надо готовить - чтобы разделение на классы было четким, примеры не пересекались

и я даже знаю как сделать.. типа шибко умный, но пока не делал
 
Maxim Dmitrievsky:

он делает лучше границу между классами. Так же и данные надо готовить - чтобы разделение на классы было четким, примеры не пересекались

и я даже знаю как сделать.. типа шибко умный, но пока не делал

Интересно, как? В нашей области обычно классы можно описать как равномерно перемешанные.

Причина обращения: