Есть ли закономерность в хаосе? Попробуем поискать! Машинное обучение на примере конкретной выборки. - страница 3

 
Aleksey Vyazmikin #:

Можете проверить модель именно на файле exam.csv?

Пробовали ли делать какие либо манипуляции с выборкой?

Вот баланс на выборке exam после отсева части предикторов.

Конечно, на графиках распределения откликов модели видно, что обучились совсем чуть-чуть - Recall очень низкий, но уже какой то результат.

train.csv


exam.csv

В exam 9046 строк. У меня 9000. Разницы почти не будет.

У вас кривая намного лучше. Попробую еще покрутить с параметрами.
 
elibrarius #:

Какой у вас лучший баланс получился?

Сейчас поискал в разных вариантах, вроде как получается, что этот результат - там ещё на круг комиссия 3 пункта берется по идеи.


 
elibrarius #:
В exam 9046 строк. У меня 9000. Разницы почти не будет.

У вас кривая намного лучше. Попробую еще покрутить с параметрами.

Ну, если это данные файла exam, то да - разницы особо нет, просто я подумал, вдруг это файла train. Вы вместе три файла объединили изначально получается?

Попробуйте.

 
Aleksey Vyazmikin #:

Ну, если это данные файла exam, то да - разницы особо нет, просто я подумал, вдруг это файла train. Вы вместе три файла объединили изначально получается?

Попробуйте.

Да все 3 объединил, потом просто указываю длины участков.
 
elibrarius #:
Да все 3 объединил, потом просто указываю длины участков.

Понял, ну тогда нормально.

Думаю, что есть возможность улучшить обучения за счет уменьшения выборки, допустим обучаться на 1/10 - это позволит обучиться какой то одной фазе/структуре рынка - пока не требовал.

 

Только за счет изменения темпов обучения смог получить две модели из 100, отвечающих поставленному критерию.

Первая.

Вторая.

Получается, что да, CatBoost способен на многое, но нужно видимо тюнить настройки агрессивней.

 
Aleksey Vyazmikin #:

Понял, ну тогда нормально.

Думаю, что есть возможность улучшить обучения за счет уменьшения выборки, допустим обучаться на 1/10 - это позволит обучиться какой то одной фазе/структуре рынка - пока не требовал.

пробовал обучаться валкинг форвардом по 1000 и по 20000 - все сливает.
 
Во обучаете одному классу торговать/не торговать?
Или отдельно бай и сел?
 
elibrarius #:
Во обучаете одному классу торговать/не торговать?
Или отдельно бай и сел?

Результаты показаны из выборок без трансформации целевой, т.е. да - торговать и не торговать.

Но, действительно, сделав отдельные выборки на покупку и продажу легче обучиться будет.

elibrarius #:
пробовал обучаться валкинг форвардом по 1000 и по 20000 - все сливает.

Хм, странно. А какой метод для обучения используете - случайный лес?

 
Aleksey Vyazmikin #:

Хм, странно. А какой метод для обучения используете - случайный лес?

Переделка с алглибовского.
Сейчас побольше деревьев запустил в расчет. К утру думаю рассчитает новый вариант.

А может я чего-то криво переделал, если результат намного хуже вашего.