Используйте таблицу генеральной выборки, чтобы сразу неравенства получать в виде правил - Общее обсуждение

Maxim Dmitrievsky 2023.04.12 22:15 #30241

Aleksey Vyazmikin #:

Да, в R тоже так у меня - сохраняет по своему структуру дерева в чудном виде. Потом у меня парсер отдельный для вытаскивания листьев.

Что-то вроде такого будет, можно сортировать по максимальному импортансу в модели, по вероятности принадлежности к классу и по частоте использования

на сегодня хватит

Aleksey Vyazmikin 2023.04.12 22:20 #30242

Maxim Dmitrievsky #:

Что-то вроде такого будет, можно сортировать по максимальному импортансу в модели, по вероятности принадлежности к классу и по частоте использования

на сегодня хватит

Результативно!

Кодирование предикторов в номера делайте из генеральной выборки?

Maxim Dmitrievsky 2023.04.12 22:21 #30243

Aleksey Vyazmikin #:

Результативно!

Кодирование предикторов в номера делайте из генеральной выборки?

любые названия

Aleksey Vyazmikin 2023.04.12 22:25 #30244

Maxim Dmitrievsky #:

любые названия

Если названия столбцов таблицы генеральной выборки из дерева берутся - нормально.

О скорости можно подумать потом, если это будет работать хоть сколько то эффективно.

Maxim Dmitrievsky 2023.04.12 22:34 #30245

Aleksey Vyazmikin #:

Если названия столбцов таблицы генеральной выборки из дерева берутся - нормально.

О скорости можно подумать потом, если это будет работать хоть сколько то эффективно.

Ну вот вы уже 500 тысяч лет листья отбираете. Нашлось чего нормального-то? Хотя бы штук 10 :)

Aleksey Vyazmikin 2023.04.12 22:40 #30246

Maxim Dmitrievsky #:
Ну вот вы уже 500 тысяч лет листья отбираете. Нашлось чего нормального-то? Хотя бы штук 10 :)

Да я же публиковал результат. Да, находятся нормальные варианты. Но три года этим не занимаюсь.

Ещё нюанс, мой эксперимент с отбором листьев ограничен одной только выборкой.

Maxim Dmitrievsky 2023.04.12 22:43 #30247

Aleksey Vyazmikin #:

Да я же публиковал результат. Да, находятся нормальные варианты. Но три года этим не занимаюсь.

Ещё нюанс, мой эксперимент с отбором листьев ограничен одной только выборкой.

Как это 3 года не занимаюсь, а чем занимаетесь

Ну посмотрим, генерит в принципе быстро

Aleksey Vyazmikin 2023.04.12 23:23 #30248

Maxim Dmitrievsky #:
Как это 3 года не занимаюсь, а чем занимаетесь

Ну посмотрим, генерит в принципе быстро

Глобально - квантовыми таблицами и занимался. Много тестов и экспериментов проведено, в том числе на разных выборках.

Maxim Dmitrievsky 2023.04.13 10:55 #30249

Aleksey Vyazmikin #:

Глобально - квантовыми таблицами и занимался. Много тестов и экспериментов проведено, в том числе на разных выборках.

а в каком виде вы правила в катбуст пихаете? или он там вообще не участвует

Aleksey Vyazmikin 2023.04.13 11:22 #30250

Maxim Dmitrievsky #:

а в каком виде вы правила в катбуст пихаете? или он там вообще не участвует

В бинарном виде. Столбец - номер правила, а значение "1" - сработало правило и "0" - не сработало правило. Ну а целевая как на основной выборке.

Это один из способов всё агрегировать. Но, CatBoost не очень хорошо справляется с задачей тут, как мне кажется - очень разряженные данные.

Торговля против толпы - [Архив!] FOREX - Тенденции, Всего лидеров

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3025