Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3025

 
Aleksey Vyazmikin #:

Да, в R тоже так у меня - сохраняет по своему структуру дерева в чудном виде. Потом у меня парсер отдельный для вытаскивания листьев.

Что-то вроде такого будет, можно сортировать по максимальному импортансу в модели, по вероятности принадлежности к классу и по частоте использования

на сегодня хватит


 
Maxim Dmitrievsky #:

Что-то вроде такого будет, можно сортировать по максимальному импортансу в модели, по вероятности принадлежности к классу и по частоте использования

на сегодня хватит


Результативно!

Кодирование предикторов в номера делайте из генеральной выборки?

 
Aleksey Vyazmikin #:

Результативно!

Кодирование предикторов в номера делайте из генеральной выборки?

любые названия

 
Maxim Dmitrievsky #:

любые названия

Если названия столбцов таблицы генеральной выборки из дерева берутся - нормально.

О скорости можно подумать потом, если это будет работать хоть сколько то эффективно.

 
Aleksey Vyazmikin #:

Если названия столбцов таблицы генеральной выборки из дерева берутся - нормально.

О скорости можно подумать потом, если это будет работать хоть сколько то эффективно.

Ну вот вы уже 500 тысяч лет листья отбираете. Нашлось чего нормального-то? Хотя бы штук 10 :)
 
Maxim Dmitrievsky #:
Ну вот вы уже 500 тысяч лет листья отбираете. Нашлось чего нормального-то? Хотя бы штук 10 :)

Да я же публиковал результат. Да, находятся нормальные варианты. Но три года этим не занимаюсь.

Ещё нюанс, мой эксперимент с отбором листьев ограничен одной только выборкой.

 
Aleksey Vyazmikin #:

Да я же публиковал результат. Да, находятся нормальные варианты. Но три года этим не занимаюсь.

Ещё нюанс, мой эксперимент с отбором листьев ограничен одной только выборкой.

Как это 3 года не занимаюсь, а чем занимаетесь 
Ну посмотрим, генерит в принципе быстро 
 
Maxim Dmitrievsky #:
Как это 3 года не занимаюсь, а чем занимаетесь 
Ну посмотрим, генерит в принципе быстро 

Глобально - квантовыми таблицами и занимался. Много тестов и экспериментов проведено, в том числе на разных выборках.

 
Aleksey Vyazmikin #:

Глобально - квантовыми таблицами и занимался. Много тестов и экспериментов проведено, в том числе на разных выборках.

а в каком виде вы правила в катбуст пихаете? или он там вообще не участвует 

 
Maxim Dmitrievsky #:

а в каком виде вы правила в катбуст пихаете? или он там вообще не участвует 

В бинарном виде. Столбец - номер правила, а значение "1" - сработало правило и "0" - не сработало правило. Ну а целевая как на основной выборке.

Это один из способов всё агрегировать. Но, CatBoost не очень хорошо справляется с задачей тут, как мне кажется - очень разряженные данные.

Причина обращения: