Есть ли закономерность в хаосе? Попробуем поискать! Машинное обучение на примере конкретной выборки. - страница 8

 
Aleksey Vyazmikin #:

Да, данных много, и я планирую ещё добавлять - поэтому требуется развитие методики отсева до начала обкчения.

Как раз сейчас обучаю, и скажу, что многое зависит от настроек, особенно от числа сплитов в квантовых таблицах.

Как раз запустил эксперимент, где обучение идет с параметрами по умолчанию на видеокарте - один проход, без учета оценки модели и теста на выборке exam, занимает 2-3 минуты - в зависимости от получившегося числа деревьев в модели. На моем, уже довольно устаревшем процессоре FX-8350, примерно на 60% медленней получается.

Считаю, что скорость вполне приемлемая, я обычно обучаю 100 моделей с фиксированным seed, что бы усреднить эффективность метода.

Если обучать до "упора", то там программа оценивает время до 2х часов.

2-3 минуты при глубине дерева 6 и 1000 деревьев?
 
spiderman8811 #:
Не уровни, а диапазоны плюс там волновые модели и на свечах. Таких нет в книгах. Работать должно. 
Тоже интересно подробнее))) непонятно от чего диапазон и какая модель)
 
elibrarius #:
2-3 минуты при глубине дерева 6 и 1000 деревьев?

Деревьев 250-400 получается строится, так как стоит контроль остановки обучения по тестовой выборке, т.е. если нет улучшения в течении последних 100 деревьев, то обучение прекращается и модель обрезается до последнего дерева с улучшением.

 
Aleksey Vyazmikin #:

Вот ещё вариант - нравится даже больше, так как на всех выборках стабильный результат.



0.042 самый лучший результат. Лучше, чем на всех столбцах и кривая баланса покрасивее. Но не так хорошо, как у вас на Катбусте получилось


 
Aleksey Vyazmikin #:

Первый столбец - нулевой или "1"? :)

Вот с нуля отсчет

0,02400


 
Aleksey Vyazmikin #:

Возможно, близкие по смыслу 1041-1489.

На 448 барах лучший 0,03000


 
elibrarius #:

0.042 самый лучший результат. Лучше, чем на всех столбцах и кривая баланса покрасивее. Но не так хорошо, как у вас на Катбусте получилось


elibrarius #:

На 448 барах лучший 0,03000


Результат уже явно лучше, и достигнут он, похоже, из-за выбора способствующих обучению предикторов. А сколько их ещё там полезных и как их вытащить - вот что волнует.

Попробуйте изменить целевую, сделав "1" только в случае достижения прибыли более 50 пунктов (может и меньше лучше) - это улучшило обучение в моих экспериментах, хотя число позитивных целевых ещё сильней стало меньше...

 
Aleksey Vyazmikin #:

Результат уже явно лучше, и достигнут он, похоже, из-за выбора способствующих обучению предикторов. А сколько их ещё там полезных и как их вытащить - вот что волнует.

Попробуйте изменить целевую, сделав "1" только в случае достижения прибыли более 50 пунктов (может и меньше лучше) - это улучшило обучение в моих экспериментах, хотя число позитивных целевых ещё сильней стало меньше...

2-й столбец - это и есть порог срабатывания класса (но не в разметке учителя, а  прогноза). 3-й прибыль.
График для поргоа  60 пт самый лучший.
 
elibrarius #:
2-й столбец - это и есть порог срабатывания класса (но не в разметке учителя, а  прогноза). 3-й прибыль.
График для 60 пт самый лучший.

А как при прогнозе Вы знаете прибыль, или у Вас регрессионная модель?

Попробуйте при обучении сместить :)

 
Aleksey Vyazmikin #:

А как при прогнозе Вы знаете прибыль, или у Вас регрессионная модель?

Попробуйте при обучении сместить :)

Прибыль и график рассчитываю после обучения.