Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 646

 
Dr. Trader:

Есть 2 типа на выбор -
1=mean decrease in accuracy (наверное это и есть mda, сходится по первым буквам)
2=mean decrease in node impurity

а есть и спец пакеты VSURF, VarSelRF, Boruta. 

 
Ivan Negreshniy:

а есть и спец пакеты VSURF, VarSelRF, Boruta. 

а какой лучше? )

 
Maxim Dmitrievsky:

а какой лучше? )

Так это только небольшая часть из R, что на случайных лесах работают, Boruta кажется и для Python есть.

А лучше ИМХО, те что больше вариаций, но меньше заморочек для пользователя, а самое лучшее на полном автомате, анализировать модель и перебирать все подходящие)

 
Ivan Negreshniy:

Так это только небольшая часть из R, что на случайных лесах работают, Boruta кажется и для Python есть.

А лучше ИМХО, те что больше вариаций, но меньше заморочек для пользователя, а самое лучшее на полном автомате, анализировать модель и перебирать все подходящие)

да думал переписать что-нибудь из фичаимортанса для лесов для МТ5, чтоб под рукой было

все что-то пока никак не доберусь

пофиг вообще на всю эту кучу всякой фигни из Р, там за жизнь не изучишь.. :) а тем более не используешь все
 
Maxim Dmitrievsky:

да думал переписать что-нибудь из фичаимортанса для лесов для МТ5, чтоб под рукой было

все что-то пока никак не доберусь

пофиг вообще на всю эту кучу всякой фигни из Р, там за жизнь не изучишь.. :) а тем более не используешь все

если самому писать, то однозначно с классического фичимпортанса Бреймана начинать - переставляешь поочередно фьючи в тренировочном наборе и вычислять их значимость по изиенению MSE в OOB или индекса Gini в расщеплениях деревьев.

по идее это должно работать для временных рядов, так можно удалять необходимое к-во менее значимых элементов и приводить разные по протяженности паттерны к одной размерности.
Random forest - Wikipedia
Random forest - Wikipedia
  • en.wikipedia.org
Random forests or random decision forests[1][2] are an ensemble learning method for classification, regression and other tasks, that operate by constructing a multitude of decision trees at training time and outputting the class that is the mode of the classes (classification) or mean prediction (regression) of the individual trees. Random...
 
Ivan Negreshniy:

если самому писать, то однозначно с классического фичимпортанса Бреймана начинать - переставляешь поочередно фьючи в тренировочном наборе и вычислять их значимость по изиенению MSE в OOB или индекса Gini в расщеплениях деревьев.

по идее это должно работать для временных рядов, так можно удалять необходимое к-во менее значимых элементов и приводить разные по протяженности паттерны к одной размерности.

Да, Gini для начала хочу

да и вообще леса проще в использовании, той же оптимизации  

 
По моему цена растет медленнее, чем падает. Т.е. разные картинки-образы для запоминания будут. Но попробовать и сравнить наверное не долго.
 
elibrarius:
По моему цена растет медленнее, чем падает. Т.е. разные картинки-образы для запоминания будут. Но попробовать и сравнить наверное не долго.

на форексе одинаово :) там же 2 валюты

мне вот интересно не получится ли там взаимоисключающих примеров.. по сути не должно быть много

 
Maxim Dmitrievsky:

на форексе одинаово :) там же 2 валюты

мне вот интересно не получится ли там взаимоисключающих примеров.. по сути не должно быть много

Так это и нормально. Пусть N -класс 1, и M - класс 2, и пусть класы пересекаются, что, имхо, и должно быть.

Тогда вероятности Pn =n/N и Pm=m/M. Если вероятнотсь>0,5 то ДМ сама с этим справится. Пересечение по опыту  где-то на уровне 20-40%, т.е., лт 20 до 40% сделок будут неправильными.

 
Yuriy Asaulenko:

Так это и нормально. Пусть N -класс 1, и M - класс 2, и пусть класы пересекаются, что, имхо, и должно быть.

Тогда вероятности Pn =n/N и Pm=m/M. Если вероятнотсь>0,5 то ДМ сама с этим справится. Пересечение по опыту  где-то на уровне 20-40%, т.е., лт 20 до 40% сделок будут неправильными.

ну по сути да, маслом кашу не испортишь, и переобучения меньше. И в таких, казалось бы, мелочах, может и крыться залог эффективности

только у меня не классы а регрессия

а еще можно немного трансформировать исходный ряд (аффинно, например) и его приращения тоже впихнуть (я так понимаю, монте-карло примерно для этого и нужен?)

короче мне уже нравится что я делаю, осталось 3 недели до моего финиша с НС :)) либо грааль либо ну их нафиг. Делайте ставки :))

Причина обращения: