Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2740

 
Что надо сделать чтобы мы перестали сраться и обьединись ради одной цели???????? 
 
mytarmailS #:
Что надо сделать чтобы мы перестали сраться и обьединись ради одной цели???????? 

Надо быть полезным друг другу и не боятся признавать ошибки, уважительно относится.

 
Aleksey Vyazmikin #:

Да как так то, я просил скрипт сделать - да, цитирую " Можете сделать скрипт на R для вычислений под мою выборку - я запущу его ради эксперимента. Эксперимент должен выявить оптимальный размер выборки. ", но это уже в ответ на то, что сделали.

Ранее я писал "... И как смотреть в динамике предлагаете, как реализоать? " - тут я спрашивал как раз про реализацию оценки предикторов в динамике, т.е. регулярная оценка каким то окном и то не понятно - окно на каждом новом примере или по прошествии каждых n примеров. Если Вы так и сделали, то я этого не понял.

То, что Вы выложили код - великолепно, но просто мне сложно понять, что он конкретно делает или чего доказывает по сути, поэтому стал задавать дополнительные вопросы. Вот что там означают две картинке с графиками?

Скрипт вычисляет важность предикторов в скользящем окне двумя разными алгоритмами,  форестом и ещё одним способом... Как ты и просил
 
mytarmailS #:
 

В cкользящем окне переобучать модель и смотреть важность признаков, или просто взять какой то определятор хороших признаков и смотреть его в ск. Окне

...

Также разные фиче-селекторы на любой вкус , наверное 5% от того что есть в Р-ке

размер окна плавающий для получения эффективных оценок д.б., не просто плавающее на шаг или const , - в этом проблема - на каждой итерации подбирать размер окна разве что - моделька обучаться будет долго... да и переодическое ручное переобучение и есть само по себе скользящее окно! -- всё равно ведь будете переодически этим заниматься (выходя за приемлемый st.dev) -- если есть свой график переобучения - то его и можно тоже автоматизировать. НО повторюсь - размер окна - тоже плавающий.

...

разные? - всё равно алгоритмически всё сводится к feature mapping всегда (!), как ни назовите, ... просто свои нюансы и своё поле для применения.

даже если не всем хочется это называть корреляцией

СанСаныч Фоменко # :
   

Опираюсь на понятие связи предиктора и учителя. "Связь" - это НЕ корреляция и не "важность" предикторов из подгонки практически любой модели МО.

ссылка на caret - всё тот же Classification and Regression Training - как банальное МО, всё тот же sklearn для Python.

Просто МО создавался не только для построения вероятностных моделей (на основе имеющихся распределений вероятностей), но и для детерминантных и динамических... но в основе любой генерализации вероятностей всегда (!) будет лежать статистика (с её корреляциями), как ни назовите... Иначе вы будете получать смещённые(!) оценки - т.е. ваша модель будет моделировать что-то другое (наобум), а не ваш target.

 
mytarmailS #:
Что надо сделать чтобы мы перестали сраться и обьединись ради одной цели???????? 

прекрасный вопрос!

---

тут надо распознать - кого больше: продавцов или покупателей?

но беда только в том, что если цену двинуть вниз, то покупателей будет больше, гарантия!

 
JeeyCi #:


ссылка на caret - всё тот же Classification and Regression Training - как банальное МО, всё тот же sklearn для Python.


Читайте внимательней, а придумывать не надо

 
mytarmailS #:
Скрипт вычисляет важность предикторов в скользящем окне двумя разными алгоритмами,  форестом и ещё одним способом... Как ты и просил

Форест дают частоту использования предиктора в конкретном алгоритме, поэтому запросто дает высокую важность предикторам, которые НЕ имеют связи с целевой. 

 
СанСаныч Фоменко #:

Читайте внимательней, а придумывать не надо

куда уж внимательнее, если caret, действительно так расшифровывается

 
СанСаныч Фоменко #:

Форест дают частоту использования предиктора в конкретном алгоритме, поэтому запросто дает высокую важность предикторам, которые НЕ имеют связи с целевой. 

повторю : готовых фиче селекторов десятки, и все ищут связь с целевой, все уже придумано до нас, давно

 
СанСаныч Фоменко #:

Вроде бы у вас видел какие-то намёки на применение survival analysis. Есть ли что интересное в данном направлении? У меня есть некоторые идеи, связанные с заменой времени поломки на величину максимального продвижения цены в нужном направлении в процессе трейда до срабатывания стопа. Основная идея в поиске отклонений от того, какое поведение должно быть при случайном блуждании. В этой области, кстати, тоже весьма развито применение матстата (регрессия Кокса, например) и МО.

Причина обращения: