Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2786

 

там  Aleksey Vyazmikin  задавал автору такой вопрос в комментах - получил линк на ветку обсуждения -- линк ИСПОРЧЕН ! автор Vladimir Perervenko   ушёл в подполье? )

 

Пришла в голову идея локального решающего дерева. Это что-то вроде аналога KNN или локальной регрессии (тоже потенциально подходит при нестационарности). Смысл в том, что разбиваем на боксы только бокс содержащий интересующую точку (до не менее, чем заданное число К точек в нём), а остальными боксами не интересуемся. Затем делаем по аналогии с KNN.  Возможно, будет лучше чем KNN или локальная регрессия если границы между классами резкие и точка близка к такой границе.

Интересно, насколько вообще подход имеет смысл.

 
СанСаныч Фоменко #:

Пока находимся на уровне рассуждения тригонометрических функций или еще чего-либо на этом уровне, то обоснования нет по одной причине - сделать обоснование невозможно, так как НЕ продекларирована цель таких обоснований и неизвестен критерий достижения цели.

 А  цель в МО единственная - уменьшить ошибку подгонки, а точнее уменьшить ошибку предсказания моделью машинного обучения. Причем при ограничении: ошибка предсказания НЕ должна сильно меняться в будущем.     

а цель всегда одна - логика и адекватность вместо тупого перебора жадным алгоритмом всего мусора и рёвом о нехватке мощностей на это дело...

да, оценки должны быть (состоятельными) устойчивыми- у вас это называется "ошибка не должна меняться", само предсказание будет меняться во временных рядах (в динамике)...

вы дальше своих рекламных реплик об инструментах продвинуться не можете -- не зная, как эти инструменты работают... вам дали кувалду в руки - вы ей и размахиваете (вы - Чапаев??? ) со ссылкой на порог вашей IV=0.02 - ЧТО ЕСТЬ СЛАБАЯ(!) связь -- так чего вы тут машете своими лозунгами.. а предложения адекватного анализа обзываете машками (где их в помине не было никогда)... откройте себе рекламную ветку

а MO да - везде работает одинаково и ДЛЯ ОДИНАКОВЫХ ЦЕЛЕЙ - и в Py и др библиотеках она совсем не IV -- но суть не меняется, -- вы, видимо, не понимая суть анализа данных - только и можете, что выкрикивать лозунги о кандидатах и инструментах и тупо загружать мусор в свой "чёрный ящик" -- и даже применить по назначению ваши предсказания не напряглись...

ну откройте вы себе ветку для своих рекламных акций, там и покричите -- если кроме churn analysis ничего сделать не можете (даже нормальных выводов) -- выглядите, как коллектор хренов, пытающийся чужие идеи выбивать на свой металлолом (кроме слова инструмент - даже в его работе не разобрались) -- чем LogisticRegression не устроила??

=== отвечать не обязательно! (ваша personal Informational Value = 0 для меня)... ваши трактовки линейной алгебры ещё ниже по IV

 
Aleksey Nikolayev #:

Можно просто сравнить гистограммы выборки до и после преобразования. Если итоговая ближе к целевому виду (нормальное или равномерное распределение к примеру), то преобразование вполне подойдёт.) Можно вместо рисования гистограмм считать тесты на соответствие цели (на нормальность или равномерность, соответственно)

Вроде тарелки делают параболической формы? Вполне по формуле)

Да, посмотреть и визуально выбрать, что ближе к целевой) Но в этом нет логики, что делает это преобразование и почему оно лучше остальных.

До этих парабол долго шли))) А фильтра ваще еще те трещетки))))

 
JeeyCi #:

а цель всегда одна - логика и адекватность вместо тупого перебора жадным алгоритмом всего мусора и рёвом о нехватке мощностей на это дело...

да, оценки должны быть состоятельными - у вас это называется "ошибка не должна меняться", само предсказание будет меняться во временных рядах (в динамике)...

вы дальше своих рекламных реплик об инструментах продвинуться не можете -- не зная, как эти инструменты работают... вам дали кувалду в руки - вы ей и размахиваете (вы - Чапаев??? ) со ссылкой на порог вашей IV=0.02 - ЧТО ЕСТЬ СЛАБАЯ(!) связь -- так чего вы тут машете своими лозунгами.. а предложения адекватного анализа обзываете машками (где их в помине не было никогда)... откройте себе рекламную ветку

а MO да - везде работает одинаково и ДЛЯ ОДИНАКОВЫХ ЦЕЛЕЙ - и в Py и др библиотеках она совсем не IV -- но суть не меняется, -- вы, видимо, не понимая суть анализа данных - только и можете, что выкрикивать лозунги о кандидатах и инструментах и тупо загружать мусор в свой "чёрный ящик" -- и даже применить по назначению ваши предсказания не напряглись...

ну откройте вы себе ветку для своих рекламных акций, там и покричите -- если кроме churn analysis ничего сделать не можете (даже нормальных выводов) -- выглядите, как коллектор хренов, пытающийся чужие идеи выбивать на свой металлолом (кроме слова инструмент - даже в его работе не разобрались) -- чем LogisticRegression не устроила??

=== отвечать не обязательно! (ваша personal Informational Value = 0 для меня)... ваши трактовки линейной алгебры ещё ниже по IV

Предыдущий текст имел смыл, но отражал непонимание того, чем тут занимаются.

Ответил НЕ Вам, а другим читателям, которые постоянно забывают о цели и критерии достижении цели, хотя тут полно людей которые об этом понимают вполне профессионально, владея соответствующим инструментом.

А этот текст НЕ обладает смыслом, какая-то обида маленькой девочки. Не вижу смысла отвечать.

 
JeeyCi #:

а цель всегда одна - логика и адекватность вместо тупого перебора жадным алгоритмом всего мусора и рёвом о нехватке мощностей на это дело...

Будем считать что этого не было)))

Логика и адекватность оценок и понимание процессов конечно лучше, чем их отсутствие. Но в статистике и теорвере достаточно часто нет объяснений почему та или иная методика работает. Чел подкидывал иголку, что то там мерял и вычислял число Пи, другой смотрел историю наводнений на Ниле и нашел что измерить, что бы предсказать следующее. Логики в их действиях минимум. 

Так же и в рядах думается, нужно найти нужные признаки, что мерять в общем)))

 
пикетчики опять повылазили ... митингуют не здесь... и гадают не здесь... и цитировать так и не научились, приписывая свои домыслы другим
 
Valeriy Yastremskiy #:

Логика и адекватность оценок и понимание процессов конечно лучше, чем их отсутствие. Но в статистике и теорвере достаточно часто нет объяснений почему та или иная методика работает. Чел подкидывал иголку, что то там мерял и вычислял число Пи, другой смотрел историю наводнений на Ниле и нашел что измерить, что бы предсказать следующее. Логики в их действиях минимум. 

Так же и в рядах думается, нужно найти нужные признаки, что мерять в общем)))

С этим трудно не согласиться.


Но надо понимать, что без понимания ЦЕЛИ всего исследования очень быстро скатываешься к начетничеству, к изложению соответствующего учебника без всяких перспектив получить конечный продукт.

 

про иголки и наводнения...просто к слову пришлось и совпало:

генерируем 100500*10^3 1D случайных движений; если брать отдельную траекторию из всего пучка random-walk и тщательно её рассматривать, то она не особо-то следует общим интегральным выводам. Местами просто им противоречит. 

а мы тут работаем/торгуем/отдыхаем всегда с одной отдельной выборкой. И других у нас нет

 

СанСаныч Фоменко #:
  ...

так пишут те, кто ""статью"" накатал, а защититься не может... о чём и свидетельствовали ранние его претензии к НИИ

... все козлы...