Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2742

 
Maxim Kuznetsov #:

при всём уважении, но это не подытоживание (не дайджест или краткое изложение). Тут сквозит личное отношение и необоснованные нападки. 

можно подумать что у кого то есть обоснованная теория где "обученная модель должна работать на новых данных" :-) ещё и подтверждаемая..ога

А если внимательно читать, то можно увидеть засаду в п.2, т.е. изначальную подгонку под историю. Поэтому у него ошибка обучения падает.

П.4 немного прибавляет оптимизма, если это делается не на всей доступной истории. Это нужно делать только для трейн выборки, по хорошему. Чтобы получить адекватную оценку модели на новых данных.

Как известно, не увлекаюсь психологией, поэтому у меня нигде никогда не сквозит. И лично ни с кем не знаком.
 
СанСаныч Фоменко #:

Добить до уровня советника не хватает сил. Но результат ошибки подгонки модели: от 8% до 22% - это ошибка подгонки, которая мало отличается на участке подгонки и вне выборки.

Это как бы намекает, что подгонка подо всю историю была сделана ещё до обучения. Если не так, то поправьте. На каком интервале оценивались/выбирались признаки и на каком было обучение?

У меня просто есть метод похожий, могу поделиться результатами на выходных. Только если будет предметное общение, а не игра в слова.
 
Maxim Dmitrievsky #:
 основан на корреляции, поскольку «отношение» и «связь» это определения корреляции.
Отношение и связь это определение корреляции???? Серйезно??? 

Звенья цепочки на шее связаны между собой,  те у них связь. Это корреляция? 

У меня отношения с девушкой,  отношения между нами это корреляция??? 

Корреляция это в первую очередь мера! тупица

 

в доп. к Maxim Dmitrievsky

вот я об этом и говорю:
чтобы делать классификацию, не надо делать тупо на up/down dir, а сначала хотя бы сделать кластерный анализ, чтобы определиться сколько классов формально выделить (как их назвать уже дело субъективного вкуса)...
и только потом определять дискриминантные функции, на основании которых относить sample'ы к тому или иному классу... тогда и классификация будет с нормальным процентом точности, - когда знаем, что классы на которые разделяем, действительно существуют...
PCA - лишь как вариант факторного анализа для выделения ортогональных признаков, но он объясняет ВСЮ дисперсию, без выделения главных факторов,
т.к. главные компоненты - это лишь исх. данные трансформированные в eigenvector-коэфициенты ("loadings"), которые при умножении на исх. данные дают pc_scores... (как-то так - давно не вспоминала алгоритм)
- но в итоге PCA объясняет ВСЮ дисперсию, без fs... в анализе же главных факторов используется "только вариация переменной, общая и для др. переменных"... (Не настаиваю, что это лучший fs -- но везде свои нюансы)
в общем FS никто не может выполнить правильно, и пытается обвинить в этом библиотеку...
PCA в совокупности с +/-3ср.кв.откл -- может помочь убрать outliers, но это лишь для норм. распределения, а то что ваша ген. совокупность подчиняется норм закону распр-я вам ещё доказать надо! - тоже сиатистически... иначе и PCA покажет "маслом по Репину" (а не наоборот)...
== как бы достаточно статистически адекватный способ построения модельки вижу примерно таким...

===
а библиотека уже 10-е дело (даже если модераторы обзываются не понимая о чём речь в нормальном DataScience - неучи всегда грезят банкетом и обвиняют в этом весь мир) -- пока те кто, действительно, хочет разобраться, уже давно поняли, что не в программерском языке дело, а в алгоритмах, которые стоят за теми или иными сущностями, реализованными хоть в библиотеке инопланетян -- сути причинно-следственных связей это (название библиотеки) не меняет

p.s.

пока модераторы на банкете(, другие работают - брали бы с них пример - не разводили бы дезинформацию


 
JeeyCi #:

PCA - лишь как вариант факторного анализа для выделения ортогональных признаков, но он обясняет ВСЮ дисперсию, без выделения главных факторов,

Есть РСА с учетом целевой, он выделит компоненты которые характеризуют целевую, но печаль в том что целевая это субьективная переменная и она "поплвет" сразу как закончиться трейн... да и чем это тогда отличаеться от обычного обучения с учителем..

 
JeeyCi #:

в доп. к Maxim Dmitrievsky

вот я об этом и говорю:
чтобы делать классификацию, не надо делать тупо на up/down dir, а сначала хотя бы сделать кластерный анализ, чтобы определиться сколько классов формально выделить (как их назвать уже дело субъективного вкуса)...
и только потом определять дискриминантные функции, на основании которых относить sample'ы к тому или иному классу... тогда и классификация будет с нормальным процентом точности, - когда знаем, что классы на которые разделяем, действительно существуют...
PCA - лишь как вариант факторного анализа для выделения ортогональных признаков, но он обясняет ВСЮ дисперсию, без выделения главных факторов,
т.к. главные компоненты - это лишь исх. данные трансформированные в eigenvector-коэфициенты ("loadings"), которые при умножении на исх. данные дают pc_scores... (как-то так - давно не вспоминала алгоритм)
- но в итоге PCA объясняет ВСЮ дисперсию, без fs... в анализе же главных факторов используется "только вариация переменной, общая и для др. переменных"... (Не настаиваю, что это лучший fs -- но везде свои нюансы)
в общем FS никто не может выполнить правильно, и пытается обвинить в этом библиотеку...
PCA в совокупности с +/-3ср.кв.откл -- может помочь убрать outliers, но это лишь для норм. распределения, а то что ваша ген. совокупность подчиняется норм закону распр-я вам ещё доказать надо! - тоже сиатистически... иначе и PCA покажет "маслом по Репину" (а не наоборот)...
== как бы достаточно статистически адекватный способ построения модельки вижу примерно таким...

===
а библиотека уже 10-е дело (даже если модераторы обзываются не понимая о чём речь в нормальном DataScience - неучи всегда грезят банкетом и обвиняют в этом весь мир) -- пока те кто, действительно, хочет разобраться, уже давно поняли, что не в программерском языке дело, а в алгоритмах, которые стоят за теми или иными сущностями, реализованными хоть в библиотеке инопланетян -- сути причинно-следственных связей это (название библиотеки) не меняет

p.s.

пока модераторы на банкете(, другие работают - брали бы с них пример - не разводили бы дезинформацию

Модераторы вообще не понимают о чем речь, поэтому любое адекватное сообщение трактуют как провокацию 😀

А то что 🤡 сидят и провоцируют, прыгая с темы на тему, это ничего, зато большинству все понятно что они пишут..

И поскольку никто пока не нашёл универсальный подход, то все выглядит одинаково пустым по наполнению внешне, но по смыслу у клоунов все логически противоречиво, то есть заранее ложно
 
Maxim Dmitrievsky #:
Про тебя уже сказано что ты Птушник, поэтому тебя так штырит

кем сказано? бестолочью которая трех слов связать не может чтобы логику не нарушить )) ахаха, это серйезно...

 
mytarmailS #:

кем сказано? бестолочью которая трех слов связать не может чтобы логику не нарушить )) ахаха, это серйезно...

ты не понимаешь речевых оборотов, не понимаешь когда написано для краткости, не понимаешь определений, то есть ничего

просто фонишь не по теме. Это отличительная черта птушников

тебя никто в этом не обвиняет, люди разные. Просто не лезь туда где дуб дубом, не встревай :D
 
Maxim Dmitrievsky #:

ты не понимаешь речевых оборотов

гениально)) пишем любой маразм, а если хоть кто то думающий ткнет тебя  носом, ты ему  -  ты не понимаешь речевых оборотов , птушник

А что ты имеешь против птушников? они типа не люди? или твой бывшый оттуда? 

 
JeeyCi #: up/down dir, ... на основании которых относить sample'ы
...

Пишите на русском, читать невозможно.  А с sample'ы даже смешно. Большинство ваших постов из за этого обычно вообще не читаю.

Причина обращения: