Обсуждение статьи "Исследование сезонных характеристик финансовых временных рядов при помощи диаграмм Boxplot" - страница 12

 
В обсуждении рыночного движения, мы решаем вопрос наличия/отсутствия закономерностей в узкой выборке данных, не понимая, что даже если они существуют в движении, не значит что данные позволят их извлечь. И никакая математика не позволит решить уравнение, в котором неизвестных больше чем известных. Получается, мы заранее принимаем условие искать закономерность в пространстве данных, в которых ее след может быть настолько размыт, что никакой анализ  ее не выявит. Но она есть и ее можно увидеть в других данных, которых у нас нет. Что делать? Для начала понять, что Рынок несёт большее разнообразие данных чем мы имеем, и если совместить все типы данных, закономерности проступят сильнее. Короче, нужно не только искать закономерности, но и обогащать разнообразие рыночных данных.

 
Maxim Dmitrievsky:
Просто признайте что я нашёл полезную закономерность, все остальное философствование. Но можете продолжать, по типу: Штирлиц стоял на своём, это была любимая пытка Мюллера.

раз есть такая вера, то нужно взять период от начала истории и разбить на участки по сегодняшний день

если закономерность найдена, то обязательно получится

ждемс

 
Renat Akhtyamov:

ждемс

ждите

 
Maxim Dmitrievsky:

ждите

то есть как?

найдена ошибка, все пропало и все это лажа?

 
Например, если бы у нас были данные открытого интереса и объемов капитала участников торговли, мы бы поместили их в наше общее статистическое исследование и увидели гораздо больше. Закономерности сразу бы проступили. Но нет. Мы ищем там где нам дают искать. Ну и результаты соответствующие.
 
fxsaber:

Это вопрос курицы и яйца. Можно себя убеждать в правильности любого подхода.

С моей точки зрения, Вы сделали неявную оптимизацию. Любое исследование - это неявная оптимизация, которая всегда является подмножеством явной.

Не оптимизация - это отсутствие статистического исследования. Грубо говоря, когда сделали гипотезу без данных и она подтвердилась.


Насчет конфетки, имеем дело с примитивнейшей ТС на МАшке.  Оптимизатор выхватит результат, если он есть, гораздо лучше классических исследований.

Единственное отличие - применение фильтра по времени. То самое, что используется вовсю ночниками многие годы.


Честно говоря, не понимаю, почему такая хрень происходит.

Кто-то скажет, что это объясняется ящиками с усами. Но это опять же дилемма курицы и яйца.

Факт, наитупейшая ТС показывает результаты, которые не могут не заставить задуматься. Обескуражен и хочу найти подвох.

Еще раз перечитал ваши доводы, непонятно на что направленные, и не уловил смысла.

По факту имеем: найдена закономерность при помощи boxplot'ов, она подтверждена тестом ТС.

Показано, что на другом интервале закономерность слабее проявлена, поэтому там ТС не работает (с изначальными параметрами)

Вы заоптили ТС и увидели, что и на том интервале можно вытащить ТС в +, чего я и не отрицал, показал только что там нет такой яркой закономерности. Не стоит исключать, что в разных ДЦ разные котировки, результаты могут отличаться.

Любе доводы от Вас и других оппонентов по поводу того, что это:

  1. просто МАшка и переоптимизация
  2. закономерность найдена не через boxplot'ы
  3. вы бы легко нашли ее сами через оптимизацию (вообще не зная где искать)
  4. это не закономерность

Не выдерживают никакой критики, а просто придирки из-за какого-то специфического недопонимания материала.

Из-за таких комментов у читающих может сложиться впечатление, что статья фуфло, хотя это совершенно не так. Что было подтверждено последующими комментариями от менее "шарящих", которые просто начали вторить Вашим словам, не понимая смысла сказанного. 

З.Ы. такими набросами можно кого угодно сбить с толку и обесценить подход

 

Поясните для нубов как именно строились усы. В приведенном коде, например:

Monthly_Returns.boxplot(column='close', by='month', figsize=(15, 8))

что, насколько я понимаю, означает установку по умолчанию 1.5 IQR, и усы симметричны.

А далее в тексте:

Усы ящиков дополняют распределение, охватывая 99% дисперсии всей выборки

Есть ссылка на формулу или документацию?

 
Stanislav Korotky:

Поясните для нубов как именно строились усы. В приведенном коде, например:

что, насколько я понимаю, означает установку по умолчанию 1.5 IQR, и усы симметричны.

А далее в тексте:

Есть ссылка на формулу или документацию?

Ящики с усами строятся всегда одинаково, в зависимости от распределения. В параметры переданы цены закрытия и период для гуппировки, в данном случае помесячно. Дальше просто размер картинки figsize

На русском в Википедии, вроде, нормально написано, в сравнении с pdf

Усы симметричны при симметричном распределении, соответственно

https://ru.wikipedia.org/wiki/%D0%AF%D1%89%D0%B8%D0%BA_%D1%81_%D1%83%D1%81%D0%B0%D0%BC%D0%B8

 

Объективности ради - никакая закономерность не может быть доказана статистическим исследованием. Статистика не применяется для доказательства гипотез или теорий, которые мы выдвигаем. Статистика может "подпереть" теорию связи некой причины и некого следствия, и позволить продолжить предположения, но она ничего не доказывает. Закономерность доказуема 100%-ым фактом взаимосвязи причины и следствия. Использовать статистику как доказательную базу, все равно что доказывать теорему Пифагора не формулами, а миллионами замеров соотношений сторон равнобедренных треугольников.

 
Реter Konow:

Объективности ради - никакая закономерность не может быть доказана статистическим исследованием. Статистика не применяется для доказательства гипотез или теорий, которые мы выдвигаем. Статистика может "подпереть" теорию связи некой причины и некого следствия, и позволить продолжить предположения, но она ничего не доказывает. Закономерность доказуема 100%-ым фактом взаимосвязи причины и следствия. Использовать статистику как доказательную базу, все равно что доказывать теорему Пифагора не формулами, а миллионами замеров соотношений сторон равнобедренных треугольников.

а нейросети похожи на пирамиды (версия Петра Конова)

закономерность это набор повторяющихся событий причина -> следствие, подкрепляемая статистикой и экспериментом. Чем больше повторяемость, тем выводы о ее наличии более статистически значимы. Закономерность может быть локальной, на каком-то куске графика, или глобальной.

Пора заречься заниматься демагогией с демагогами. Но пообщаться больше не о чем на форуме.