Обсуждение статьи "Основы статистики"

 

Опубликована статья Основы статистики:

Каждый трейдер в своей работе использует те или иные статистические выкладки, даже если он сторонник фундаментального анализа. Эта статья познакомит вас с основами статистики, с ее базовыми элементами, а так же расскажет о ее важности для принятия решений.

Автор: Сергей

 

Это всё мы знаем, расскажите наконец, как из этого грааль построить )))

Да, и если можно, расскажите, как идентифицировать полимодальное распределение, или хотя бы бимодальное ) 

 
... Вдобавок к этому хотелось бы сказать, что изучать статистику, как и любую другую науку, нужно с самых азов. Даже благодаря ее базовым элементам можно упрощать понимание многих сложных вещей, механизмов, закономерностей, ...

О мне нравятся азы, они как аксиомы. На прочном фундаменте - прочный "грааль" ))


Пару моментов на которые не нашел ответов в статье по азам:

1) Почему выборочная оценка матожидания - это среднеарифметическое, а не скажем среднегеометрическое, среднегармоническое, или даже медиана. Чем обоснован такой выбор ?

2) Почему если надо узнать "насколько значения выборки отдалены от ее математического ожидания " необходимо посчитать дисперсию, вместо скажем средне абсолютного отклонения ?

3) В коэффициенте эксцесса есть интересная троечка, которая может чуток накуролесить если коэффициент в знаменателе. Ради какого удобства она туда попала ?


P.S. Это не придирки к статье, а просто на подумать тем кто хапает азы.
 
Кстати, мне тоже всегда было интересно, чем среднеквадратичное отклонение лучше среднеабсолютного. У него какие-то другие статистические свойства? Или все эти возведения в квадрат только из-за того, что в математике нет функции взятия модуля в аналитическом виде? )))
 
bas:
Кстати, мне тоже всегда было интересно, чем среднеквадратичное отклонение лучше среднеабсолютного. У него какие-то другие статистические свойства? Или все эти возведения в квадрат только из-за того, что в математике нет функции взятия модуля в аналитическом виде? )))

Возможно, это просто свойства алгебры нашего пространства? Хотя вот нашел статью, которая прямо отвечает на вопрос -http://statanaliz.info/teoriya-i-praktika/10-variatsiya/15-dispersiya-standartnoe-otklonenie-koeffitsient-variatsii.html :

Стандартное отклонение, очевидно, также характеризует меру рассеяния данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень).

Тем не менее, со стандартным отклонением уже можно работать непосредственно, потому что свойства данного показателя хорошо изучены и известны. К примеру, есть такое правило трех сигм, которое гласит, что в данных с нормальным распределением 997 значений из 1000 будут находиться не далее, чем 3 сигмы в ту или иную сторону от среднего значения.

Сигма, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Дисперсия, стандартное отклонение, коэффициент вариации
Дисперсия, стандартное отклонение, коэффициент вариации
  • statanaliz.info
Здравствуйте, уважаемые любители статистики и посетители блога statanaliz.info. Из предыдущей статьи мы узнали, что такое вариация данных и рассмотрели такие показатели, как размах вариации и среднее линейное отклонение. Оба показателя отличаются и методом расчета (это очевидно), и интерпретацией. Однако статистические показатели изменчивости...
 
bas:
Кстати, мне тоже всегда было интересно, чем среднеквадратичное отклонение лучше среднеабсолютного.
Среднеквадратичное отклонение дифференцируется в отличие от среднеабсолютного. Что в свою очередь дает возможность использования этой функции в дальнейших аналитических расчетах, например в методе наименьших квадратов. Есть и другие преимущества.
 
GaryKa:

О мне нравятся азы, они как аксиомы. На прочном фундаменте - прочный "грааль" ))


Пару моментов на которые не нашел ответов в статье по азам:

1) Почему выборочная оценка матожидания - это среднеарифметическое, а не скажем среднегеометрическое, среднегармоническое, или даже медиана. Чем обоснован такой выбор ?

2) Почему если надо узнать "насколько значения выборки отдалены от ее математического ожидания " необходимо посчитать дисперсию, вместо скажем средне абсолютного отклонения ?

3) В коэффициенте эксцесса есть интересная троечка, которая может чуток накуролесить если коэффициент в знаменателе. Ради какого удобства она туда попала ?


P.S. Это не придирки к статье, а просто на подумать тем кто хапает азы.

1,2) Некоторые математические выкладки, поясняющие использования именно среднеарифметического и среднеквадратичного отклонения  -  http://teorver-online.narod.ru/teorver49.html 

3) Все оценки параметров, приведенные в данной статье, несмещенные. Поэтому возникают всякие добавочные коэффициенты, на которые нужно умножать значения оценки (в частности тройка из формулы эксцесса).

ТеорВер-Онлайн: 6.4 Выборочное среднее и выборочная дисперсия
  • teorver-online.narod.ru
Иногда исследователь ставит перед собой более конкретную проблему: как, основываясь на выборке, оценить интересующие его числовые характеристики неизвестного распределения, не прибегая к приближению этого распределения как такового, то есть без построения выборочных функций распределения, гистограмм и т.п. В данном параграфе мы обсудим простые...
 
bas:

Это всё мы знаем, расскажите наконец, как из этого грааль построить )))

К сожалению, очередной рерайт элементарных банальностей из справочника по математике. Из авторского только некоторые неточности. Поэтому лучше пользоваться справочником, чем подобными статьями.

 

Обычно используемые квадратичные нормы ошибок следуют из их успешного применения в физике, т.к. практически все суммы распределений в пределе больших чисел стремятся к гауссовскому распределению случайных величин, у которого в экспоненте стоит именно квадрат ошибки. При этом вероятность совместного распределения независимых гауссово распределенных величин содержит сумму квадратов ошибок в экспоненте.

Другие нормы ошибок вполне допускаются.

 
hrenfx:

Другие нормы ошибок вполне допускаются.

О, вот это интересно. Жаль, в моем учебнике по статистике об этом не было ни слова.

Может, вы еще и полимодальное распределение знаете как распознать? 

 
bas:

Может, вы еще и полимодальное распределение знаете как распознать? 

Исходная задача?
Причина обращения: