Обсуждение статьи "Основы статистики" - страница 2

 
Yurich: Среднеквадратичное отклонение дифференцируется в отличие от среднеабсолютного. Что в свою очередь дает возможность использования этой функции в дальнейших аналитических расчетах, например в методе наименьших квадратов. Есть и другие преимущества.

Слышал ещё о одном преимуществе - среднеквадратичное отклонение более чувствительнее к выбросам. Так давайте объединимся всем миром, и пойдем пропагандировать не квадрат разности, а например разность в четвертой степени. Такое средне"четвертичное"  отклонение наверняка тоже дифференцируется и ещё более чувствительнее к выбросам чем среднеквадратичное отклонение.

По-моему квадрат разности вытекает как уже сказал Rosh из "свойства алгебры нашего пространства " а именно из метрики линейного пространства (расстояние между векторами). Но кто сказал что все выборки принадлежат к линейному пространству.


hrenfx: Другие нормы ошибок вполне допускаются.

Конечно допустимы. Вопрос в том когда и почему использовать именно такие оценки. В обсуждениях как-то больше встречаются утвердительные фразы типа "но он же вышел за боллинджер с одним ско ". Почему именно ско? Почему именно один? Наверно цифра в 68% нравиться )

 
QSer29: ... 1,2) Некоторые математические выкладки, поясняющие использования именно среднеарифметического и среднеквадратичного отклонения  -  http://teorver-online.narod.ru/teorver49.html 

А вот вам пример на пальцах из указанного вами ресурса. Математическое ожидание числа, выпавшего на верхней грани обычного игрального кубика. Если посчитать как среднеарифметическое то это 3.5.

Что для вас означает это число?

Каким будет это число и какой в нем будет смысл если:

  • нанести на грань с 6 точками ещё 100 точек
  • нанести на одну из граней вместо точек букву

Имхо все эти оценки матожидания и отклонения через среднеарифметическое и ско немного за уши притянуты к равномерному и следовательно к нормальному распределениям.

ТеорВер-Онлайн: 2.3 Математическое ожидание
  • teorver-online.narod.ru
Так как случайная величина может принимать различные значения  , в зависимости от того, какой исход  ``виртуального'' эксперимента (  1.3) будет разыгран, то с разных точек зрения удобно иметь числовую характеристику, имеющую смысл ``среднего значения'' случайной величины. Определение 2.3   Математическим ожиданием случайной величины...
 
GaryKa:

Слышал ещё о одном преимуществе - среднеквадратичное отклонение более чувствительнее к выбросам.

Совершенно верно, поэтому выбор нормы ошибки желательно хоть как-то обосновывать. Например:

Использование СКО (среднеквадратичное отклонение) вместо СМО (среднемодульное отклонение) вызвано необходимостью уделять бОльшую значимость дальним выбросам значений КК от его МО (мат. ожидание).

Можно и биквадратную норму ошибки использовать. В общем виде Abs(Func(Error)). Однако огромное множество аналитических решений и отличных по эффективности алгоритмов разработано именно для замечательной по свойствам (с мат. точки зрения) квадратичной нормы.

Correlations2 - MQL4 Code Base
  • www.mql5.com
Correlations2 - MQL4 Code Base: скрипты для MetaTrader 4
 
GaryKa:

А вот вам пример на пальцах из указанного вами ресурса. Математическое ожидание числа, выпавшего на верхней грани обычного игрального кубика. Если посчитать как среднеарифметическое то это 3.5.

Что для вас означает это число?

Каким будет это число и какой в нем будет смысл если:

  • нанести на грань с 6 точками ещё 100 точек
  • нанести на одну из граней вместо точек букву

Имхо все эти оценки матожидания и отклонения через среднеарифметическое и ско немного за уши притянуты к равномерному и следовательно к нормальному распределениям.

Я давал ссылку на другую страницу из этого ресурса, для ответа на конкретные вопросы.

Когда мы имеем дело с игральным кубиком, то мы имеем дело со случайной величиной, и оценивать ее параметры уже нужно не как выборочные. В данном случае мат. ожидание случайной величины (кубика), равняется 3.5. Мат. ожидание дискретной случайной величины считается по другой формуле в отличии от среднеарифметического. В данном случае, эти значения просто совпали, так как вероятность выпадения каждой из сторон кубика одинаковая.

  • считаете по формуле мат. ожидания для дискретной случайной величины с той же вероятностью выпадения сторон для кубика с новой гранью
  •  здесь уже нельзя говорить о мат.ожидании случайной величины

ТеорВер-Онлайн: 6.4 Выборочное среднее и выборочная дисперсия
  • teorver-online.narod.ru
Иногда исследователь ставит перед собой более конкретную проблему: как, основываясь на выборке, оценить интересующие его числовые характеристики неизвестного распределения, не прибегая к приближению этого распределения как такового, то есть без построения выборочных функций распределения, гистограмм и т.п. В данном параграфе мы обсудим простые...
 
hrenfx:
Исходная задача?
Проста как грабли - моды показывают уровни "концентрации цен" относительно линии аппроксимации. Но чтобы ими пользоваться, надо сначала знать, что они вообще есть.
 
Слышал ещё о одном преимуществе - среднеквадратичное отклонение более чувствительнее к выбросам.
А разве это преимущество?
 

Алгоритмов определения мод должно быть полно, поэтому универсальный свой велосипед здесь ни к месту.

Тут скорее надо смотреть на примерах, что хочется получить и что не хотелось бы получать. 

 

А мне статья понравилась.

Очень легко воспринимается и содержит достаточно информации.

А на большее, судя по названию, и не претендует. 

 

Не вижу какой-либо пользы от этой статьи. Ряд банальностей из ТВ. И если бы эта статья не была напечатана на специализированном, наполовину трейдерском сайте, то можно было и промолчать. Но учитывая сайт, хочу заметить следующее.

Существует наука по измерению, анализу и прогнозу экономических данных. Называется эконометрика. Она близкая, кровная родственница статистики, но  имеются существенные различия.

 1. Для трейдеров анализ сам по себе не имеет ценности, если из анализа не вытекает прогноз. В статье прогноз вообще не упомянут.

2. Эконометрика изначально исходит из нестационарности экономических рядов. И если бы хотя бы помнить об этом, так сказать держать в уме, то рассказ об основных статистиках был бы не таким радужным: для нестационарных рядов основные понятия мо, дисперсия  и др. можно применять с кучей оговорок. Во всяком случае следует всегда сомневаться. К примеру, для нестационарных рядов среднее не обязательно будет сходиться к мо. О корреляции вообще молчу.

3. Эконометрика исходит из очень коротких выборок - нескольких десятков наблюдений. Не интересна средняя за много лет, так как такая средняя предполагает и нахождение в позе несколько лет.  В условиях кризисов становятся  важными оценки результатов расчета. Именно оценки радикально отличают ТВ от статистики и особенно от эконометрики.

Школярская статья. Уровень спец школы, даже не младших курсов института. 

Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.
 
Спасибо за статью. Небольшая поправка - главе "Выборочная Асимметрия" в формуле степень дисперсии 3/2, не 2/3. :)