Обсуждение статьи "Статистические оценки"

 

Опубликована статья Статистические оценки:

Оценка статистических параметров последовательности очень важна, так как большинство математических моделей и методов строятся исходя из различного рода предположений, например, о нормальности закона распределения, или требуют знания значения дисперсии или других параметров. В статье кратко рассматриваются простейшие статистические параметры случайной последовательности и некоторые методы ее визуального анализа. Предлагается реализация этих методов на MQL5 и способ визуализации результатов расчета при помощи программы Gnuplot.

Автор: Victor

 
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
  • www.mql5.com
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
 

 

"Исключение промахов


Прежде чем перейти к оценке статистических параметров, необходимо отметить, что точность оценки может оказаться недостаточной, если выборка содержит грубые ошибки (промахи). Влияние промахов на точность оценок особенно сильно проявляется, когда выборка имеет небольшой объем. Промахами будем считать значения, аномально отклоняющиеся от центра распределения. Такие отклонения могут быть вызваны различного рода маловероятными событиями и ошибками, возникшими при сборе статистики и формировании последовательности.

Принять решение о том, фильтровать промахи или нет, достаточно сложно, так как в большинстве случаев невозможно однозначно определить является ли данное значение промахом или принадлежит рассматриваемому процессу. Если промахи обнаружены и принято решение об их фильтрации, то возникает вопрос, как поступить с этими ошибочными значениями? Логичнее всего просто исключить их из выборки, при этом точность оценки статистических характеристик генеральной совокупности при этом может увеличиться, но не следует забывать, что имея дело с временными последовательностями, следует с осторожностью относиться к исключению отсчетов из последовательности."

Лучше вообще этого не делать.

Да, все данные дожны пройти проверки, да, проверки должны быть автоматизированы.

Но лучше отказаться от источника данных, чем манипулировать исходными данными, вручную или автоматически. 

В реальной жизни принятие или исключение из учета больших по объему рисков на основании их "малой вероятности" является причиной многих трагедий и катастроф. 

 

 

Victor, вот такого рода вопрос.

Как вы полагаете, Kurtosis может быть меньше 1?

Если да, то

gs=(1.55+0.8*MathLog10((double)n/10.0)*MathSqrt(kurt-1))*MathSqrt(sum2/(n-1));

будет равно -1.#IND, не так ли? :-)

Отличная статья!


 
denkir:

Victor, вот такого рода вопрос.

Как вы полагаете, Kurtosis может быть меньше 1?

Если да, то

будет равно -1.#IND, не так ли? :-)

Отличная статья!


Скорее всего, теоретически kurtosis не может быть меньше единицы. Наверное, значение равное единице получится для последовательности, состоящей из отсчетов прямой линии. Например, 1,2,3,4,5.

Может ли за счет ошибок, используемый в статье алгоритм дать значение kurtosis меньшее единицы, я не знаю. В конце статьи упоминалось, что поведение алгоритма расчетов коэффициентов не исследовалось.


 

Действительно при вычислении несмещенных оценок kurtosis может принимать значение меньшее единицы. Например, для входной последовательности 4,7,13,16.

Спасибо за замечание. Внесу изменения.

 
Исправления внесены.