На кой меня в википедию тыкать?! Сами-то читали, что там написано?
То, что Булашев называет "выборочная дисперсия", в вики называется "Несмещённая (исправленная) дисперсия" и не совпадает с определение вики "выборочной дисперсии".
Но дело не в терминах. Какой смысл вкладывается в "несмещенную дисперсию"? Почему ее мат. ожидание равно сигме в квадрате? И как тогда считалась эта сигма для выборки?
И что с ковариацией по-Булашеву?
Блин, взял Mathcad и посмотрел, как он считает матричные дисперсии и ковариации. Ну нет там никаких "несмещенных" понятий. Зачем они?!
P.S. Дисперсия по-Булашеву вот такой выборки {1, 3} равна двум.
Используй как у Булашева, т.е. несмещённую оценку.
Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.
Сплошь и рядом попадаются примеры, где теорвер применяется ну совсем не по назначению. Например, народ оценивает среднеквадратичное отклонение и совсем не задумывается над его смыслом.
Знаете, почему говорят про среднеквадратичное отклонение, а не среднекубическое или среднелинейное? Да потому что расчеты со среднеквадратичным делать было проще и лаконичней, когда строили теорвер.
А народ, вместо того, чтобы нормально оценить разброс выборки через среднелинейное отклонение (не квадрат, а модуль (и корня никакого)), автоматом делает то, чему их научили в школе-универе: среднеквадратичное. Блин, топором гвозди забивать.
Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.
Если совсем по-простому, то обычные формулы тер.вер. расчитаны на то, что N стремится к бесконечности. Но на практике, выборочные значения, N гораздо меньше бесконечности. При небольших N возникает небольшая систематическая ошибка, она то и исправляется в несмещённой оценке. Считается, что при N>30 можно использовать обе величины, так как они становятся очень близки друг другу.
Все тот же пример: выборка {1, 3} N = 2. Несмещенная дисперсия равна двум. Выборочная (нормальная) равна единице. Где ошибка?
Ошибка в том, что нужно было изучать в своё время предмет мат.статистику.
Мое время - сейчас.
Без изучения мат. статистики вижу, что выборка {1, 3, 1, 3, 1, 3, 1, 3, .....} имеет нормальную дисперсию единица. А несмещенная дисперсия имеет отклонения, которые таят с ростом N.
По аналогии с несмещенной дисперсией считают и несмещенную ковариацию. В чем несмещенность - непонятно. Но при решении задач, оперируемых понятиями дисперсии и ковариации (например, выбор портфеля Марковица), подобные вольности с несмещенностью приводят к грубостям.
Понимаю, что для малых N никто аппарат не применяет, но раз на больших N ошибка не большая - это не значит, что надо это ошибку не признавать.
Прошу мне, необразованному, показать место, где описано обоснование применимости "несмещенных" оценок.
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Вы принимаете политику сайта и условия использования
Занимаясь вопросами мультивалютного анализа смотрел-читал кое-что... И, в частности, попалась в CodeBase Библиотека статистических функций. Глянул код, и сразу бросилось в глаза, что дисперсия и ковариация считаются неправильно. Автор библиотеки утверждает, что взял формулы из книги Булашева "Статистика для трейдеров" и приложил ее. Посмотрел книгу. И вот что там:
Красным подчеркнул то, что видится неправильным. И так по всей книге...
Посмотрев книгу дальше не понял, зачем Булашев в задаче по оптимизации портфеля вводит ограничения на веса активов в портфеле:
Видимо, автор вводит их, чтобы показать решение задачи численным методом Монте Карло. Потому что задача без подобных ограничений - портфель Марковица и имеет аналитическое простое решение.
Честно скажу, не знаю теории вероятностей, немного только ознакомился. А тут Булашев со своей книгой...