Странности в книге Булашева "Статистика для трейдеров"

 

Занимаясь вопросами мультивалютного анализа смотрел-читал кое-что... И, в частности, попалась в CodeBase Библиотека статистических функций. Глянул код, и сразу бросилось в глаза, что дисперсия и ковариация считаются неправильно. Автор библиотеки утверждает, что взял формулы из книги Булашева "Статистика для трейдеров" и приложил ее. Посмотрел книгу. И вот что там:

 

Красным подчеркнул то, что видится неправильным. И так по всей книге...

Посмотрев книгу дальше не понял, зачем Булашев в задаче по оптимизации портфеля вводит ограничения на веса активов в портфеле:

Видимо, автор вводит их, чтобы показать решение задачи численным методом Монте Карло. Потому что задача без подобных ограничений - портфель Марковица и имеет аналитическое простое решение.

Честно скажу, не знаю теории вероятностей, немного только ознакомился. А тут Булашев со своей книгой...

 

На кой меня в википедию тыкать?! Сами-то читали, что там написано?

То, что Булашев называет "выборочная дисперсия", в вики называется "Несмещённая (исправленная) дисперсия" и не совпадает с определение вики "выборочной дисперсии".

Но дело не в терминах. Какой смысл вкладывается в "несмещенную дисперсию"? Почему ее мат. ожидание равно сигме в квадрате? И как тогда считалась эта сигма для выборки?

И что с ковариацией по-Булашеву?

Блин, взял Mathcad и посмотрел, как он считает матричные дисперсии и ковариации. Ну нет там никаких "несмещенных" понятий. Зачем они?!

P.S. Дисперсия по-Булашеву вот такой выборки {1, 3} равна двум.

 
Используй как у Булашева, т.е. несмещённую оценку.
 
HideYourRichess:
Используй как у Булашева, т.е. несмещённую оценку.

Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.
 

Сплошь и рядом попадаются примеры, где теорвер применяется ну совсем не по назначению. Например, народ оценивает среднеквадратичное отклонение и совсем не задумывается над его смыслом.

Знаете, почему говорят про среднеквадратичное отклонение, а не среднекубическое или среднелинейное? Да потому что расчеты со среднеквадратичным делать было проще и лаконичней, когда строили теорвер.

А народ, вместо того, чтобы нормально оценить разброс выборки через среднелинейное отклонение (не квадрат, а модуль (и корня никакого)), автоматом делает то, чему их научили в школе-универе: среднеквадратичное. Блин, топором гвозди забивать.

 
Раз каснулся темы оптимизации(минимизации), то рекомендую ознакомиться с численными методами оптимизации и наглядными примерами безусловной минимизации методами Фибоначчи и градиента.
 
hrenfx:

Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.
Если совсем по-простому, то обычные формулы тер.вер. расчитаны на то, что N стремится к бесконечности. Но на практике, выборочные значения, N гораздо меньше бесконечности. При небольших N возникает небольшая систематическая ошибка, она то и исправляется в несмещённой оценке. Считается, что при N>30 можно использовать обе величины, так как они становятся очень близки друг другу. Примерно так. Подробности - в книжках.
 
HideYourRichess:
Если совсем по-простому, то обычные формулы тер.вер. расчитаны на то, что N стремится к бесконечности. Но на практике, выборочные значения, N гораздо меньше бесконечности. При небольших N возникает небольшая систематическая ошибка, она то и исправляется в несмещённой оценке. Считается, что при N>30 можно использовать обе величины, так как они становятся очень близки друг другу.
Все тот же пример: выборка {1, 3} N = 2. Несмещенная дисперсия равна двум. Выборочная (нормальная) равна единице. Где ошибка?
 
hrenfx:
Все тот же пример: выборка {1, 3} N = 2. Несмещенная дисперсия равна двум. Выборочная (нормальная) равна единице. Где ошибка?
Ошибка в том, что нужно было изучать в своё время предмет мат.статистику. Там не всё так просто, по этому, если нет желания грызть гранит науки - делайте как говорят. Или не делайте, как хотите. Кроме того, мат.статистика обычно не оперирует выборками в N=2.
 
HideYourRichess:
Ошибка в том, что нужно было изучать в своё время предмет мат.статистику.


Мое время - сейчас.

Без изучения мат. статистики вижу, что выборка {1, 3, 1, 3, 1, 3, 1, 3, .....} имеет нормальную дисперсию единица. А несмещенная дисперсия имеет отклонения, которые таят с ростом N.

По аналогии с несмещенной дисперсией считают и несмещенную ковариацию. В чем несмещенность - непонятно. Но при решении задач, оперируемых понятиями дисперсии и ковариации (например, выбор портфеля Марковица), подобные вольности с несмещенностью приводят к грубостям.

Понимаю, что для малых N никто аппарат не применяет, но раз на больших N ошибка не большая - это не значит, что надо это ошибку не признавать.

Прошу мне, необразованному, показать место, где описано обоснование применимости "несмещенных" оценок.