Обсуждение статьи "Эконометрический подход к анализу графиков" - страница 8

 

faa1947:

Как мне кажется, топикстартер, попытался решить вопрос лихим сабельным ударом - эконометрические пакеты предлагают гораздо больше моделей, чем GARCH. Выбор модели, а затем выбор параметров модели - это середина пути, а не ее начало...

Да, больше. Была взята GARCH в иллюстративных целях в качества примера. Она не оценивалась совсем. И тем более другие модели. Об этом говорил уже несколько раз.

В предыдущих постах высказывалась критика об анализе на основе разностей. Думается, эта критика возникла из-за того, что автор пропустил этап подготовки исходных данных.

По мнению автора статьи, нестационарность  - это единственное зло рынкета. Это не так.

Это не так. Другое зло: «толстые хвосты», кластеризация волатильности и эффекты рычага...

1. Надо определиться с количеством свечек в выборке. Зависит ли количество свечек в выборке от таймфрейма? Если судить по литературе, 50 свечек должно хватить.

А я встречал данные, что недостаток нелинейных моделей, это необходимость в значительной выборке... примерно 1000 шт.

2. Попытаемся подогнать распределение к нашей выборке. Желательно нормальное. Сразу станет вопрос количества стеллажей, по которым строится график. Откуда вы взяли то количество стеллажей, на которых построен график?

Нормальным оно не будет. Об этом напишу попозже в статье про распределения. Скоро выйдет.

Уточните значение термина "стеллаж" пож-ста.

 
faa1947:
наличие выбросов: следует заменить выбросы, т.е. котировки свыше некоторого порога (например, 3 сигма) на величину порога. У Булашова другое мнение о величине порога.

   - проверить по Фурье или АКФ наличие циклов, на всякий случай. Из-за ограниченности выборки и свойств самого рынкета циклов скорее всего нет.

  - решить проблему трендов. Не могу согласиться с автором - детрендировать путем вычитания МОЖ - это серьезное упрощение проблемы. Логарифм берется для экспоненциального тренда, а для аддитивного тренда достаточно первых разностей. Трендом придется заниматься отдельно и без регрессий не обойтись, причем все разнообразие регрессий. Вычитать надо регрессию, а не МОЖ. Это для детерминированных трендов, а бывают еще статистические тренды.

Без решения этих вопросов рассуждения о статистических характеристиках выборки не имеют основы...

Согласен, что нужно поработать с выборкой. Это уже дело мат. статистики...

Нет универсальных методов удаления выбросов...

Поэтому выборка и должна иметь большой размер.

Про тренды. Вопрос не исследовал. Учту.


 
-Alexey-:
Браво! Отличный пост, затрагивает многие вопросы. Но, некоторые пункты можно критиковать. Например, один из них - на основании чего вы решили, что нужно удалять выбросы? Их удалять нельзя.

Думаю можно. Они не должны никак затрагивать стат. параметры выборки (в частности, параметры распределения). На то они и выбросы.
 
-Alexey-:

Насколько мне известно, выбросы удаляются при проведении измерений, когда заранее известно, что результаты объединяет хоть какой-то закон, т.е. иными словами, когда процесс, генерирующий измеряемое значение - неслучайный, или случайный стационарный, и выброс может быть вызван случайностью(превышающей пределы неслучайности или стационарности), и такая случайность в этом случае - искажение. Если иметь дело с рядом цены, нестационарным, то случайность любого уровня - это часть статистики(помимо неслучайной части, но отделить их затруднительно), и удаление части статистики, соответственно - искажение статистики. Мне ближе мысль, что при работе со случайным нестационарным процессом мы не имеем права что-то удалять (обрезать).

Ну не знаю. Вы откуда взяли такое? Обычно выброс считается таковым, уходя за некоторое значение стат. критерия. Кстати, процедура описана у Булашева. Т.е. наличие не- или стационарности не есть критерий того, применять процедуру удаления выбросов или нет.
 
faa1947:
Выброс выбросу рознь. Приходится просматривать котировки. Если выброс - это относительно редкое явление, то следует обрезать до порога (не удалять). Если это не так, то не понятно что делать. В принципе, выбросы сильно искажают статистику. Любой пакет статистики предусматривает такую возможность и дает соответствующие рекомендации.
Скорее соглашусь. Но нужно чётко понимать, на каком основании мы удаляем какой-то выброс. Т.е.нужно строить систему правил... стат. обработки...
 
faa1947:

Более глубокая проблема  применении мат.статистики и эконометрики состоит в том, что как исходные данные, промежуточные результаты и выводы приходится проверять внематематическими - интуитивными методами. Выбор порога отсечения (2, 3 , 4 сигма или другого) возможен только после визуального просмотра графика и относится к проблеме выбора доверительных интервалов. Самой большой проблемой применения матстатистики - это то, что применение ее не мыслимо без искусства самого статистика. Никто не сформулирует правило "обрезать - не обрезать". Обрезал -  убрал характеристику нестационарности, не обрезал - исказил истинное распределение генеральной совокупности по неудачной выборке.

Серцевиной эконометрики является проверка гипотез, где можно допустить ошибки первого и второго рода: отвергнуть верную нулевую гипотезу в пользу неверной альтернативной, и отвергнуть верную альтернативную гипотезу в пользу неверной нулевой.

Учитывая изложенное, я могу согласиться с Вами и не согласиться одновременно. Заранее, без рассмотрения конкретной выборки, нельзя однозначно ответить на Ваш вопрос.

Согласен. Субъективизм есть. Но я придерживаюсь того, чтобы гипотеза оценивалась с помощью мат. статистики...
 
-Alexey-:

Какие разделы можете порекомендовать? К каждому своему высказыванию (в том числе и вопросительному) я могу предоставить ссылку на матчасть.

Да? А по-моему, Вы задавали faa1947 такие вопросы, что мне кажется, вы не в курсе проблематики.

Например, стат. распределение - это вариационная характеристика. Стационарность - временнáя...

вот ваш перл:

Истинное распределение характеризует свойства ряда, но нестационарный - по определеню такой, у которого они меняются.

Потом про параметры модели и подгонку... Когда параметры модели установлены, то ничего не подгоняется...

 

faa1947:

Даже топикстартер не участвует. Хотелось бы некоторую последовательность обсуждения и развития обсуждаемой статьи. Например, на первом этапе на конкретном примере рассмотреть в деталях предварительный анализ данных и подготовка их к моделированию. Например:

1. Обоснование объема выборки.

2. Обоснование необходимости трансформации данных.

3. Выбор способа трансформации данных:

- работа с выбросами и пропущенными данными.

-  трансформация данных - удаление трендов, цикличности

4. Определение типов тренда и их учет

5. Подгонка распределения к трансформированным данным.

6. Анализ на стационарность трансформированных данных.  

7. Учет гетероскедастичности

Топикстартер немного ошалел от проявленного интереса :-))

Вот это реальная конструктивная критика, имхо. Большое спасибо коллеге faa1947. Я возьму некоторый тайм-аут... попозже постараюсь изложить свои мысли... но в общем, согласен с предложенным процедурным списком...

 

denkir:

Я возьму некоторый тайм-аут...

спасибо
 
sergeev:
спасибо

В смысле? :-)

Лучше молчать, больше толку? Имели в виду что-то подобное из классики?

— Когда Вы говорите, Иван Васильевич, впечатление такое, что вы бредите.