Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 30

 
faa1947:

анализ остатков на автокорреляцию и вид функции плотности вероятности. Также, конечно, R^2. Это, в принципе, общепринятые методики прогнозирования временных рядов.

Это только начало, и в смысле общепринятости, не полно. Полно показано здесь, хотя это только пример использования. Три группы анализов: коэффициентов, остатков и на стабильность. Если получится согласовать противоречия, то, возможно, получите оценку, которая всегда есть ошибка прогноза, так как цель - это прогноз, а все остальное - это промежуточные результаты.

Да, думаю, я никогда не делал ПОЛНОГО академического исследования. Обычно в работе есть дефицит времени и сил, поэтому иду путем покороче: строю несколько (2 и более) предсказательных моделей и делаю анализ остатков, затем выбираю одну модель на основе сбалансированной оценки точности и качества ряда остатков. Соглашусь, что при наличиии времени можно досконально углубиться в оценки надежности предсказателя.

Кстати, хороший и относительно малотрудозатратный тест на точность предсказателя и его стабильность - это кросс-валидация, когда периоды обучения и валидации выбирают множество раз, чтобы в конечном итоге весь исходный ряд разбился на небольшие отрезки и каждый отрезок вошел в валидационную выборку.

 
alexeymosc:

Да, думаю, я никогда не делал ПОЛНОГО академического исследования. Обычно в работе есть дефицит времени и сил, поэтому иду путем покороче: строю несколько (2 и более) предсказательных моделей и делаю анализ остатков, затем выбираю одну модель на основе сбалансированной оценки точности и качества ряда остатков. Соглашусь, что при наличиии времени можно досконально углубиться в оценки надежности предсказателя.

Кстати, хороший и относительно малотрудозатратный тест на точность предсказателя и его стабильность - это кросс-валидация, когда периоды обучения и валидации выбирают множество раз, чтобы в конечном итоге весь исходный ряд разбился на небольшие отрезки и каждый отрезок вошел в валидационную выборку.

Очень давно я даю следующий совет, выстраданный на собственном опыте. Уже лет тридцать и особенно в нынешнее время наиболее продуктивным способом освоения предметной области - это взять готовый пакет, ориентированный на эту предметную область. Я упоминал EViews, но это не единственный пакет. Просто этот пакет используется при обучении в наших вузах. Используя пакет вы получите:

огромное количество работоспособных и выверенных миллионами пользователей специализированных программ

схему анализа

полноту анализа

списки литературы, из которых брались используемые алгоритмы.

Получив опыт и кругозор можно затем перейти к каким-либо усовершенствованиям. Но эти усовершенствования будут основаны на систематических знаниях предметной области и Вам не придет в голову приплетать Петерса или еще кого-либо типа птоломея, как некоторым выше.

 
faa1947:

Очень давно я даю следующий совет, выстраданный на собственном опыте. Уже лет тридцать и особенно в нынешнее время наиболее продуктивным способом освоения предметной области - это взять готовый пакет, ориентированный на эту предметную область. Я упоминал EViews, но это не единственный пакет. Просто этот пакет используется при обучении в наших вузах. Используя пакет вы получите:

огромное количество работоспособных и выверенных миллионами пользователей специализированных программ

схему анализа

полноту анализа

списки литературы, из которых брались используемые алгоритмы.

Получив опыт и кругозор можно затем перейти к каким-либо усовершенствованиям. Но эти усовершенствования будут основаны на систематических знаниях предметной области и Вам не придет в голову приплетать Петерса или еще кого-либо типа птоломея, как некоторым выше.


сорри, но главное правильная постановка задачи и выводы. Вот к примеру, то что у вас написано в статье относительно к "Диагностика индикаторов" и выводы на основании остатков что индикатор полезен или нет и т.д. - не верно (имха). Как не верно то, что индикатор обязан прогнозировать или вообще быть полезным на всем ряде. Для получения прибыли нет надобности постоянно прогнозировать цены, лишь в относительно редкие моменты. Прогноз в определенном смысле т.к. прогнозируется не отдельное изменение цены, а робастность системы и повторение прошлой статистики. И прогнозируют не индикаторы, а только система в целом.

P.S. все равно статья полезная, спасибо :)

 
Avals:


Вот к примеру, то что у вас написано в статье относительно к "Диагностика индикаторов" и выводы на основании остатков что индикатор полезен или нет и т.д. - не верно (имха). Как не верно то, что индикатор обязан прогнозировать или вообще быть полезным на всем ряде

Согласен, статья написана с определенным пережимом, так как целью статьи была демонстрация подхода в целом, так сказать методика в функциональной полноте.

Для получения прибыли нет надобности постоянно прогнозировать цены, лишь в относительно редкие моменты

Совершенно не согласен. Любая ТС всегда прогнозирует, признается ли это или нет. С периодичностью работы ТС делается анализ для принятия решения на будущее: водить в позу, выходить, остаться вне рынка или в рынке. Эти решения на основе прогноза будущего поведения рынкета.

прогнозируется не отдельное изменение цены, а робастность системы

Робастность не прогнозируется, а конструируется, а результат конструирования оценивается ошибкой прогноза - если дисперсия ошибки близка к константе, то система будет устойчива.

И прогнозируют не индикаторы, а только система в целом.

Естественно. В статье предполагается, что система состоит из одного индикатора. Даже при таком упрощении статья получилась слишком сложной.

Если желание обсудить статью в деталях, то предлагаю перейти в соответствующий топик, быть может другие присоединятся. Этот топик все-таки имеет другую тему.

 
faa1947:

Для получения прибыли нет надобности постоянно прогнозировать цены, лишь в относительно редкие моменты

Совершенно не согласен. Любая ТС всегда прогнозирует, признается ли это или нет. С периодичностью работы ТС делается анализ для принятия решения на будущее: водить в позу, выходить, остаться вне рынка или в рынке. Эти решения на основе прогноза будущего поведения рынкета.


не нет надобности прогнозировать, а нет надобности постоянно прогнозировать :) Только в отдельные дискретные моменты, а проверка остатков индикатора на всем ряде фактически проверяет его способность прогнозировать ряд непрерывно
faa1947:

прогнозируется не отдельное изменение цены, а робастность системы

Робастность не прогнозируется, а конструируется, а результат конструирования оценивается ошибкой прогноза - если дисперсия ошибки близка к константе, то система будет устойчива.

исход отдельной сделки не важен, важна статистика по многим сделкам. Она должна в реале хотя бы частично соответствовать благоприятной для нас статистики бэк-тестов. Поэтому когда отдаете деньги в управление системы, ставка именно на это - то что благоприятная для нас статистика сохранится (при системном подходе ). А это и есть робастность
 
alexeymosc:

Возможно, что так. Но когда мы строим ряд returns вида: X[t]-X[t-1], то на нем этого почти не видно. Я употребляю слова returns, приращения, возвраты, это все суть дифференцированный ряд цен.

Это легко проверяется, никакой нужды в филологических аргументах нет :). Кстати, можно попытаться найти про это на этом форуме.

Перекос вероятности в сторону изменения знака получается минимальный, не значимый. Но, если расчитывать условную энтропию между зависимой переменной и returns по двум и более лагам, то все неравномерности учитываются в результирующей цифре так, что энтропия уменьшается.

Ещё раз: сила эффекта зависит от ТФ, но будет ли Н1 сгенерированный на случайных тиках похож на Н1 сгенерированный на тиках с реальной возвратностью?

Я попробовал натренировать НС на часовых данных и брал только самые информативные лаги (42 переменные, на лагах 1, 2, 23, 23, 25,... 479, 480, 481). К сожалению, результат не очень получился. Точность предсказания номера квантиля - в районе 30-40%. Хотя, неравномерности нейронная сеть смогла транслировать на выход, но зависимостей недостаточно для предсказания. Вся проблема в том, что независимые перменные взаимноинформативны на лаге 1, 2, 24.... и общий объем информации о нулевом баре реально небольшой. Надо думать, как вариант брать дневные и более старшие таймфреймы.


Я с самого начала предполагал что методика чувствует любые зависимости, как пригодные для прогнозирования, так и бесполезные. В отношении волатильности определённые свидетельства в пользу такого предположения здесь получены. То есть эти ваши "информативные" лаги просто могут быть забиты такого рода бесполезной для прогноза информацией.

Вообще, судя по тому что посты раз за разом повисают в воздухе, моё время в этой теме или уже ушло или ещё не пришло :). Пора видимо фонтану отдохнуть :).

 
Candid:


Я с самого начала предполагал что методика чувствует любые зависимости, как пригодные для прогнозирования, так и бесполезные. В отношении волатильности определённые свидетельства в пользу такого предположения здесь получены. То есть эти ваши "информативные" лаги просто могут быть забиты такого рода бесполезной для прогноза информацией.

Это я тоже осознал вполне. Задача усложнилась до уровня нахождения информативных признаков знака изменения цены. А если окажется, что на внутридневных таймфреймах нужные информативные лаги цикличны (я подозреваю, что это так), то их суммарная информация о направлении движения цены на нулевом баре будем очень мала...

Это я проверю. Дальше останется: попровать исследовать дневные бары и, наверное, статистически достоверными еще могут оказаться недели. Но если и там информативные лаги цикличны, то, увы, я думаю идея с использованием только лагов не пойдет. Тогда можно попробовать индикаторы.

Я сразу все так и планировал, кстати. Но пока не проверю, фонтан не уймется.

"То есть эти ваши "информативные" лаги просто могут быть забиты такого рода бесполезной для прогноза информацией."

А что Вы вообще подразумеваете под "бесполезной информацией"? Ну хорошо, волатильность нам не друг. Есть также шумовые компоненты. Думаю, рано Вы решили списали методу на свалку. Всяким инструментом пользоваться нужно уметь, я пока учусь, поэтому воды здесь налито больше чем калорий.

Я уже предлагал: выложите любой индикатор и цель, которую он индицирует. Одно условие - чтобы это было по формулам в Эхеле и была возможность поиграть с его параметрами. Цель также должна быть конкретна, например, цена пойдет вниз максимум через 6 баров, или цена превысит текущую цену на 10 пунктов. Я погоняю данные и выдам Вам набор оптимальных с точки зрения информационной энтропии параметров индикатора.

 
Avals:
Она должна в реале хотя бы частично соответствовать благоприятной для нас статистики бэк-тестов.
Надеяться на "благоприятный" или иметь числовое выражение для этого "благоприятствования". Выше я назвал одну из расчетных величин - изменения дисперсии ошибки прогноза не должно превышать 5%. Но это не единственное требование к устойчивой системе. А бэк тест дает только надежду, что не изменится.
 
faa1947:
Надеяться на "благоприятный" или иметь числовое выражение для этого "благоприятствования". Выше я назвал одну из расчетных величин - изменения дисперсии ошибки прогноза не должно превышать 5%. Но это не единственное требование к устойчивой системе. А бэк тест дает только надежду, что не изменится.


да, есть методы оценки робастности.

Применительно к теме и к вашей статье: способ привести весь ценовой ряд к стационарному виду с положительным МО есть создание профитной и робастной переворотной системы, которая всегда в рынке. Это так же относится к способу отличить реальный ряд от случайного блуждания. Т.е. по сути, индикатор который пройдет ваши проверки и критерий который отличит реальный ряд от СБ и есть алгоритм этой системы. Поэтому наивно надеятся, что взятый наобум индикатор, или метод взаимной информации есть такой алгоритм для рыночных котировок. Такое может произойти только чисто случайно.

 
faa1947:

Теория эффективного рынка не рассматривается в эконометрике. Все ее предположения основаны на том, что рынок не эффективен. В эконометрику не входит Марковиц с апологетами и их эффективными портфелями. Эконометрика существует более 100 лет ее никогда не опровергал Петерс, Мандельброт и другие, так как она изначально основана на предположении о нестационарности рынка.

Именно эконометрика обосновывает прогноз на один шаг вперед и показывает причины фатального ухудшения прогноза на несколько шагов вперед.


проблема в том что маи(макро.эк.индикаторы) периодически могут мнять вес и т.д...+небольшой период оных, доступный для полноценного анализа...

ну а так соглашусь конечно - фа должен присутствовать в анализе...