Почему нормальное распределение не нормально? - страница 15

 
TVA_11 >>:

Если верить вашему рисунку, то чем больше таймфрейм тем выше Корреляция.

Есть даже положительные корреляции на больших..?

Посмотрите ещё раз на рис. На нём красным цветом показаны коэффициенты корреляции (КК) между соседними отсчётами для ряда первой разности EURCHF как функция от выбранного Тайм Фрейма. Напомню, что КК считается большим, а связь между отсчётами "сильной", если КК близок к 1. Напротив, если КК стремится к нулю, то связи между отсчётами нет (или она слабая), либо она носит нелинейный характер (для ВР типа ценовых, про это можно забыть - если связи и есть, то они линейные и простые). Положительный КК означает наличие групповых эффектов в исходном ценовом ряде, т.е. "если тренд начался, то он скорее продолжится", "trend is frend" и т.д. Отрицательный КК характеризует рынок как "откатный", это когда тренд уже на следующем отсчёте (баре) скорее развернётся, чем продолжит своё движение в выбранном направлении.

Из рис. видно, что КК для РПР цены заметно отличен от нуля на всех ТФ и уменьшается (приближается к нулю по абсолютному значению) с ростом ТФ, что говорит об ослаблении связей и, как следствие, об уменьшении достоверности прогнозов для больших ТФ. Этот факт находится в противоречии с вашим "...Если верить вашему рисунку, то чем больше таймфрейм тем выше Корреляция." 

Для примера, я синим цветом привёл значения КК для белого шума созданного Генератором Случайных Чисел (ГСЧ). Как и следовало ожидать, КК его РПР болтаются около нуля, сигнализируя нам об отсутствии значимых связей между отсчётами. Тот факт, что КК ГСЧ не равен точно нулю, а принимает хоть и малые, но отличные от него значения, носит статистическую природу и связан  с конечной длиной исходного ВР и не имеет никакого отношения к "неидеальности" используемого ГСЧ. Хорошо видно, как с ростом ТФ, амплитуда шума "нуля" растёт из-за уменьшения числа отсчётов ВР получаемого из одного итого же исходного минутного ряда. Так длина ВР с ТФ500 m в 500 раз короче, чем длина ВР с ТФ1м.

Теперь о статзначимости полученного результата. Сравнивая коррелограммы реального ценового ряда и синтетики одинаковой длины, хорошо виден диапазон ошибок связанный с ограниченной длиной входных данных. Поскольку, других источников ошибок могущих повлиять на результат нет, можно достоверно утверждать, что  в пределах "шумового" коридора, хорошо видного на графике, значения КК являются статдостоверными.

grasn писал(а) >>Ну да, это несколько смелое утверждение Сергея о существенной статзначимости для приращений. Она там объективно говоря - ниже плинтуса.

Таким образом, Сергей, статдостоверность определяется вовсе не "близостью" или "дальностью" КК от нуля, а статистическим разбросом полученного результата.

Это я как художник художникам попытался объяснить что такое статдостоверность глядя на картинку. Если же быть точным, то для оценки достоверности нам не нужно сравнивать поведение двух КК(ТФ). Нужно нарезать исходный ВР на 100 одинаковых кусков и для каждого построить КК(ТФ). Мы получим для каждого ТФ 100 не совпадающих значений КК. Находим для каждого среднее значение и наносим эту точку на график. Затем, нам нужно нанести доверительный интервал  в котором находятся наши значения (для конкретнтго ТФ). Для этого, зная МО находим стандартное отклонение (СО) и наносим на графике вертикальные усы для каждой точки. Эти усы соответствуют доверительному интервалу по уровню 1/е, вероятность находится в котором для для СВ равна 68%. Всё. Если полученные значения КК не цепляют своими усами ноль, то можно говорить о статдостоверном наличии связей между соседними отсчётами в РПР ценового ряда. Смотрим рис. ниже:


КК(ТФ) для ГСЧ в пределах статошибок лежит  в "нуле", что и следовало ожидать. КК(ТФ) для ценового ряда статдостоверно отличен от нуля, что говорит о наличии явных зависимостей между барами для разных ТФ. Для больших ТФ длины используемого ряда явно недостаточно.

Приведённый материал является доказательством моего утверждения сделанного выше. Отдельный вопрос о значимости найденных зависимостей. К сожалению, практическая ценность для нас, как для трейдеров, данные зависимости представляют, только если произведение волатильности инструмента на КК для выбранного  ТФ превышает транзакционные издержки (спред ДЦ). Этого не наблюдается и для поиска алгоритма профитной торговли необходимо эксплуатировать дополнительные методы анализа ВР связанные в частности  с поиском временных "окон" с высоким значением произведения волатильности на КК и оценки их эргодичности (стабильности). 

 
getch >>:

Это как?

Уф.

"Долго думал, читал пэйджер." (ваши последние посты на mql-форуме).

Резюмировал примерно сделедуещее: Ваш вопрос слишком практичен для столь академической ветки... :)

// И вообще - мне кажется вступать в столь интимные отношения с рынком на глазах общественности как-то неприлично.

// Народ нас не поймёт и будет прав. А если народ поймёт.. - то всё равно мы будем неправы. ;)

Давайте уже какайте в приват. Вечером, по пришествии с работы, отпишусь.

 
Neutron писал(а) >>

Это я как художник художникам попытался объяснить что такое статдостоверность глядя на картинку. Если же быть точным, то для оценки достоверности нам не нужно сравнивать поведение двух КК(ТФ). Нужно нарезать исходный ВР на 100 одинаковых кусков и для каждого построить КК(ТФ). Мы получим для каждого ТФ 100 не совпадающих значений КК. Находим для каждого среднее значение и наносим эту точку на график. Затем, нам нужно нанести доверительный интервал в котором находятся наши значения (для конкретнтго ТФ). Для этого, зная МО находим стандартное отклонение (СО) и наносим на графике вертикальные усы для каждой точки. Эти усы соответствуют доверительному интервалу, вероятность находится в котором для для СВ равна 68%. Всё. Если полученные значения КК не цепляют своими усами ноль, то можно говорить о статдостоверном наличии связей между соседними отсчётами в РПР ценового ряда.

по минуткам EURCHF могут быть другого рода недостоверности. Инструмент низколиквидный, а в ночное время вообще рисуется ДЦ по собственной невсегда понятной логике. Явно отфильтровывая часть возможных комбинаций его мажоров EURUSD и USDCHF в течении этой минуты. Использовать это наверное можно (все теже ночные пипсовщики), но нормальных денег заработать и вынести на этом не дадут. Поднимут спред, изменят фильтры и т.д. Потому что это прямой убыток ДЦ и никакого перекрытия в такие моменты нет.

Поэтому больше доверия минуткам ликвидных мажоров в ликвидное время суток. Это отсеит зависимости котировочных фильтров, юзать которые все равно не дадут.

 

Многа букаф.

 
Neutron >>:

Приведённый материал является доказательством моего утверждения сделанного выше. Отдельный вопрос о значимости найденных зависимостей. К сожалению, практическая ценность для нас, как для трейдеров, данные зависимости представляют, только если произведение волатильности инструмента на КК для выбранного  ТФ превышает транзакционные издержки (спред ДЦ). Этого не наблюдается и для поиска алгоритма профитной торговли необходимо эксплуатировать дополнительные методы анализа ВР связанные в частности  с поиском временных "окон" с высоким значением произведения волатильности на КК и оценки их эргодичности (стабильности). 


Вы это все специально пишите, чтобы в конце сказать: к сожалению, все это хлам?:) Уже не первый ваш пост замечаю. Но с удовольствием читаю от начала. Сейчас, конечно, не каждое, но все равно интересно.

ИМХО, любая зависимость может использоваться в ТС, так как рынок описать одной формулой все равно невозможно.

 
Neutron >>:
Таким образом, Сергей, статдостоверность определяется вовсе не "близостью" или "дальностью" КК от нуля, а статистическим разбросом полученного результата.


А где я писал, что статзначисость определяется "дальностью"? Определяется оценкой ошибки (а не совсем разброса, если внимательно перечитаешь мой пост) А это означает, что 0.4 - это никакая не существенная величина просто по определению, а ошибка в ее вычислении сожрет еще процентов 20%-30% от ее "тела". Сергей, нет там никаких зависимостей, просто нет. Прими это как факт и спокойно к этому отнесись. Ровно по этим причинам (вернее, в том числе по этим) бесполезно прогнозировать на несколько отсчетов, бесполезно это делать любыми способом, в том числе и НС, прогнозировать нужно принципиально по другому.

Это я как художник художникам попытался объяснить что такое статдостоверность глядя на картинку.

Сергей, я не профессиональный математик, (сдается, что и ты таковым не являешься :о), но очевидно, что часть твоих научных выводов про корреляцию и особенно статзначимость, мягко говоря - сомнительна. Но это же ведь не помешает тому, что бы остаться при своих мнениях. :о)

 
Avals >>:

по минуткам EURCHF могут быть другого рода недостоверности. Инструмент низколиквидный, а в ночное время вообще рисуется ДЦ по собственной невсегда понятной логике. Явно отфильтровывая часть возможных комбинаций его мажоров EURUSD и USDCHF в течении этой минуты. Использовать это наверное можно (все теже ночные пипсовщики), но нормальных денег заработать и вынести на этом не дадут. Поднимут спред, изменят фильтры и т.д. Потому что это прямой убыток ДЦ и никакого перекрытия в такие моменты нет.

Поэтому больше доверия минуткам ликвидных мажоров в ликвидное время суток. Это отсеит зависимости котировочных фильтров, юзать которые все равно не дадут.

Торгуйте не в ДЦ и таких проблем не будет. Думаю, имеет смысл все же говорить о реальных ценах, а не ДЦ-ых.

 
grasn >>:

Сергей, нет там никаких зависимостей, просто нет. Прими это как факт и спокойно к этому отнесись.

Ну, это сродни религии... Нет, это не наш путь!

Но это же ведь не помешает тому, что бы остаться при своих мнениях. :о)

На этом все и держится. Если бы мы каждый раз меняли свои мнения без ВЕСКИХ причин, история Человечества была бы совсем другой:-)
 
getch писал(а) >>

Торгуйте не в ДЦ и таких проблем не будет. Думаю, имеет смысл все же говорить о реальных ценах, а не ДЦ-ых.

Речь об адекватности исследования. На данных не ДЦ картина может быть иной, да и проблемы иные. На "реальном" рынке (ECN например) вообще сделок в это время по этому инструменту может не быть, да и спред будет сумашедшим.

 
Neutron >>:

Ну, это сродни религии... Нет, это не наш путь!

На этом все и держится. Если бы мы каждый раз меняли свои мнения без ВЕСКИХ причин, история Человечества была бы совсем другой:-)

Ну как сказать, пока ты доказал (но сделал это блестяще :о), что корреляция первого лага приращений отлична от нуля. В данном случае (со стороны), религия - это святая вера в то, что 0.4, это где то - 0.6, а 0.6 - уже, знаете ли, это не больше 0.99, в том смысле, что около 0.97, но не меньше 0.9 уж точно :о) :о) Как то так пока получается :о)

Сергей, как художник - художнику, возьми два ряда с корреляцией 0.4 и посмотри на них, можно даже невооруженным взглядом.