Нулевая корреляция выборки вовсе не обозначает отсутствие линейной взаимосвязи - страница 51

 
GaryKa:
alsu, anonymous помогите разобраться. Это что ж такое получается. Получается что видимая положительная корреляция между Bid и Ask любого символа это фикция. И отрицательная корреляция между прямой и обратной ей котировкой то же нечто такое, что можно выкинуть, так как  ни стационарности, ни эргодичности?
Указанные Вами величины коллиниарны, т.е. связаны между собой арифметическим соотношением. Исследование на коллиниарность является обязательным при построении стат. моделей. Коллиниарные величины не могут участвовать в стат расчетах.
 

1. Если бы вы не знали как получены ряды из приведённых примеров, как бы вы распознали (лучше на примере), что это не 100% корелиррованные величины а коллинеарные величины? Распространяется  ли подобное ограничение (исследование на коллинеарность) на автокорреляцию?

2. Каким арифметическим соотношением связаны Bid и Ask?

P.S. "Чем дальше в лес тем толще партизаны".  Казалось бы ищем взаимосвязь, и вот, там где эта взаимосвязь наиболее остро проявляеться,  ...  засада. А ведь просто хотелось оценить взаимосвязь двух рядов на каком-то участке в прошлом.

 
GaryKa:
Получается что видимая положительная корреляция между Bid и Ask любого символа это фикция. И отрицательная корреляция между прямой и обратной ей котировкой то же нечто такое, что можно выкинуть, так как  ни стационарности

Можно выкинуть. Используйте стационарные ряды.

GaryKa:
(3) Как квантовать данные
Возьмите первую разницу между свечами, она не НР ВР. А чего она должна быть нормально распределена, если в одной свечке X сделок, а в другой 100X сделок и все с разными объемами. Копать тиковую историю, историю level II? Чем глубже, тем больше различий между брокерами. 

Можно квантовать по объемам, если у вас есть к ним доступ.

Можно вообще не квантовать. Тогда формула для корреляции будет другая.

В любом случае, одним лишь квантованием цен нормальности returns не добьетесь.

GaryKa:

bid и ask это просто лучшие предложения и, ... и что дальше. Могут ли они меняться при фактическом отсутствии торговли? Запросто. Могут ли они не меняться при наличие торговли? Запросто (частично исполнение). midprice! А как же моменты когда спред увеличивается в несколько раз, что взять midprice или бест банд?


Если делать расчеты по ценам сделок - результаты будут зашумлены из-за наличия bid/ask bounce.

По midprice считать можно, если инструмент достаточно ликвиден.

Лучше всего использовать арифметическое среднее между ожидаемыми ценами исполнения двух market ордеров (на покупку и на продажу) некоторого наперед заданного объема. Но для этого нужны Level2 данные.

EconModel:
Коллиниарные величины не могут участвовать в стат расчетах.

Неправда :P Просто методы используются другие. Например, вместо линейной регрессии можно использовать principal component regression.

EconModel:

Корреляция - константа. Если каждая выборка двух СВ, для которой вычисляется корреляция, статистически одинакова как и другие выборки из генеральной совокупности этих СВ, то можно говорить, что эти две СВ зависимы. Точнее, поведение их похоже. Это выполняется для нормально распределенных СВ.

 Если СВ не нормальные, то применяют коинтеграцию, когда характеристикой взаимной зависимости двух СВ является не число, а ряд с определенными свойствами. 

Условия применимости корреляции и коинтеграции написаны неверно. Корреляция (в частности, ранговые методы) применима независимо от формы распределения, достаточно стационарности и эргодичности случайных величин. Тесты на коинтеграцию также не зависят от формы распределения, требуется лишь одинаковый порядок интегрированности случайных процессов (порядок должен быть больше нуля).

 
Парни, примените в торговле хотя-бы что-то из здесь изложенного, а после оцените результат статистически:) 
 
anonymous:

Можно выкинуть. Используйте стационарные ряды.

Можно квантовать по объемам, если у вас есть к ним доступ.

Можно вообще не квантовать. Тогда формула для корреляции будет другая.

В любом случае, одним лишь квантованием цен нормальности returns не добьетесь.


Если делать расчеты по ценам сделок - результаты будут зашумлены из-за наличия bid/ask bounce.

По midprice считать можно, если инструмент достаточно ликвиден.

Лучше всего использовать арифметическое среднее между ожидаемыми ценами исполнения двух market ордеров (на покупку и на продажу) некоторого наперед заданного объема. Но для этого нужны Level2 данные.

Неправда :P Просто методы используются другие. Например, вместо линейной регрессии можно использовать principal component regression.

Условия применимости корреляции и коинтеграции написаны неверно. Корреляция (в частности, ранговые методы) применима независимо от формы распределения, достаточно стационарности и эргодичности случайных величин. Тесты на коинтеграцию также не зависят от формы распределения, требуется лишь одинаковый порядок интегрированности случайных процессов (порядок должен быть больше нуля).

Конечно, Ваши замечания более точны, чем мои.

Но. 

Я, думаю, что мое определение более верно, так как из него более ясно просматривается применение, а для меня это гораздо более важно, чем чистота определений. Я вообще пытаюсь забыть все те определения, которые меня напичкали в институте, а брать значение термина в виде программного кода. Берем конкретный код, например, R, и исполнение этого кода для вычисления коинтеграции и является определением этого слова. Это, по моим представления, единственный способ отмежеваться от процветающего псевдонаучного многообразия в российской науке. Это отражает мое стремление к получению прибыли, а не диссертации.

Поэтому, если бы Вы привели в подтверждение своих слов конкретику какого-либо пакета, для меня предпочтительно R, для меня это было бы сверх ценным. 

 
tara:
Парни, примените в торговле хотя-бы что-то из здесь изложенного, а после оцените результат статистически:) 
Не понимаю Ваш пост. Пока здесь не обсуждается автомобиль, а только болты и гайки из неизвестного авто. Что применить? Для чего статистика? 
 

Господа, а не подскажите ли, вот этот ряд данных является стационарным или нестационарным?

 

 
Integer:

Господа, а не подскажите ли, вот этот ряд данных является стационарным или нестационарным?


А сколько изображено наблюдений? Всего два или десяток есть? 

 
anonymous:


А сколько изображено наблюдений? Всего два или десяток есть? 

Много. Очень много.
 
Integer:
Много. Очень много.


Ну тогда I(1), нестационарный.