Коэффициенты корреляции

 

Построим для рядов Open, High, Low и Сlose соответствующие ряды первой разности по схеме: dO[i]=Open[i]-Open[i-1] и т.д. Затем найдём для этих рядов коэффициенты парной корреляции по схеме: корреляция между приращениями ряда Open и Сlose обозначим как FAK(dO,dC), а коэффициент автокорреляции между соседними отсчётами ряда первой разности dO обозначим как FAKа(dO). Тогда, резудьтат можно представить в виде квадратной матрицы 4х4:

Построение её понятно из рис., все коэффициенты домножены на 100% (для удобства восприятия). Верхний ряд это искуственны ВР со случайными приращениями, ниже приведены данные по реальным ценовым рядам.

Не могу понять, чем обусловлена сильная положительная автокорреляция между соседними отсчётами разностного ряда High или Low?

 

наверно тем, цена меняется в определенном диапазоне, который показывается High и Low, а Open и Close - случайные точки в этом диапазоне.

 
Integer:

наверно тем, цена меняется в определенном диапазоне, который показывается High и Low, а Open и Close - случайные точки в этом диапазоне.



Согласен полностью, O и C – самые случайные ряды из ценовых, их непосредственное применение в достаточной степени вредно, если конечно, стратегия основывается не на использовании экстрасенсорных способностей процессора.


PS: Серега, а случайный ряд у тебя случайно геретиться так же, как предоставленный ранее?

 
grasn:
Integer:

наверно тем, цена меняется в определенном диапазоне, который показывается High и Low, а Open и Close - случайные точки в этом диапазоне.



Согласен полностью, O и C – самые случайные ряды из ценовых, их непосредственное применение в достаточной степени вредно, если конечно, стратегия основывается не на использовании экстрасенсорных способностей процессора.


PS: Серега, а случайный ряд у тебя случайно геретиться так же, как предоставленный ранее?

Нет, это другой ряд. Он генерился по изменённому алгоритму, согласно твоим рекомендациям (см. ниже).


Серёга, ты пойми одну нетривиальную вещь, связанную с тем, что далеко не всё то, что хорошо прогнозируется, имеет ценность в прогнозтических целях. Например, я могу на каждом сформированном баре искать его среднее по схеме (O+H+L+C)/4, понятно, что этот ряд ВЕЛИКОЛЕПНО прогнозируется, т.к. представляет собой сглаженный ВР. У него и коэффициент автокорреляции между соседними отсчётами в ряде первой разности положителен и к тому же очень велик. Да толку от этого нет, потому как существует такая вещь, как групповая задержка свойственная всем казуальным (не заглядывающим в будущее) схемам сглаживания. Так вот, "облегчение" прогнозирования этого ряда, с лихвой кампенсируется его "запаздыванием", что в итоге не даст тебе ни пункта форы. То же касается применения "лёгкого для прогнозирования" ряда типа (Н+L)/2, обычных МАшек и т.д. и т.п. Вобще, гладкость синтетического ряда и как следствие его неприменное запаздывание представляет некий универсальный инвариант, не позволяющий нам так просто заглядывать в Будущее.

Поэтому твоё "O и C – самые случайные ряды из ценовых, их непосредственное применение в достаточной степени вредно" есть тривиальное утверждение не содержащие ничего, поскольку ценность ряда (Н+L)/2 или (O+H+L+C)/4 не больше, но и не меньше чем ряда Open или Close! Надеюсь ты найдёшь в себе силы понять о чём я тебе говорю.

Файлы:
rndohlc_1.zip  2780 kb
 
Neutron:

Построим для рядов Open, High, Low и Сlose соответствующие ряды первой разности по схеме: dO[i]=Open[i]-Open[i-1] и т.д. Затем найдём для этих рядов коэффициенты парной корреляции по схеме: корреляция между приращениями ряда Open и Сlose обозначим как FAK(dO,dC), а коэффициент автокорреляции между соседними отсчётами ряда первой разности dO обозначим как FAKа(dO). Тогда, резудьтат можно представить в виде квадратной матрицы 4х4:

...

Не могу понять, чем обусловлена сильная положительная автокорреляция между соседними отсчётами разностного ряда High или Low?

Мне кажется, логичней включить в Вашу матрицу FAK(dH,dL) вместо FAKа(dHL) - трудновато воспринимать термин "автокорреляция" для разных рядов. Ну а то, что сравнительно большое значение имеют FAKа(dHL) и FAKа(dLH) так это означает, наверное, что есть некоторое достаточно узкое распределение "размаха" свечей около среднего размера.

 
rsi:

Мне кажется, логичней включить в Вашу матрицу FAK(dH,dL) вместо FAKа(dHL) - трудновато воспринимать термин "автокорреляция" для разных рядов. Ну а то, что сравнительно большое значение имеют FAKа(dHL) и FAKа(dLH) так это означает, наверное, что есть некоторое достаточно узкое распределение "размаха" свечей около среднего размера.

Ты прав, так будет лучше. Это я экспериментировал, да так и бросил с коэффициентом FAKа(dHL) - это корреляция для соседних отсчётов ряда первой разности (H+L)/2. А вот подправленный вариант для EURUSD 1h:

 
Neutron:
grasn:
Integer:

наверно тем, цена меняется в определенном диапазоне, который показывается High и Low, а Open и Close - случайные точки в этом диапазоне.



Согласен полностью, O и C – самые случайные ряды из ценовых, их непосредственное применение в достаточной степени вредно, если конечно, стратегия основывается не на использовании экстрасенсорных способностей процессора.


PS: Серега, а случайный ряд у тебя случайно геретиться так же, как предоставленный ранее?

Нет, это другой ряд. Он генерился по изменённому алгоритму, согласно твоим рекомендациям (см. ниже).


Серёга, ты пойми одну нетривиальную вещь, связанную с тем, что далеко не всё то, что хорошо прогнозируется, имеет ценность в прогнозтических целях. Например, я могу на каждом сформированном баре искать его среднее по схеме (O+H+L+C)/4, понятно, что этот ряд ВЕЛИКОЛЕПНО прогнозируется, т.к. представляет собой сглаженный ВР. У него и коэффициент автокорреляции между соседними отсчётами в ряде первой разности положителен и к тому же очень велик. Да толку от этого нет, потому как существует такая вещь, как групповая задержка свойственная всем казуальным (не заглядывающим в будущее) схемам сглаживания. Так вот, "облегчение" прогнозирования этого ряда, с лихвой кампенсируется его "запаздыванием", что в итоге не даст тебе ни пункта форы. То же касается применения "лёгкого для прогнозирования" ряда типа (Н+L)/2, обычных МАшек и т.д. и т.п. Вобще, гладкость синтетического ряда и как следствие его неприменное запаздывание представляет некий универсальный инвариант, не позволяющий нам так просто заглядывать в Будущее.

Поэтому твоё "O и C – самые случайные ряды из ценовых, их непосредственное применение в достаточной степени вредно" есть тривиальное утверждение не содержащие ничего, поскольку ценность ряда (Н+L)/2 или (O+H+L+C)/4 не больше, но и не меньше чем ряда Open или Close! Надеюсь ты найдёшь в себе силы понять о чём я тебе говорю.

Серега, остается только привязать меня к вязанке дров и строго спросить – «это твой последний шанс, согласись, что земля квадратная!!!» :о))) Формально, мы оба не можем доказать свои позиции, а не формально, (H+L)/2 прогнозируется лучше, чем например Close

 
grasn:

...Серега, остается только привязать меня к вязанке дров и строго спросить – «это твой последний шанс, согласись, что земля квадратная!!!» ...

Извините, не совсем, если точнее: Земля имеет форму чемодана. Это я для поддержания разговора. "Серёга, ты пойми одну нетривиальную вещь, связанную с тем, что далеко не всё то, что хорошо прогнозируется, имеет ценность в прогнозтических целях", "Да толку от этого нет, потому как существует такая вещь, как групповая задержка свойственная всем казуальным (не заглядывающим в будущее) схемам сглаживания". Я полохо знаю арифметику, но прогноз с задержкой по житейской логике - это прогноз прошлого и действительно "нетривиально". Тогда зачем все, что выше. Не могли бы пояснить на русском языке. Еще раз извините.

 
Bookkeeper:
grasn:

...Серега, остается только привязать меня к вязанке дров и строго спросить – «это твой последний шанс, согласись, что земля квадратная!!!» ...

Извините, не совсем, если точнее: Земля имеет форму чемодана. Это я для поддержания разговора. "Серёга, ты пойми одну нетривиальную вещь, связанную с тем, что далеко не всё то, что хорошо прогнозируется, имеет ценность в прогнозтических целях", "Да толку от этого нет, потому как существует такая вещь, как групповая задержка свойственная всем казуальным (не заглядывающим в будущее) схемам сглаживания". Я полохо знаю арифметику, но прогноз с задержкой по житейской логике - это прогноз прошлого и действительно "нетривиально". Тогда зачем все, что выше. Не могли бы пояснить на русском языке. Еще раз извините.

Лучше спросить у автора. Мне, так же многое не понятно, например вот это:

Серёга, ты пойми одну нетривиальную вещь, связанную с тем, что далеко не всё то, что хорошо прогнозируется, имеет ценность в прогнозтических целях

Я несколько раз перечитывал, но ничего не понял, а переспросить уже стесняюсь, поскольку боюсь в очередной раз расстроить Серегу своей « … безграмотностью…». Стараюсь беречь своих коллег :о)

 
, а не формально, (H+L)/2 прогнозируется лучше, чем например Close

И формально тоже H и L прогнозируются лучше, чем Close. H и L выбираются по совершенно иному принципу - экстремальные значения за период, нежели Close - значение в определенный момент времени.

 

Я несколько раз перечитывал, но ничего не понял,


"... Летят два напильника - один Зелёный, а другой Дальше Полетел..."

Так вот, тот который зелёный - хорошо прогнозируем, а тот что далеко впереди - представляет определённый интерес, но его манёвры нетривиальны. Вопрос, какой напильник представляет больший интерес: тот что безнадёжно отстал, зато с ним всё понятно, или тот, что впереди, но то, что он вытворяет одному богу известно?

Ответ: Пофиг. Не в напильниках дело!