От теории к практике - страница 406

 
Alexander_K2:

Спасибо за ссылку, Владимир. Весьма интересно.

Пока я еще на связи, позволю себе еще один пост.

Многие, читая эту ветку, задаются вопросом - зачем этому дяде все это? Зачем нужны экспоненциальные, логарифмические шкалы времени? Бери просто тики как есть и работай с ними как с ВР, где время между тиками - это т.н. "время Форекса".

Ребята! Вы совсем не шарите! Вот просто отчаянно дубеете и все тут.

Напоминаю, что мы рассматриваем движение цены как подобие винеровского процесса со сносом. Как подобие броуновского движения. На самом деле, это - lapace motion, но сути дела это не меняет и, в первом приближении, эта модель вполне подходит.

Так вот, для такой модели, астрономическое время - наиважнейший параметр. И закон "корня из Т" для дисперсии выведен Эйнштейном именно для этого времени, а не для какого-то там "времени Форекса".

Перрен в своих опытах использовал дискретность времени =30сек. для наблюдения за процессом.

В РХТУ им.Менделеева (бывший МХТИ), где учится моя дочь, опыты проводят при дискретности времени =10сек.

Короче - мы ОБЯЗАНЫ учитывать время в расчетах, иначе нам удачи не видать.

Если времени не существует не будет и изменения цены. Вопрос в правильном выборе времени для анализа задачи. С чем по моему мнению у многих полный вакуум.

 
Uladzimir Izerski:

Если времени не существует не будет и изменения цены. Вопрос в правильном выборе времени для анализа задачи. С чем по моему мнению у многих полный вакуум.

Именно так. И мы таки докопаемся до сути.

Завершил я обработку тиковых данных по паре AUDCHF за сутки.

ОЧЕНЬ ВАЖНО! Тиковые данные принимались по протоколу DDE из МТ4 в VisSim. Меткой времени является TimeSec, которая округляется до целочисленных значений. К сожалению, я не знаю - то ли это просто берется целая часть от десятичного значения, то ли производится округление до ближайшего целого. Если кто-либо знает как производится эта операция при передаче данных по DDE и подскажет - буду крайне признателен.

Распределение интервалов времени между тиками выглядит так:

Описательная статистика:


Всего, как видим, за сутки (86400 сек.) пришло 34978 тиков.

 
Alexander_K2:

Но, вот проблема - модель Винера хороша для описания хаотических столкновений частицы при Т между столкновениями -->0.

На Форексе такого нет и в помине. В ночное время суток, интервалы времени увеличиваются, в дневное - уменьшаются. Во временном окне = 4 часа, процесс прихода котировок не является пуассоновским.

И, наоборот - при рассмотрении тиков "как есть" возникает проблема соотношения объема рассматриваемой выборки к астрономическому времени. Т.е. 5000 тиков могут придти как за 4 часа, так и за 10 часов. И этот процесс также непуассоновский. При этом, напрочь теряет силу закон "корня из Т".

Вот это противоречие между моделью Винера и реальным движением цены, нам нужно максимально минимизировать.

Это как раз-таки делается введением различных шкал времени считывания котировок, среднее значение ГСЧ которых соотносится с некой дискретой астрономического времени.

Тиковый же объем выборки (волновой пакет) при этом заменяется неким усредненным модельным пакетом с максимально похожими статистиками.

Все, слова закончились. Нужны графики, цифры, а уже нет времени - надо праздник праздновать.

До встречи!

у вас система на тиках.
я бы еще так попробовал: использовать секундные котировки, и для каждого часа суток дисперсию отдельно рассчитывать (потому что интенсивность торгов в каждый час разная).
почему использование тиков - плохо? это нас ограничивает. какое максимальное отклонение может быть за 10 тиков, если тик - это, в основном, один пункт?
максимальное отклонение за 10 тиков может быть 10 пунктов. если все 10 тиков пройдут в одном направлении.
а если мы будем использовать секунды? да за 10 секунд цена может прыгнуть на "какое угодно" расстояние!
используя тики, мы еще пренебрегаем временем, то есть скоростью цены. а в таких системах замечено, что чем выше скорость цены, на которой пришел сигнал - тем выше вероятность его срабатывания.
 
Alexander_K2:

Именно так. И мы таки докопаемся до сути.

Завершил я обработку тиковых данных по паре AUDCHF за сутки.

ОЧЕНЬ ВАЖНО! Тиковые данные принимались по протоколу DDE из МТ4 в VisSim. Меткой времени является TimeSec, которая округляется до целочисленных значений. К сожалению, я не знаю - то ли это просто берется целая часть от десятичного значения, то ли производится округление до ближайшего целого. Если кто-либо знает как производится эта операция при передаче данных по DDE и подскажет - буду крайне признателен.

Распределение интервалов времени между тиками выглядит так:

Описательная статистика:


Всего, как видим, за сутки (86400 сек.) пришло 34978 тиков.

Анализ тиков на минимальных интервалах времени не дадут картины происходящих событий. Как это не понять?

 

За неделю распределение тиковых приращений Bid для AUDCHF выглядит так:


 

Так вот, задача, которую я хочу решить.

Необходимо работать в любое время суток в такой шкале времени (равномерная, экспоненциальная, либо логарифмическая), чтобы максимально сохранялись свойства вот этого распределения реальных приращений.

Еще раз говорю - работать просто с выборкой тиков (к примеру - 5000) нельзя! Теряется связь с астрономическим временем. Мы не знаем, за какой период времени соберется этот пакет из 5000 тиков! Мы не можем, в этом случае применять теорию винеровских процессов от слова "совсем"!

 

И второй важный вывод.

Если посмотрите - максимальный промежуток времени между тиками у меня составил 88 сек.

Вывод: построение и работа с секундными таймфреймами S1, о котором многие мечтают как о Граале, - полная ерунда.

 
Alexander_K2:

Мы не заем, за какой период времени соберется этот пакет из 5000 тиков!

разработайте функцию плотность тиков, я делал когда то, принцип:

анализируйте не время прихода тика, а разницу во времени между тиками (дельта)

имея среднее арифметическое этих приращений Вы можете получить плотность тиков за единицу времени, секунда маловато будет, а в минуту весьма конкретное значение

подобрав экспериментально устраивающую Вас плотность тиков, Вы можете оперировать сколько тиков Вам нужно для Вашей статистики, т.е. определите условия накопления тиков примерно так:

1. если плотность тиков < 20 в минуту, то нужно не менее х минут

2. если плотность тиков >40 в минуту, то нужно y минут

3. если плотность тиков >20 && < 40 в минуту, то z минут

как то так

ЗЫ: можно с этой плотностью тиков и рекуррентную формулу разработать, т.е. рассчитали на текущем тике текущую плотность тиков, и отняли/прибавили к предидущей плотности тиков - получите динамически изменяющееся значение

 

Так вот.

Почему я считаю исследование временных интервалов между тиками крайне важным.

Еще раз:


Мы видим, что это не поток Эрланга (я проводил сравнения с потоками различных порядков, это и близко не Эрланг).

Это простейший поток с каким-то искажением, не соответствующим классическим распределениям Эрланга или Паскаля.

Правомерно ли в этом случае применять считывание котировок через интервалы времени:

1. равномерные (через 2.5 сек)

2. экспоненциальные (mean=2.5 сек.)

3. логарифмические (mean=2.5 сек.)???

Ответом на этот вопрос будет являться статистическое соответствие получаемых распределений приращений для этих случаев, реальному распределению тиковых приращений Bid и Ask.

 
Alexander_K2:

Если посмотрите - максимальный промежуток времени между тиками у меня составил 88 сек.

Вывод: построение и работа с секундными таймфреймами S1, о котором многие мечтают как о Граале, - полная ерунда.

ну и чё ? будет у тебя несколько котировок подряд повторяться.