Будет ли хорошая стратегия работать на случайно сгенерированных данных? - страница 10

 

Прикладываю новую версию - добавил иной способ рандомизации, теперь формируется равномерное распределение и по нему сортируются бары за каждый час. Ускорен предпоследний алгоритм, значительно.

Файлы:
 
Maxim Kuznetsov #:

всё-ж просто проверяется, 

считай что у тебя "змейка" или складной метр. Вот он ЖЁЛТЫМ

а на вершинах и впадинах у него переворотные шарниры. Кружочками нарисовано

в 80-90% случаев котир выглядит ровно так + немного шума из-за которого вершины визуально смещаются

У меня вообще получаются очень похожие дни, рандомизация равномерно всё размазывает.

 

Тут я подумал, а похожи ли котировки MQ на котировки реального ДЦ? Под рукой оказался ДЦ RF (это не реклама), и сделал я выборку по часам на EURUSD так, же как описывал раньше, а заодно конвертировал чарт кастомный, что бы был под рукой. Обучил модели - по 10 штук на каждую настройку.

Вот такой разброс по Accuracy получился

А вот метрика Precision - показывает точность определения класса "1" - иными словами процент правильно классифицированных примеров, т.е. для нас это процент часов EURUSD от MQ, которые удалось точно определить, как принадлежащих MQ.

В теории, если выборки одинаковы, то обучение будет в районе 0,5 по этим показателям, т.е. модель будет классифицировать все примеры как "1" или "0", а показатели будут в районе 0,5.

Однако, и обучение по идеи не должно происходить, а у нас оно идёт бодренько - странное дело!


Заинтересовали выбросы на выборке exam, небольшие, но обращающие на себя внимание, посмотрим на положительное отклонение, это настройки Test_CB_Setup_48_000000005 - Исключили ATR, iDelta, Volume и OHLC типа + iVIDyA, iBWMFI, iChaikin.

Интересно, но не понятно - на чём же идёт обучение - логически затрудняюсь обосновать :)

Но, ясно одно, что-то тут не так - видать есть отличия в чартах, решил запилить скрипт, который:

  1. Посчитает число пропущенных баров (число синхронизаций) указанного TF с разбивкой по годам;
  2. Посчитает дельты OHLCV между найденными барами по времени для указанного TF  с разбивкой по годам;
  3. Посчитает дельту между High и Low бара двух символов для указанного TF  с разбивкой по годам.

Ниже результаты этих вычислений в виде графиков, для примера представлены последовательно расчеты для M1, H1 и D1.



Ну что, где наверное теперь остаётся понять, а где же рандомные котировки, а где реальные?

Если есть закономерности, то где же они быть должны? Неужели в разных ДЦ разные закономерности?

Хммм.... что думаете?

P.S. Может я ошибся в коде - приложил для аудита и частного использования.
Файлы:
 

Добавлю графиков, думаю для оценки ситуации достаточно минутных графиков, так как на них строится всё остальное, и из OHLC только цены закрытия - как часто используемые. Возьмём ещё два ДЦ из РФ для анализа.

MQ_vs_AF

MQ_vs_BF

BF похоже вообще не стал заморачиваться с покупкой истории, а просто взял её у MQ до 2020 года включительно.

Ну хорошо, а может котировки похожи с ДЦ RF? Давайте посмотрим!

RF_vs_AF



RF_vs_BF

А давайте сравним AF и BF - может в РФ есть регулятор, гарантирующий одинаковые котировки?

AF_vs_BF

Ну что тут сказать, каждый готовит на своей кухне как хочет. Однако, стоит всё же отметить, что за последние 2-3 года у двух ДЦ в РФ ситуация улучшилась по похожести котировок. Так же можно говорить и в сравнении с RF и даже MQ, но 3 года - очень мало для машинного обучения и для поиска закономерности - статистически мало.

По поводу тикового объёма - это что-то не сопоставимое - лучше воздержаться от использования в натуральных показателях.

А какие делаете выводы Вы, смотря на графики?

Пишу в ветку без обратной связи - не пониманию, интересно это кому или нет...

 
Aleksey Vyazmikin #:


По поводу тикового объёма - это что-то не сопоставимое - лучше воздержаться от использования в натуральных показателях.

А какие делаете выводы Вы, смотря на графики?

Пишу в ветку без обратной связи - не пониманию, интересно это кому или нет...

по поводу тикового объёма всё ровно наоборот :-)

на откровенных кухнях он кривой и не бьется со всем остальным. В прочих это один из главных показателей V, наряду с OHLC

--

по поводу обратной связи - возможно люди немного потеряли нить, что и зачем ты делаешь ;-) Завалил безумными графиками, народ в шоке

 
Aleksey Vyazmikin #:
...

Пишу в ветку без обратной связи - не пониманию, интересно это кому или нет...

Я читаю. И десятки тысяч других пользователей mql5.com читают. Не ждите быстрой реакции, пишущих на форуме менее 0.01%, и 50% из них конченные троли.

Maxim Kuznetsov #:
...

по поводу обратной связи - возможно люди немного потеряли нить, что и зачем ты делаешь ;-) Завалил безумными графиками, народ в шоке

есть такое.))

т.е., тех, кто хотел хетел бы что-то написать надо поделить минимум на 2.)

 

есть ещё технические нюансы покрытые мраком, "как работают сервера MQ"

на уровне "а-ля микрокод, элементарные операции" какие и откуда поступают данные, как принимаются решение "сработала лимитка" и куда улетает рыночный ордер.

потому что пока-что, есть нехорошее ощущение что внутри стоп-левелов рыночный улетает к прайм-брокеру, а лимитки схлопывают друг об друга при изменении спреда отданного сверху.

 
Maxim Kuznetsov #:
на откровенных кухнях

А кто из них откровенные кухни? Две дочки банка из РФ, и одна очень крупная контора, с большим рекламным бюджетом.

 
Andrey Dik #:
Я читаю.

Спасибо за обратную связь. Значит буду дальше делится мыслями...

 
Maxim Kuznetsov #:
он кривой и не бьется со всем остальным

Я думаю, можно использовать, но через призму относительности, а не как абсолютное значение, особенно на большой истории.