Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3225

 
fxsaber #:

На скринах TesterDashboard синие числа: прибыль в пипсах, количество сделок, ПФ, средняя прибыль на сделку.

Дело же не в ТС. Вот имеется в цВР закономерность. Начинаем генерировать, а там ее нет. Наверное, это не очень хорошо для МО.

Ваша ТС же ищет не все закономерности, которые могут быть. Поэтому надо под нее

Иначе через другой подход, но это будет долго на тиках и позднее )
 
Maxim Dmitrievsky #:

Теперь есть некая взаимосвязь внутри цепочек, длиной 100 тиков

могу сделать на другую глубину, если совпадет со средним сроком жизни поз ТС, то должно заработать, по идее

https://disk.yandex.ru/d/PnU3K-tUgmu-oA

зависимость с длиной 1000 тиков

https://disk.yandex.ru/d/6F8FdUGthpnk3A

потом попытаюсь осмыслить подход и сделать тесты, но получилось ускорить расчеты

может он и не сохраняет никакую память в последовательностях, зато быстрый :)

И с длиной , до кучи

https://disk.yandex.ru/d/1ypCrzYKk82XdA

TicksGM.csv.zip
TicksGM.csv.zip
  • disk.yandex.ru
Посмотреть и скачать с Яндекс Диска
 
fxsaber #:

Может стоит попробовать через аппроксимацию решить задачу генерации новых данных?

Взять окно и пытаться с разной точностью описать в нём числовой ряд, при этом такой подход позволит глобально сохранить динамику движения цены, в том числе с учётом суточных колебаний.

И, историю достаточно будет сохранять в виде коэффициентов аппроксиматоров.

 
Maxim Dmitrievsky #:

Ваша ТС же ищет не все закономерности, которые могут быть. Поэтому надо под нее

Тогда мы сталкиваемся с проблемой "курицы и яйца":

  • МО сохранит закономерности, если ей дать данные работающей ТС.
  • На исходном цВР МО должно найти работающую ТС.

Иначе через другой подход, но это будет долго на тиках и позднее )

Все такие разработчики далеки от торговли. Вместо Average надо бы Median.

 
Aleksey Vyazmikin #:

Может стоит попробовать через аппроксимацию решить задачу генерации новых данных?

Взять окно и пытаться с разной точностью описать в нём числовой ряд, при этом такой подход позволит глобально сохранить динамику движения цены, в том числе с учётом суточных колебаний.

И, историю достаточно будет сохранять в виде коэффициентов аппроксиматоров.

Звучит хорошо. Когда смотрю статьи на тему исследования цВР, почти сразу начинаю сомневаться в их подходах, если идет поиск закономерностей в предположении, что они круглосуточные.

 
Maxim Dmitrievsky #:

зависимость с длиной 1000 тиков

И с длиной , до кучи

С тиками такой выбор окна странный. Логично же привязываться к таймстемпам, а не к индексам тиков.

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Машинное обучение в трейдинге: теория, модели, практика и алготорговля

fxsaber, 2023.09.09 04:40

В этом месте ошибка: должно быть time_msc. Но это никак не влияет на результаты, что были после сообщения.

Просьба перезапустить, чтобы таймстемпы корректно отображались для следующих генераций.
Это на случай, если решите привязываться.
 
Maxim Dmitrievsky #:

зависимость с длиной 1000 тиков

https://disk.yandex.ru/d/6F8FdUGthpnk3A

.

 
mytarmailS #:
Те вы пытаетесь найти не один набор параметров, а некий сгусток / кластер из близких наборов параметров.

Посмотрите, насколько разные кривые в Sample-интервале (между синими линиями).

Это говорит о том, что получаются не близкие наборы параметров, а далекие. Если в терминах шумной целевой функции, то получены результаты около разных холмиков.

Понятно, что если не прерывать ГА, а дожидаться завершения, то будет найден пик. И все 20 лучших проходов будут оттуда - Sample-кривые будут почти одинаковые. Это ни к чему.

 
fxsaber #:

если не прерывать ГА, а дожидаться завершения, то будет найден пик. И все 20 лучших проходов будут оттуда - Sample-кривые будут почти одинаковые.

Сделал проверку этого утверждения на том же цВР, не прерывая ГА.

Хорошо видно, что среди этой 20-ки есть непохожие сеты. Скорее, это говорит о том, что штатный ГА не справился с задачей. Точнее, он сам себя прервал, поместив в лучшая двадцатку результаты из разных пиков.

 
fxsaber #:

Звучит хорошо. Когда смотрю статьи на тему исследования цВР, почти сразу начинаю сомневаться в их подходах, если идет поиск закономерностей в предположении, что они круглосуточные.

Ну, могу сказать, что не для всех предикторов сплит по времени даст значимое смещение вероятности, во всяком случае у меня. Поэтому я склонен считать, что время значимый фактор, но на исход могут повлиять и другие, более значимые факторы, если они в фазе активности.

Ещё вот думаю, что в окне можно просто взять разную сетку квантования для цены, с большим числом интервалов (для более точного сохранения структуры), и по такому "сжатому сигналу" тестировать - он будет иметь уже отклонения. А можно и малое число интервалов плюс шум рандомный в диапазоне отсчета между двумя интервалами.

Сетку даже можно зафиксировать, и сохранять только смещение для первого отсчета. Тогда вообще мало места будет занимать и преобразование должно быть быстрым.