Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3184

 
fxsaber #:

Ни одну симуляцию использовать не стал бы. Что они делают:

  1. Находят несколько (пусть их будет 100) стат. характеристик в баровой истории.
  2. Генерируют ряды баров, чтобы эти 100 стат. характеристик совпадали.

Абсурдно, что 100 значений могут описывать исходный ряд в миллионы значений! Похоже, это инструмент теоретиков, но не практиков.

Абсурдно удивляться не знакомомму и называть это абсурдом...

Вы знакомы с алгоритмами уменьшения размерности? алгоритмами сжатия?

fxsaber #:

Предложенный алгоритм работает с тиками. В получаемых барах совпадают тиковые объемы, совпадают спреды. Идентичная резкая реакция на новостях, идентичное поведение в ролловер и т.д.

Звучит, что все круто. Но я не могу обучить скальпингу даже после такой рандомизации. И пока у меня нет объяснения этому.

Вот вам и ответ на сколько ваша рандомизация хорошо симулирует реальный рыночный процесс..

fxsaber #:

Задача.

Рандомизировать реальный скальпируемый символ, чтобы он оставался скальпируемым.

А вот вам критерий/фитнес функция для создания правильной симуляции ряда

 
mytarmailS #:

Абсурдно удивляться не знакомомму и называть это абсурдом...

В тех искуственных данных как сигнал - периодические функции, для анализа которых достаточно 1-2-10 периодов (через каждые 50 бар например та же ф-я (абсолютно), но с другим шумом, через 50 опять и т.д.). В рыночных данных не периодическая ф-я, поэтому надо анализировать все...

 
mytarmailS #:

Вы знакомы с алгоритмами уменьшения размерности? алгоритмами сжатия?

Да.

Вот вам и ответ на сколько ваша рандомизация хорошо симулирует реальный рыночный процесс..

Да.

А вот вам критерий/фитнес функция для создания правильной симуляции ряда

К сожалению, непонятно, какие входные параметры рандомизации оптимизировать.

 
fxsaber #:

Есть несколько гипотез.

Сравнил характеристику "максимальная потенциальная прибыль". Не увидел значимых различий.

 
fxsaber #:

Сравнил характеристику "максимальная потенциальная прибыль". Не увидел значимых различий.

Это если по-тиково? А если тренд ловить? От разворота до разворота сравните.
 
Forester #:

Amount1 - Amount2 -  это скорее волатильность. Трендовость - это если их много сложить. В реальных данных тренды одни, в рандомизированных (до примерно через1), тренды скорее случаные выбросы за счет повышения волатильности. Предполагаю, что они по амплитуде в разы меньше, чем реальные.

UPD: не разглядел сразу, что там у вас ~ а не -

Про ~. Их приблизительное равество означает только что, реально хорошо перемешали, в среднем через 1.

Я смотрю на тренд как на смещение среднего в приращениях относительно ноля

но это все дело вкуса наверное

par(mar=c(2,2,2,2),mfrow=c(2,1))

mn_trend <- c(rep(-0.5,100),rep(0.5,100))
rn <- rnorm(200)
cbind(rn , mn_trend) |> matplot(t="l", lty=1, col=c(8,2),main="random and mean")

rn_trend <- rn + mn_trend
rn_trend |> cumsum() |> plot(t="l",main = "cumulative sum rn + mn_trend")
 

Forester #:
Это если по-тиково?

Да.

А если тренд ловить? От разворота до разворота сравните.

Стал менять размеры (в пределах разумного для скальпинга) мин. колена ЗЗ и смотреть сумму колен.

У рандомного символа такая потенциальная прибыль выше, чем у оригинального. Т.е. рандомный символ потенциально более прибыльный.

Если бы потенциальная прибыль была ниже оригинального, то это могло бы хоть как-то объяснить облом со скальпингом. Но тут обратная ситуация.


ЗЫ В общем, если есть интерес попробовать найти различия между двумя рядами, могут их предоставить.

 
fxsaber #:

Да.

Ну тогда вы должы знать что в спектральном анализе например сотней гармоник можно описить ряд в 10 000 значений с довольно хорошей точностью..

взяли 10 000 значений ---> получили -+ то же но 100 значений

Абсурдно, что 100 значений могут описывать исходный ряд в миллионы значений! Похоже, это инструмент теоретиков, но не практиков.

А вы называете это абсурдом, странно...

fxsaber #:

К сожалению, непонятно, какие входные параметры рандомизации оптимизировать.

Все что я тут напишу это чисто мои фантазии так что смотрите критически...


Можно попробовать создать из тех же гармоник такой ряд, на котором будет работать ваша ТС ..

параметры для оптимизатора  - это комбинация гармоник ,

фитнес функция - качество работы ТС на этих синтетических данных

 
fxsaber #:

У рандомного символа такая потенциальная прибыль выше, чем у оригинального.

Странно.

Значит тест Монте-Карло пройден получается. Если на реалных есть прибыль, а на перемешанных нет.

 
mytarmailS #:

Ну тогда вы должы знать что в спектральном анализе например сотней гармоник можно описить ряд в 10 000 значений с довольно хорошей точностью..

взяли 10 000 значений ---> получили -+ то же но 100 значений

А вы называете это абсурдом, странно...

Потому что это никакого отношения не имеет к цВР. mp3 и jpg даже при очень низком битрейте узнаваемы нейронкой. Но вот альфа в виде скальпинга теряется даже при сохранении "битрейта".

Причина обращения: