Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1833

 
mytarmailS:

Давай по другому, напиши что тебе не ясно, я уже два раза картинки рисовал, мне кажется я все объяснил, но объясняю я плохо, этого мне точно не дано

Алгоритм найти события затем повторы цепочки событий и по неполному образу делать прогноз.

Это то что я поняли из картинок, это правильно или нет?

 

Вон я вчера сделал, иногда работает


 
Maxim Dmitrievsky:

каким профи??? они хотят предсказывать рынок, читая твиттер

Они хотят прикрутить ФА скорее всего через МО, но там сперва логика нужна некая, хотя может с вдруг корреляцию найдут с соцсетями или маркетплейсами. 

К тому же с м-плейсов график продаж можно прикручивать к стоимости акций опосредованно.

 
Valeriy Yastremskiy:

Алгоритм найти события затем повторы цепочки событий и по неполному образу делать прогноз.

Это то что я поняли из картинок, это правильно или нет?

например кластеризируем цену на 10 кластеров..

Что такое кластер - это некий образ который повторяется - "паттерн"

у кластера есть номер в. дн. случ. от 1 до 10

цена в виде кластеров будет выглядеть вот так

1113333555433377779991010103333222288888

выбираем от балды комбинацию например  1593

ищем ее в цене

1113333555433377779991010103333222288888

это и будет результирующий паттерн

собираем вместе все ситуации с этим паттерном и смотрим статистику прибыльности


кластеров могут быть сотни, строить их можно по любым данным, кластера можно заменить на лог правила например, это будет более четко

 
mytarmailS:

например кластеризируем цену на 10 кластеров..

Что такое кластер - это некий образ который повторяется - "паттерн"

у кластера есть номер в. дн. случ. от 1 до 10

цена в виде кластеров будет выглядеть вот так

1113333555433377779991010103333222288888

выбираем от балды комбинацию например  1593

ищем ее в цене

1113333555433377779991010103333222288888

это и будет результирующий паттерн

собираем вместе все ситуации с этим паттерном и смотрим статистику прибыльности


кластеров могут быть сотни, строить их можно по любым данным, кластера можно заменить на лог правила например, это будет более четко

по каким данным строить? не надо этой куйни с цыфрами, просто кластеры

по каким данным? на приращениях не оч. хорошо получается

 
Maxim Dmitrievsky:

по каким данным строить? не надо этой куйни с цыфрами, просто кластеры

по каким данным? на приращениях не оч. хорошо получается

приращения это самое тупое что можно сделать с ценами, тогда АМО даже елементарного линейного тренда в данных не видит

погоди  нарисую


сначала нужно набрать много прототипов  (подготовка данных)

идем скользящим окном по данным, в скользящем окне всегда есть последняя цена (last price)


нам все цены не нужны так как врятли  цены за 100п от last price как то влияют на   last price

Потому мы вырезаем то что  лишнее оставляем только в зеленом диапазоне  in price



потом

last price - in price

и мы пронормировали   in price относительно last price


потом разбил на кластера

кароч учишь модель видеть на разных данных одинаковые кластера в in price, когда научил начинаешь искать паттерны

 
mytarmailS:

приращения это самое тупое что можно сделать с ценами, тогда АМО даже елементарного линейного тренда в данных не видит

погоди  нарисую


сначала нужно набрать много прототипов  (подготовка данных)

идем скользящим окном по данным, в скользящем окне всегда есть последняя цена (last price)


гениально ))

все он видит на приращениях, но ошибка великовата получается

 
mytarmailS:

нм все цены не нужны так как врятли  цены за 100п от last price как то влияют на   last price

Потому мы вырезаем то что  лишнее оставляем только в зеленом диапазоне  in price


потом

и мы пронормировали   in price относительно last price

а если сильный тренд то у тебя почти не будет цен в диапазоне

и всегда разное кол-во фичей получается
 
mytarmailS:

например кластеризируем цену на 10 кластеров..

Что такое кластер - это некий образ который повторяется - "паттерн"

у кластера есть номер в. дн. случ. от 1 до 10

цена в виде кластеров будет выглядеть вот так

1113333555433377779991010103333222288888

выбираем от балды комбинацию например  1593

ищем ее в цене

1113333555433377779991010103333222288888

это и будет результирующий паттерн

собираем вместе все ситуации с этим паттерном и смотрим статистику прибыльности


кластеров могут быть сотни, строить их можно по любым данным, кластера можно заменить на лог правила например, это будет более четко

От балды это перебор (случайный или другой это второй вопрос) и вариантов даже в 10 значениях много. И они не обязательно прибыльны, если рандомный выбор. Логика с прибыльностью нужна, она уменьшит количество вариантов.

 
Maxim Dmitrievsky:

а если сильный тренд то у тебя почти не будет цен в диапазоне

и всегда разное кол-во фичей получается

Соответственно одним алгоритмом / моделью нельзя обойтись, необходим критерий выбора моделей. Может от количества фичей)))