Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2636

 
secret #:
Разве в данной ветке не происходит оное, уже который год?)

Из-за отсутствия осмысленной модерации здесь резвится полно сущностей не владеющих темой (обозначенной в самом первом сообщении ветки), но желающих высказать хоть что-то. Вот и вы с соотечественником отметились.

 
Aleksey Nikolayev #:

Из-за отсутствия осмысленной модерации здесь резвится полно сущностей не владеющих темой (обозначенной в самом первом сообщении ветки), но желающих высказать хоть что-то. Вот и вы с соотечественником отметились.

Успехов вам на этом бесконечном пути)
 
Придумайте фичи типа приращений, но более информативные. Например, найти среднюю цену по всей истории и из неё вычесть остальные. Нужно чтобы разброс значений был максимальный, но в диапазоне, известном на новых данных. 

Дробное дифференцирование так работает (при сохранении стационарности максимальный разброс), но охото чего-то нового

Может какие-нибудь «наклонные линии» от времени и из них вычитать цены, децибелы, ф-ю от времени, любую муть, главное чтобы соблюдались условия стационарности и максимального разброса
 

Допустим, мы нашли паттерны, которые периодически встречаются и сопутствуют определенному движению цены после их возникновения.

Кто либо проводил исследования по вопросу зависимости частоты возникновения паттерна и последующего события?

Речь о скоплениях вероятностей, если есть такой термин.

Допустим, можно ли ожидать, что если давно не появлялся паттерн, то после его появления будет прогнозируемое (сопутствующее ему) движение цены, а потом будет происходить затухание, так как этот паттерн стал виден всем и устранил тем самым неэффективность рынка.

Думаю, что развитие метрик оценки этих переходных состояний во времени (от более вероятного прогноза до равновероятного или даже отрицательного), может способствовать поиску и отбору таких паттернов, а модель, способная учитывать это может оказаться достаточно эффективной.

Я работаю в данном направлении, но мне не хватает математического аппарата и теоретических знаний.

 
secret #:
Успехов вам на этом бесконечном пути)

Вам тоже не хворать и долго идти по известному вам пути)

 
Aleksey Vyazmikin #:

Допустим, мы нашли паттерны, которые периодически встречаются и сопутствуют определенному движению цены после их возникновения.

Кто либо проводил исследования по вопросу зависимости частоты возникновения паттерна и последующего события?

Речь о скоплениях вероятностей, если есть такой термин.

Допустим, можно ли ожидать, что если давно не появлялся паттерн, то после его появления будет прогнозируемое (сопутствующее ему) движение цены, а потом будет происходить затухание, так как этот паттерн стал виден всем и устранил тем самым неэффективность рынка.

Думаю, что развитие метрик оценки этих переходных состояний во времени (от более вероятного прогноза до равновероятного или даже отрицательного), может способствовать поиску и отбору таких паттернов, а модель, способная учитывать это может оказаться достаточно эффективной.

Я работаю в данном направлении, но мне не хватает математического аппарата и теоретических знаний.

Можно работать только с совсем простыми паттернами, типа движения после пробития вершины. В том смысле, что их должно быть достаточно много для того, чтобы частота служила хорошей оценкой вероятности.

По моим наблюдениям, когда полностью формализуется разметка паттернов, неэффективность рынка (в смысле отличия от СБ) становится малозначимой. Условно говоря, в пределах спреда. Возникает естественное желание усложнить конструкцию паттернов, но это обычно приводит к сокращению размера выборки и нестабильности результата.

 
Maxim Dmitrievsky #:
Придумайте фичи типа приращений, но более информативные. Например, найти среднюю цену по всей истории и из неё вычесть остальные. Нужно чтобы разброс значений был максимальный, но в диапазоне, известном на новых данных.

Напоминает теорию торговли спреда. А там местами довольно сложная математика, судя по обилию навороченных статей по теме.

Maxim Dmitrievsky #:
Дробное дифференцирование так работает (при сохранении стационарности максимальный разброс), но охото чего-то нового

Может какие-нибудь «наклонные линии» от времени и из них вычитать цены, децибелы, ф-ю от времени, любую муть, главное чтобы соблюдались условия стационарности и максимального разброса

Но это же будет что-то вроде z-score, когда есть стационарность только на истории? Хотя, конечно, попыток приведения к стационарности невозможно избежать в принципе - без неё особо не поторгуешь.

 
Aleksey Nikolayev #:

Можно работать только с совсем простыми паттернами, типа движения после пробития вершины. В том смысле, что их должно быть достаточно много для того, чтобы частота служила хорошей оценкой вероятности.

Достаточно, это сколько? Допустим у меня от 5% до примерно 15% в выборке отбираются простые "паттерны", а выборка для обучения, пусть 15к примеров, этого слишком мало?

Aleksey Nikolayev #:

По моим наблюдениям, когда полностью формализуется разметка паттернов, неэффективность рынка (в смысле отличия от СБ) становится малозначимой. Условно говоря, в пределах спреда. Возникает естественное желание усложнить конструкцию паттернов, но это обычно приводит к сокращению размера выборки и нестабильности результата.

Вопрос в том, как формализовать эти наблюдения лучше, что б результат получать быстро и отбрасывать/классифицировать паттерны с какой либо закономерностью и без неё.

 
Aleksey Vyazmikin #:

Достаточно, это сколько? Допустим у меня от 5% до примерно 15% в выборке отбираются простые "паттерны", а выборка для обучения, пусть 15к примеров, этого слишком мало?

Считать лучше в штуках паттернов. Тех же пробитий вершин (значимых для работы) бывает не более нескольких сотен в год. Я бы назвал это граничным количеством. Если пытаться делать из них более сложные паттерны -- брать, к примеру, пары последовательных пробитий вершин, отвечающих к тому же каким-нибудь условиям, то их число может измеряться уже десятками в год. А этого уже мало.

 
Aleksey Vyazmikin #:

Вопрос в том, как формализовать эти наблюдения лучше, что б результат получать быстро и отбрасывать/классифицировать паттерны с какой либо закономерностью и без неё.

Что-то типа цикла по всем возможным конструкциям паттерна заданного типа? Что-то подобное делал когда-то с теми же пробоями вершин. В принципе, придумать что-то можно, только перебор будет (в общем случае) не итеративным, а рекурсивным. Опять же, большая часть паттернов будет бессмысленной из-за сложности и редкости. Наверное, проще вручную собрать список осмысленных паттернов и обходить его в обычном цикле, выбирая оптимальный.