Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3100

 
sibirqk #:

Возможно вы и правы. Хотя объяснять нестационарности, неравномерной  волатильностью, на мой взгляд некоторое упрощение. Кластеризация волатильности
достаточно просто моделируется и тогда всякие гетероскедастичности легко устранялись бы корреляцией с волатильностью. А в реальности там напридумано туча всяких хитрых арчей-гарчей, которые к тому же не сильно хорошо работают.
   Рынок наверное эффективен, а если нет, то узнать это можно только найдя свою альфу, с помощью которой можно будет его постоянно обыгрывать. Где искать эту альфу, в каком направлении копать, на мой взгляд, как раз и может подсказать, натолкнуть модель ценообразования. В противном случае проклятие размерности может привести к тому что на ее поиск уйдет миллионы часов работы компов.

я стационарностью называю привычное эконометрическое: постоянство среднего и дисперсии. На рынках такого естественно нет, они же не "памятник". Гетероскедастичность убирается, остальное близко к СБ. 

Вообще вид распределения мало что говорит о предсказуемости. Это такая математическая игра, отдаленная от трейдинга. Добавьте в котировку немного пушистости, покрывающей спред. Или устойчивый возврат к среднему в определенное время суток. Распределение не изменится, а заработать будет можно. Примерно такое и всякое подобное можно назвать неэффективностью. Для этого писать алгоритмы с учетом того, что предсказать все нельзя, да и не нужно. Я бы не сказал что там такое уж проклятие, просто есть реально эффективные инструменты, из которых фиг че вытащишь.

 
Научите ИИ инфоцыганству. 
 

Если провести измерение процента сигналов одного типа на каждом месяце выборки для отдельно взятого квантового отрезка и вычесть средний процент прибыльных сигналов и на данных построить баланс, то можно увидеть следующее.

Это отобранный по моему методу квантовый отрезок, и что видим - с 38 месяца по 127 наблюдался такой устойчивый тренд, а потом начались колебания.

Вот и получаются, что если выборку поделить по классике 60+20+20, то до примерно 100 месяца мы будем обучаться и всё будет хорошо, потом на 40 месяцах - до 140 окажемся в плюсе и уже на независимой для тестирования выборке поймаем движ вниз с отскоком. При этом, видно, что до 38 месяца были похожие движения на выборке для обучения, но какая модель их учтет, найдет "объяснение" этим колебаниям? Обычная деревянная модель начнёт выдергивать везде по кусочку, по всей выборке, в то время как надо обратить отдельно внимание только на её часть.

Вот я и думаю, о таком способе построения модели, который бы учитывал выше описанные нюансы - и делал сплиты не по всему куску, а как бы учитывал отдельно изменения на каждом участке после того же сплита.

Может опять изобретаю велосипед и уже есть решение? А то на бумаге уже изложил задатки системы, но до кода ещё далеко...

 

Ну а так выглядит гистограмма (по версии excel)

Видно, что есть месяца, где закономерности не работали.... и вот их и надо объяснять другими сплитами, но желательно убирая там где их скопление.

 

И, что я хочу - если даже не обучать модель так сложно, то хотя бы задетектить заблаговременно, возможно вероятностно, участок изменения с положительного смещения в квантовом отрезке вероятности благоприятного исхода на отрицательный.

Вот думаю о целевой тут, выборка уже формируется.

 

Если представить процент дельты позитивных и негативных исходов в квантовом отрезке за месяц в виде +1/-1, то график имеет уже такую картину - и это уже интересней выглядит.


 
Есть какой-то квантовый хрень-резок, который где-то плохо работает, что же делать.. осреднить его сигналы с учетом новых данных, где он плохо работал, чтобы он работал там не так плохо, но и не так хорошо на прошлых.
 Какой вопрос, такой ответ, не обессудьте 
 
Maxim Dmitrievsky #:
Есть какой-то квантовый хрень-резок, который где-то плохо работает, что же делать.. осреднить его сигналы с учетом новых данных, где он плохо работал, чтобы он работал там не так плохо, но и не так хорошо на прошлых.
 Какой вопрос, такой ответ, не обессудьте 

Усреднить, отнять и поделить :)

В общем, как я понял, предлагаете поменять целевую на участке, где "плохой" сигнал?

 
Valeriy Yastremskiy #:

У Алексея Николаева в блогах на R реализована модель игры Кафе, или победа меньшинства, похоже по условиям на рынок, если позиция игрока находится в обществе с меньшим количеством участников, то он выигрывает (в кафе, по дате,игроки пришедшие в день с наименьшим количеством посетителей выигрывают, а с большим проигрывают), но это слишком простая модель, в реале еще куча типов игроков, начиная от государства и других больших игроков и кончая мелкими игроками, которых большое количество. Модель пока даже приблизительно не создана)

А вот графики там даже очень похоже на тиковое блуждание получаются.

Модель СБ в ценообразовании - это базовый, предельный  вариант, которого в реальности видимо никогда не бывает, как аналог из физики - идеальный газ. Эта модель получается при двух условиях - а) большое число участников; б) абсолютная независимость их торговых стратегий от других участников. Понятно, что второе условие выполнить сложно, соответственно можно исследовать как будет влиять на отклонения от модели СБ, если на рынке например присутствуют несколько групп(кластеров) участников с разными стратегиями. Или какая-то часть участников обладает инсайдерской инфой. На чистом СБ заработать невозможно по определению, заработать можно только на отклонениях от него.

 
mytarmailS #:

лично я вообще не вижу никакой пользы от модели с СБ..

Она ничего не дает , она не выделяет хороших свойств , она не подавляет плолихие свойства , она не упрощает..

Ну да , график похож на цены , ну и что с того?

Сама по себе  модель СБ конечно пользы мало дает, польза получается только тогда когда диагностируются(находятся) отклонения от этой  модели.

Причина обращения: