Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 153
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Что вы имеете в виду? Вроде бы во фразе чувствуется что-то интересное, но смысл ускользает.
Я там ошибся 2 сигмы, ну в общем приращение цены за некоторый промежуток времени, к примеру за минуту, как фича может добавить примерно 4-5% дополнительной информации, о том куда двинется цена в следующую минуту, ну и так далее для 5 мин 5 мин для часа час и тп, ну понятно это всё очень приблизительно, и "информация" не значит что это тудаже двинется, это имеется в виду как вес данной фичи в довольно сложных системах учитывающих тысячи фичей. То что было раньше не значит почти ничего, шум.
1) Узковатое понимание вопроса. фильтр сверточной сети может провести множество операций над входным вектором, и сформировать, например, n скользящих средних, частично пересекающихся или нет, или взять несколько сумм. Что уже является заявкой на нормальный feature engineering.
2) Опять же, недосказанность или недопонимание. Для сверточных сетей достаточно подать "сырые" данные (в псевдостационарном виде), например, ценовые возвраты с лагом 1. Остальное доделывает сама сеть.
Со сверточными сетями всё хорошо, я не спорю, вопрос в том что ПОЧЕМУ ОНИ РАБОТАЮТ, особенно так хорошо на картинках, спектрограммах и тп. если разобраться то всё дело в том что компоненты вектора "размазаны" друг с другом, по сути картинка это даже и не вектор, сверточный слой попросту сжимает размерность, умножая области скоррелированных областей на ряд фильтров подобранных быкпропом, эти фильтры можно получить разными способами, но картинка так сказать ВСЯ равнозначна, а временной ряд его "фигура" это по сути шум, имеют смысл лишь последние его бары и последние бары сотен и тысяч других инструментов разных бирж.
А всовывая историю за день одного ряда в CNN и Остальное доделывает сама сеть. получим... то что все получают
Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий
Обсуждение статьи "Работа с сокетами в MQL, или Как стать провайдером сигналов"
pavlick_, 2016.09.09 10:52
Я в линуксе, следовательно, ipc вообще становится нетривиальной задечей (общение между терминалом под wine и linuex exe). А IPC через сеть - универсальный способ. Я соединяю мкл скрипт с linux программой через loopback (127.0.0.1) на одном компе. По сути, я написал linux api для терминала (мкл скрипт обрабатывает запросы и отсылает ценовые данные или выставляют ордера).
В моей ситуации это лучший способ IPC из того что я пробовал. А перносить свои наработки на мкл не хочу - не хочу привязываться к конкретному языку, принципиально.
Возможно, что мы сделаем шикарный подарок для R сообщества.
Время покажет.
Парни есть идейка, стоит проверить, у меня она возникла уже давно, хотел проверить но не смог разобраться с пакетом и как то забыл и забросил, а тут читал ветку J.B и вспомнил, оказывается он тоже что то похожее делал:)
Речи идет о кросс корреляции - те мы можем вычислить на сколько один ВР отстает от другого ВР и вообще есть ли между ними связь...
суть именно моей была идеи в том чтобы мониторить одновременно большое количество пар и построив что то на подобе кросс кореляцыонной матрицы сравнивать каждую пару с каждой и находить такие пары которые какое то время ходят друг за другом но одна отстает на какое то время и торговать это отставание, так как в рынке нет ничего более постоянного чем временное то пере расчеты думаю нужно делать постоянно на каждом новом баре, чтобы сразу замечать когда появляется новая зависимость и также чтобы сразу замечать когда эта же зависимость пропала...
можно брать что угодно, любые предикторы но думаю лучше всего подойдут именно пары так как маркетмейкеры когда ведут цену по своему инструменту практически всегда ориентируються на один или связку из других инструментов, а вот классич. индикаторы врятли подойдут
так же можно попробовать и нейросеть обучать на таких динамически изменяющихся предикторах, кароч все ограничено только фантазией...
Я бы и сам это попробовал бы реализовать но пока занят другим проектом и не хочу распыляться
стандартная функция кросскореляции в Р-ке ccf()
продвинутый пакет с предварительной спектральной разбивкой на уровни и потом уже проверкой на кросскореляцию "wavemulcor" , так же в нем можно одновременно сравнивать много ВР
Речи идет о кросс корреляции - те мы можем вычислить на сколько один ВР отстает от другого ВР и вообще есть ли между ними связь...
суть идеи в том чтобы мониторить одновременно большое количество пар и построив что то на подобе кросс кореляцыонной матрицы сравнивать каждую пару с каждой и находить такие пары которые какое то время ходят друг за другом но одна отстает на какое то время и торговать это отставание, так как в рынке нет ничего более постоянного чем временное то пере расчеты думаю нужно делать постоянно на каждом новом баре, чтобы сразу замечать когда появляется новая зависимость и также чтобы сразу замечать когда эта же зависимость пропала...
одновременно сравнивать много ВР
Мыслите верно, как для начала, но использовать нужно не только валютные пары, а сырьё, акции, фьючи, опционы, бонды, индексы и вообще всё что сможете купить желательно в виде ордерлога, ну в крайнем случае секундные срезы цены, объёма и стакана заявок, также соцсети NLP-шить в цифры, важные новости самом собой, а кросскорреляция только для пристрелки тк линейная, нужно рафинировать данные и пускать всё это в ансамбли классификаторов с разными функционалами, сразу предупреждаю, что во первых качественные реалтаймовые данные с ключевых бирж мира обойдутся в копеечку, а настроить торговую инфраструктуру и продвинутый ML для переваривания этого потока займет лет >5 лет квалиффицированных 3-5 спецов, что только на зп больше мио$, огромная работа, одному такое не поднять, разве что в очень "прыщавом" виде, который будет даже если местами альфапотенциальный, сливать из за частых сбоев, но тем не менее это уже что то. В общем нужно быть фанатом этого дела, тогда есть шанс))) Надеяться что сверточная или рекурентная сеть сделает всё сама, это наивный взгляд, также как раньше думали про граальные индюки.
PS: Обсуждать публично конкретику по понятным причинам не стоит, слышал об историях, пока что на западе, когда людей за слишком предметные пэйперы по теме применения ML к алготорговле, вносили в черный список и потом ни в один фонд такого не брали, оставалось только в институте преподавать или околорынком заниматься, ютуб, блоги писать, лохов учить как сливать за пару сотен баксов(((
Лао-Цзы был алготрейдером говоря: "Знающий - молчит, говорящий - не знает")))
То есть болтать можно о многом, но только в общем, ну а особо искушенные ещё дезят чучуть когда кто то подбирается слишком близко к солнцу))))
На MQL это уже много лет есть.
Я там ошибся 2 сигмы, ну в общем приращение цены за некоторый промежуток времени, к примеру за минуту, как фича может добавить примерно 4-5% дополнительной информации, о том куда двинется цена в следующую минуту, ну и так далее для 5 мин 5 мин для часа час и тп, ну понятно это всё очень приблизительно, и "информация" не значит что это тудаже двинется, это имеется в виду как вес данной фичи в довольно сложных системах учитывающих тысячи фичей. То что было раньше не значит почти ничего, шум.
Теперь понял.
Это согласуется с моими наблюдениями. Я это называю зеркальностью (позже выложу наверное пару графиков на эту тему). Для предсказания прироста цены на n-минут лучшую объясняющую значимость показывают заглядывания в прошлое на те же n-минут.
Но помимо этого у меня есть данные весьма обширные о том, на каком горизонте предсказательная сила наиболее велика.
А откуда цифры 4-5%? Как считаются? Значимость предикторов, R^2, взаимная информация?
Желательно ссылки на ccf() и wavemulcor
Да как-то без этого обошлись.