Quantitative trading - страница 28

 

Использование искусственного интеллекта для построения алгоритмических торговых стратегий



Использование искусственного интеллекта для построения алгоритмических торговых стратегий

Генеральный директор и соучредитель компании по разработке торговых стратегий объясняет захватывающий потенциал ИИ и машинного обучения в алготрейдинге. Эти инструменты доказали свою эффективность крупными количественными хедж-фондами, а их доступность значительно увеличилась благодаря библиотекам с открытым исходным кодом и удобным инструментам, не требующим глубоких математических или компьютерных знаний. Спикер также представляет ключевые термины, связанные с искусственным интеллектом и машинным обучением в контексте алгоритмической торговли. Искусственный интеллект определяется как изучение интеллектуальных агентов, которые воспринимают окружающую среду и предпринимают действия для достижения максимального успеха. Машинное обучение, подмножество ИИ, фокусируется на алгоритмах, которые могут обучаться и делать прогнозы без явного программирования. Распознавание образов, ветвь машинного обучения, включает в себя выявление закономерностей в данных, в то время как изучение правил ассоциации включает формирование утверждений «если-то» на основе этих закономерностей. Докладчик кратко упоминает концепцию больших данных, которая характеризуется четырьмя V: объем, скорость, разнообразие и достоверность.

Докладчик описывает термины и концепции, которые будут обсуждаться, включая большие данные, достоверность, искусственный интеллект, машинное обучение, распознавание образов и интеллектуальный анализ данных. Затем они углубляются в лучшие практики и распространенные ловушки при построении алгоритмических торговых стратегий. К ним относятся определение реальных целей для достижения успеха, приоритет простоты над сложностью, сосредоточение внимания на создании надежного процесса и рабочего процесса вместо того, чтобы полагаться на одну модель, и поддержание здорового скептицизма на протяжении всего процесса, чтобы избежать предвзятых результатов.

Спикер переходит к обсуждению того, как машинное обучение может решить проблему выбора индикаторов и наборов данных для построения торговых стратегий. Деревья решений и случайные леса представлены как методы определения важных показателей путем поиска наилучших разделений данных. Отмечено, что случайные леса более надежны и мощны, чем деревья решений, хотя и более сложны. Докладчик также исследует, как объединение наборов индикаторов с использованием техники, называемой «оберткой», может создать более мощную комбинацию.

Далее спикер обсуждает использование технических индикаторов в алгоритмических торговых стратегиях и их преимущества в определении основных моделей и тенденций. Поднимается вопрос оптимизации параметров индикатора на основе машинного обучения и вводится концепция ансамблевого обучения, которая объединяет несколько классификаторов для анализа данных и выявления различных закономерностей и информации. Также упоминается различие между выбором признаков и извлечением признаков в машинном обучении с напоминанием о необходимости помнить о подгонке кривой при использовании нескольких классификаторов.

Докладчики демонстрируют сочетание распознавания образов и изучения ассоциативных правил как способ использовать алгоритмы машинного обучения, сохраняя при этом интерпретируемость торговых стратегий. Они приводят пример использования машины векторов поддержки для анализа взаимосвязи между трехпериодным RSI и ценовой разницей между ценой открытия и 50-периодной SMA на австралийском долларе. Четкие шаблоны переводятся в торговые правила. Однако они признают ограничения этого метода, такие как анализ многомерных данных, проблемы автоматизации и интерпретация выходных данных. Спикер представляет Trade как возможное решение для решения этих проблем и позволяет трейдерам использовать алгоритмы с любыми индикаторами, которые они пожелают.

Докладчик продолжает демонстрировать, как создавать торговые стратегии с использованием облачной торговой платформы. Они используют пример построения стратегии для торговли австралийским долларом на дневном графике с использованием данных за пять лет. Чтобы избежать подгонки кривой, алгоритм обучается только до 1 января 2015 г., оставляя год данных вне выборки для тестирования. Подчеркивается важность не тратить впустую эти данные вне выборки, чтобы избежать предвзятого тестирования на исторических данных. Использование алгоритмов машинного обучения для анализа индикаторов и выявления паттернов представлено как гибкий и мощный подход к оптимизации торговых стратегий.

Далее докладчик демонстрирует процесс построения торговой стратегии с использованием платформы Trade-Ideas и библиотеки индикаторов с открытым исходным кодом TA Lib. Они анализируют движение цены австралийского доллара за пятилетний период, определяют диапазоны с сильными сигналами и уточняют правила открытия длинных позиций, выбирая диапазоны индикаторов и отмечая их отношения. Добавляя правило для цены относительно 50-периодной SMA, они определяют два разных диапазона с сильными сигналами. Подчеркивается преимущество использования Trade-Ideas, поскольку оно позволяет анализировать результаты алгоритмов машинного обучения и строить правила непосредственно из гистограмм для более четкой интерпретации.

Ведущий обсуждает процедуру построения коротких правил для торговой стратегии, включая выбор правильных индикаторов и уточнение правил для поиска сильных коротких сигналов. Особое внимание уделяется тестированию и изучению различных моделей с помощью индикаторов для поиска оптимальной стратегии. Также демонстрируется генерация кода и тестирование стратегии вне выборки в MetaTrader4 с учетом транзакционных издержек. Ведущий подтверждает, что подход связан с алгоритмическим трейдингом.

Докладчик объясняет, как протестировать стратегию, построенную на самых последних данных вне выборки, которые не использовались в процессе построения стратегии. Моделирование проводится с использованием MetaTrader, популярной торговой платформы для валют и акций. Активное сообщество разработчиков платформы создает автоматизированные стратегии, пользовательские индикаторы и предоставляет прекрасную возможность для тестирования и торговли на одних и тех же данных. Основное внимание при моделировании уделяется оценке эффективности стратегии на данных вне выборки. Спикер упоминает, что инструмент разработан стартапом, который планирует сделать его бесплатным, поставив маркировку непосредственно брокерским конторам.

Спикер рассказывает о включении методов управления рисками и капиталом в стратегию после тестирования на истории. Простые меры тейк-профита и стоп-лосса обсуждаются как способы уменьшения просадок и защиты от рисков снижения. Чтобы защититься от подгонки кривой, спикер подчеркивает использование широкого выбора бинов, тестирования вне выборки и демо-счетов перед запуском. Также упоминается предпочтение простоты и прозрачности по сравнению с нейронными сетями черного ящика в торговых стратегиях.

Во время презентации спикер отвечает на вопросы, касающиеся сравнения их платформы с другими, такими как Quanto Pian или Quanto Connect, подчеркивая, что их платформа больше ориентирована на поиск и анализ стратегий, чем на автоматизацию существующих стратегий. Признается важность технических данных в автоматизированных стратегиях, а также отмечается, что их платформа включает в себя другие наборы данных, такие как индикаторы настроений. MetaTrader 4 демонстрируется как полезный инструмент, и обсуждается значение стратегий управления рисками и капиталом в торговле. Спикер также рассказывает о лучших практиках и распространенных ошибках в стратегиях автоматической торговли.

Докладчик обсуждает использование индикаторов в торговых стратегиях, подчеркивая компромисс между сложностью и переоснащением. Они рекомендуют использовать от трех до пяти индикаторов на стратегию, чтобы найти баланс между достаточным количеством информации и избеганием переобучения. Подчеркивается важность данных или функций, введенных в алгоритм, и то, как реализуются выходные данные. Лежащий в основе алгоритм считается менее важным, чем используемые индикаторы и их реализация. Также рассматриваются вопросы об использовании генетического оптимизатора в MetaTrader 4 и важности согласования индикаторов с платформой.

Спикер исследует применение машинного обучения в стоимостном инвестировании. Тот же процесс, который обсуждался ранее для алгоритмической торговли, может быть применен к инвестированию в стоимость, но вместо технических индикаторов используются наборы данных, которые количественно определяют неотъемлемую стоимость компании. Рыночная капитализация или соотношение цены и прибыли, например, могут выявить взаимосвязь между этими данными и движением цены актива. Также обсуждаются оптимизация прибыли на сделку и определение случаев, когда алгоритм не синхронизирован с рынком. В качестве подходящих языков программирования рекомендуются Python и R, в зависимости от опыта программирования и опыта.

Наконец, спикер выделяет основные навыки и знания, необходимые для алгоритмической торговли, которая включает слияние финансов и технологий. Понимание рынков, статистики больших данных и технологий автоматизации стратегий имеет решающее значение. Количественные образовательные программы предлагаются как средство для приобретения необходимого обучения различным операциям и навыкам, чтобы стать успешным алгоритмическим трейдером. Python рекомендуется как отличный вариант для построения алгоритмов.

  • 00:00:00 Генеральный директор и соучредитель компании по разработке торговых стратегий объясняет, почему ИИ и машинное обучение являются замечательными инструментами для алго-трейдинга и как они доказали свою эффективность крупными количественными хедж-фондами. Он также подчеркивает, что доступность этих инструментов значительно возросла благодаря библиотекам и инструментам с открытым исходным кодом, не требующим глубоких математических или компьютерных знаний. В этом разделе также рассматриваются базовая терминология и лучшие практики применения этих методов трейдерами и количественными расчетами, а также конкретные приложения для улучшения результатов торговли.

  • 00:05:00 Спикер дает определения ключевых терминов, связанных с искусственным интеллектом и машинным обучением, применительно к алгоритмической торговле. Искусственный интеллект определяется как исследование интеллектуальных агентов, которые воспринимают окружающую среду и предпринимают действия, чтобы максимизировать свои шансы на успех. Машинное обучение, подмножество ИИ, фокусируется на алгоритмах, которые могут обучаться и делать прогнозы без явного программирования. Распознавание образов — это ветвь машинного обучения, ориентированная на выявление закономерностей в данных, а изучение правил ассоциации включает форматирование этих закономерностей в операторы «если-то». Наконец, спикер кратко касается больших данных, заявляя, что они следуют четырем V: объем, скорость, разнообразие и достоверность.

  • 00:10:00 Докладчик описывает некоторые термины и концепции, которые будут обсуждаться в презентации, включая большие данные, достоверность, искусственный интеллект, машинное обучение, распознавание образов и интеллектуальный анализ данных. Затем спикер рассказывает о некоторых передовых методах и распространенных ловушках, которых следует избегать при построении алгоритмических торговых стратегий. К ним относятся определение успеха с осязаемыми целями, приоритет простоты над сложностью, сосредоточение внимания на создании надежного процесса и рабочего процесса, а не единственной модели, и наличие здоровой дозы скептицизма на протяжении всего процесса, чтобы избежать смещения в сторону положительных результатов.

  • 00:15:00 Спикер рассуждает о том, как машинное обучение может помочь решить проблему выяснения, какие индикаторы и наборы данных использовать при построении торговой стратегии. Докладчик объясняет, как можно использовать деревья решений и случайные леса для выбора индикаторов путем поиска индикаторов и значений, которые лучше всего разделяют набор данных, при этом индикаторы в верхней части дерева являются более важными и имеют более высокую связь с набором данных. . Спикер также упоминает, что случайные леса более надежны и мощны, чем деревья решений, но и более сложны. Кроме того, спикер исследует, как наборы индикаторов можно использовать вместе для создания более мощной комбинации с использованием метода, известного как обертка.

  • 00:20:00 Докладчик обсуждает использование технических индикаторов в алгоритмических торговых стратегиях и преимущества, которые они предлагают для выявления основных моделей и тенденций. Они также рассматривают вопрос о том, можно ли оптимизировать параметры индикатора на основе машинного обучения, и подчеркивают использование ансамблевого обучения для объединения нескольких классификаторов и анализа данных для поиска различных закономерностей и информации. Затем докладчик затрагивает разницу между выбором признаков и извлечением признаков в машинном обучении и признает важность учета подгонки кривой при использовании нескольких классификаторов.

  • 00:25:00 Докладчики обсуждают сочетание распознавания образов и изучения ассоциативных правил как способ использовать алгоритмы машинного обучения, сохраняя при этом возможность интерпретировать выходные данные и применять их к своим торговым стратегиям. Они представляют собой пример использования машины векторов поддержки для анализа взаимосвязи между трехпериодным RSI и разницей в цене между ценой открытия и 50-периодной SMA на австралийском долларе. На выходе были получены четкие модели, которые были преобразованы в торговые правила. Хотя этот метод позволяет трейдерам использовать собственную интуицию и опыт, он также имеет ряд недостатков, таких как трудности с анализом данных с высокой размерностью, автоматизацией и интерпретацией результатов. Торговля представлена как возможное решение, которое устраняет эти проблемы и позволяет трейдерам использовать эти алгоритмы для анализа любых индикаторов, которые они хотят.

  • 00:30:00 Ведущий демонстрирует, как строить торговые стратегии на облачной торговой платформе. В приведенном примере построена стратегия торговли австралийским долларом на дневном графике с использованием данных за последние пять лет. Чтобы избежать подгонки кривой, алгоритм обучается только до 1 января 2015 года, оставляя год данных вне выборки для тестирования стратегии, на которых он не видел ранее. Докладчик подчеркивает важность того, чтобы не тратить впустую эти данные вне выборки, чтобы избежать предвзятости в отношении выбора бэктеста, который хорошо работает на конкретном наборе данных. Использование алгоритмов машинного обучения для анализа индикаторов и поиска базовых моделей — более гибкий и мощный способ оптимизации торговых стратегий.

  • 00:35:00 Ведущий демонстрирует, как построить торговую стратегию, используя платформу Trade-Ideas и открытую библиотеку индикаторов TA Lib. Они начинают с анализа движения цены австралийского доллара за пятилетний период и определяют диапазоны, в которых алгоритм смог найти сильные сигналы. Они уточняют правила открытия длинных позиций, выбирая диапазоны индикаторов и отмечая взаимосвязь между ними. Добавив правило для цены относительно 50-периодной SMA, они могут увидеть два разных диапазона, в которых торговые алгоритмы обнаружили сильные сигналы. Преимущество использования Trade-Ideas заключается в том, что он позволяет анализировать результаты алгоритмов машинного обучения, находить самые сильные сигналы и строить правила непосредственно на гистограммах, чтобы точно увидеть, о чем говорят правила.

  • 00:40:00 Ведущий обсуждает процедуру построения коротких правил для торговой стратегии, включая выбор правильных индикаторов и уточнение правил для поиска сильного сигнала на продажу. Докладчик подчеркивает важность тестирования и изучения различных паттернов с помощью индикаторов, чтобы найти лучшую стратегию. Затем обсуждение переходит к созданию кода и тестированию стратегии вне выборки в MetaTrader4 с возможностью учета транзакционных издержек. Ведущий подтверждает, что подход представляет собой алгоритмическую торговлю.

  • 00:45:00 Ведущий объясняет, как протестировать стратегию, которую они построили, на самых последних данных вне выборки, которые не использовались в процессе построения стратегии. Моделирование выполняется на популярной торговой платформе MetaTrader для торговли валютами и акциями. Платформа имеет активное сообщество разработчиков, которые разрабатывают автоматизированные стратегии, пользовательские индикаторы и предоставляют прекрасную возможность протестировать анализ и торговать на тех же данных, которые используются для торговли. Целью моделирования является проверка эффективности стратегии на данных вне выборки. Инструмент разработан стартапом, который планирует сделать его доступным бесплатно, пометив его напрямую брокерским конторам.

  • 00:50:00 Спикер объясняет, как внедрить методы управления рисками и капиталом в стратегию после тестирования на истории. Добавление простого тейк-профита и стоп-лосса может значительно уменьшить просадку и защитить от рисков падения. Затем спикер обращается к вопросу о том, как защититься от подгонки кривой в алгоритмической торговле. Чтобы избежать переобучения, спикер делает упор на использование широкого выбора бинов, тестирование вне выборки и демо-счета перед выходом в эфир. Наконец, спикер отмечает, что их личное предпочтение — простота и прозрачность, а не нейронные сети «черный ящик» для торговых стратегий.

  • 00:55:00 Спикер отвечает на вопросы о том, как их платформа сравнивается с другими, такими как Quanto Pian или Quanto Connect, которые больше сосредоточены на автоматизации существующих стратегий, тогда как их платформа больше ориентирована на обнаружение и анализ стратегий. Они также обсудили важность технических данных в автоматизированных стратегиях, но подчеркнули, что их платформа также включает в себя другие наборы данных, такие как сентиментальные индикаторы. Кроме того, спикер продемонстрировал использование MetaTrader 4 и рассказал о важности стратегий управления рисками и капиталом в трейдинге. Наконец, спикер обсудил лучшие практики и распространенные ошибки в стратегиях автоматической торговли.

  • 01:00:00 Спикер обсуждает использование индикаторов в торговых стратегиях и компромисс между сложностью и переоснащением. Они рекомендуют использовать от трех до пяти индикаторов для каждой стратегии, чтобы найти баланс между содержанием большого количества информации и переоснащением. Спикер также обсуждает важность данных или признаков, которые вводятся в алгоритм, и то, как реализуется результат. Они подчеркивают, что речь идет не столько о базовом алгоритме, сколько об используемых индикаторах и их реализации. Спикер также затронул вопросы об использовании генетического оптимизатора в Metatrader4 и важности использования тех же индикаторов, что и на платформе.

  • 01:05:00 Спикер обсуждает использование машинного обучения для стоимостного инвестирования. Тот же процесс, который ранее обсуждался для алгоритмической торговли, может быть использован для инвестирования в стоимость, но вместо технических индикаторов инвесторы будут использовать наборы данных, которые важны для количественной оценки внутренней стоимости компании. Например, инвестор может использовать рыночную капитализацию или соотношение цены и прибыли, чтобы увидеть взаимосвязь между этими данными и изменением цены базового актива. Спикер также обсуждает способы оптимизации прибыли на сделку и как узнать, когда алгоритм не синхронизирован с рынком. Наконец, спикер обсуждает простоту изучения Metatrader и упоминает, что и Python, и R имеют отличные библиотеки для машинного обучения, в зависимости от опыта и знаний в области кодирования.

  • 01:10:00 Спикер рассказывает о необходимых навыках и знаниях, необходимых для алгоритмической торговли, которая предполагает слияние финансов и технологий. Чтобы разрабатывать успешные торговые стратегии, необходимо понимать рынки, статистику больших данных и технологии для автоматизации стратегий. Количественные образовательные программы могут обеспечить обучение различным операциям и навыкам, необходимым для того, чтобы стать успешным алгоритмическим трейдером. Python также рекомендуется как отличный вариант для тех, кто хочет создавать свои алгоритмы.
 

[ВЕБИНАР] Изменение представлений об управлении рисками на текущих рынках



[ВЕБИНАР] Изменение представлений об управлении рисками на текущих рынках

В этом видео г-н Раджиб Бора, директор и преподаватель QuantInsti, рассказывает о нескольких основных проблемах надзора за рисками в алгоритмической торговле, таких как:

  • Как Knight Capital потеряла 460 долларов за 45 минут?
  • Почему Deutsche Bank был вынужден закрыть свой отдел алгоритмической торговли в Токио?
  • Что пошло не так в Infinium Capital при торговле необработанными ETF и почему они были оштрафованы на 850 000 долларов?
  • Какая ошибка привела к тому, что HanMag Securities of Korea потеряла 57 миллиардов корейских вон за несколько минут?
 

Две сигмы представляют глубокое обучение для последовательностей в количественных финансах Дэвид Кригман


Две сигмы представляют глубокое обучение для последовательностей в количественных финансах Дэвид Кригман

Во время презентации спикер представляет мероприятие и предоставляет справочную информацию о Two Sigma, известной финансовой компании, которая применяет научные методы в области финансов. Они подчеркивают, что Two Sigma работает с несколькими предприятиями финансового сектора, включая количественные хедж-фонды, брокерско-дилерские услуги, частные инвестиции, страхование и решения для инвесторов. Спикер подчеркивает разнообразие опыта среди аудитории, указывая, что лекция будет рассчитана на людей с любым уровнем знаний, демонстрируя, как глубокое обучение может эффективно применяться в количественных финансах. Примечательно, что они упоминают, что в компании «Две сигмы» работает около 1600 специалистов по всему миру, из них 600 имеют ученые степени и более 200 имеют докторскую степень.

Двигаясь дальше, спикер представляет концепцию глубокого обучения для последовательностей и иллюстрирует ее влияние на различные приложения за последнее десятилетие. Они предоставляют такие примеры, как классификация настроений, распознавание видеоактивности и машинный перевод. Докладчик объясняет, что задачи обработки последовательности включают в себя получение последовательностей в качестве входных данных и создание последовательностей в качестве выходных данных, которые могут различаться по длине. В частности, они обсуждают применение глубокого обучения для прогнозирования стоимости фондового рынка с использованием исторических последовательностей. Спикер подчеркивает важность прогнозирования как высоких, так и низких точек для максимизации прибыльности.

Затем спикер углубляется в типичный количественный инвестиционный пайплайн в финансах, который включает в себя последовательность процессов, связанных с принятием инвестиционных решений. Они описывают два ключевых этапа конвейера: альфа-моделирование и извлечение признаков. Альфа-моделирование включает прогнозирование направления цен на акции с использованием моделей возврата к среднему или импульсных моделей. Извлечение характеристик фокусируется на извлечении технических характеристик рынка, таких как цена, объем и спред между спросом и предложением. Спикер подчеркивает, что эти процессы в конечном итоге приводят к принятию решений о покупке или продаже на рынках с конечной целью получения прибыли и минимизации убытков. Они подчеркивают важность избегать эмоционального принятия решений и подчеркивают важность диверсификации портфелей в сфере финансов.

Затем на сцену выходит Дэвид Кригман из компании «Две сигмы», чтобы обсудить факторы, играющие решающую роль в принятии обоснованных решений при торговле акциями. Первый выделенный фактор — это сбор фундаментальных данных, которые можно получить из прямых отчетов компаний или вывести из общедоступной информации. Кроме того, анализ настроений можно проводить путем интерпретации неструктурированных данных, полученных из таких источников, как новости, социальные сети и комментарии аналитиков. Докладчик представляет идею использования нетрадиционных источников, таких как количество автомобилей на стоянке или скопление контейнеровозов в гавани, для сбора информации, которая может указывать на производительность конкретного запаса. Следующим шагом после использования альфа-модели для прогнозирования динамики акций является оптимизация портфеля. Этот шаг часто влечет за собой решение крупномасштабных задач оптимизации и рассмотрение таких факторов, как текущие запасы акций, уверенность в прогнозах, требования диверсификации и связанные с этим торговые издержки. Наконец, этап выполнения включает в себя принятие решений о размере, размещении и типе ордера с помощью модели, позволяющей понять потенциальное влияние этих действий.

Возвращаясь к теме глубокого обучения, спикер подчеркивает последовательный характер конвейера принятия решений в области количественных финансов. Затем они переключают внимание на глубокое обучение, описывая его как тип нейронной сети, характеризующийся несколькими слоями. Докладчик обсуждает значительные изменения в нейронных сетях с момента их первоначального появления в 1950-х годах, в том числе появление новых сетевых архитектур, доступность массивных обучающих наборов данных и достижения в области параллельных вычислений. Чтобы проиллюстрировать основную идею одного персептрона, спикер объясняет, как он принимает входные данные, вычисляет взвешенную сумму и передает результат через нелинейную функцию. Они упоминают, что традиционная функция активации, порог, была заменена альтернативой, называемой выпрямленной линейной единицей (ReLU), которая выводит ноль для значений ниже порога и фактическое значение для более высоких значений.

Продолжая тему нейронных сетей, спикер вводит понятие многослойного персептрона. В этой архитектуре каждый круг представляет собой персептрон со своей функцией активации и набором весов. Это может быть представлено парой весовых матриц, что позволяет создавать более крупные сети. Далее спикер обсуждает применение нейронных сетей для альфа-моделирования, в частности, для прогнозирования цен на акции на основе исторических показателей. Сеть обучается с использованием набора обучающих данных, который включает в себя как функции, так и данные о ценах, с целью оптимизации минимизировать общие потери. Этот процесс обучения включает в себя различные методы, такие как обратное распространение ошибки и стохастический градиентный спуск.

Чтобы еще больше улучшить альфа-модель, спикер объясняет важность включения нескольких функций, а не полагаться на один сигнал, такой как цена или прошлая история. Комбинируя все соответствующие функции, можно создать более мощную и точную модель. Однако использование полносвязной сети с таким подходом может привести к проблеме, известной как проклятие размерности, поскольку количество весов становится чрезвычайно большим, и не все из них можно эффективно обучить. Чтобы преодолеть эту проблему, спикер представляет другой класс сетей обработки последовательностей, называемых рекуррентными нейронными сетями (RNN). Эти сети вводят аспект памяти и передают информацию в обратном направлении, создавая состояние с каждым моментом времени. В результате проблема наличия избыточного количества весов смягчается. В RNN веса распределяются между каждым элементом, что делает сеть более глубокой и обеспечивает гибкое решение.

Докладчик подчеркивает трудности обучения глубоких сетей и то, как закрытые сети, такие как закрытые рекуррентные единицы (GRU) и сети с долговременной кратковременной памятью (LSTM), решают эти проблемы. Сети со шлюзами включают в себя аналоговые вентили, которые контролируют поток информации и позволяют обновлять предыдущие состояния потенциальными новыми состояниями. Компоненты этих сетей дифференцируемы, что позволяет обучать их с помощью обратного распространения ошибки. По сравнению с LSTM, GRU имеют больший объем памяти.

Обсуждая различные архитектуры, используемые в глубоком обучении для последовательностей, спикер представляет сети LSTM и GRU, а также более поздние разработки, такие как сверточные нейронные сети (CNN), механизмы внимания и преобразователи. Они также касаются обучения с подкреплением, которое оптимизирует последовательные процессы принятия решений, подобные тем, которые связаны с торговлей и рыночными взаимодействиями. В то время как обучение с подкреплением показало успех в играх, для его применения в финансах требуются подходящие симуляторы, надежная программная инфраструктура и значительные вычислительные ресурсы. В целом докладчик подчеркивает, что различные обсуждаемые архитектуры и модели представляют собой мощные инструменты количественного финансирования, каждая из которых имеет свои преимущества и проблемы.

Возвращаясь к вкладу Дэвида Кригмана, он проливает свет на конвейер, используемый в количественных финансах, и на то, как можно обучить глубокие нейронные сети для реализации различных его частей. Он рассказывает об обширных операциях Two Sigma, которые включают в себя торговлю тысячами акций и принятие сотен миллионов решений каждый день. Для обработки таких огромных объемов данных требуются значительные вычислительные мощности, надежная программная инфраструктура и команда творческих людей. Отвечая на опасения по поводу отсутствия объяснимости и интерпретируемости, связанных с глубокими нейронными сетями и их влиянием на разработку стратегии, Кригман объясняет, что некоторые архитектуры могут вводить интерпретируемые представления. Он также подчеркивает, что в быстро меняющихся торговых сценариях требуются разные распределения. Кроме того, в Two Sigma участвуют трейдеры-люди, которые отслеживают и внедряют системы во время экстремальных рыночных событий.

Спикер обсуждает, как подходы глубокого обучения могут взаимодействовать с гипотезой эффективного рынка в количественных финансах. В то время как рынок обычно считается эффективным, глубокое обучение может способствовать более быстрому реагированию на информацию и предлагать альтернативные методы усвоения данных, потенциально выявляя неэффективность и инвестиционные возможности. Они также подчеркивают актуальность методов компьютерного зрения для последовательного моделирования в сфере финансов, особенно на начальных этапах извлечения признаков из неструктурированных данных. Две сигмы активно ищут людей для инженерных и модельных ролей, и хотя разные роли совпадают с разными командами, применение глубокого обучения пронизывает всю организацию. Недавним выпускникам колледжей и кандидатам на получение степени магистра предлагается подать заявку через веб-сайт Two Sigma.

Во время сессии вопросов и ответов спикер затронул несколько проблем, связанных с применением глубокого обучения к количественным финансам. Одной из основных проблем является отсутствие стационарности в финансовых временных рядах, поскольку модели глубокого обучения работают лучше всего, когда будущее напоминает прошлое. Чтобы решить эту проблему, спикер подчеркивает важность моделирования и прогнозирования для внедрения методов переноса домена, позволяющих моделям адаптироваться к изменяющимся рыночным условиям. Кроме того, спикер отмечает, что уровень ошибок в количественных финансах, как правило, выше по сравнению с другими областями, и даже чуть выше 50% может обеспечить значительное преимущество в торговле.

Отвечая на вопрос о многообещающих последствиях для количественных финансов, спикер упоминает, что почти каждая область исследований в области глубокого обучения и нейронных сетей имеет многообещающие последствия. Они особо выделяют обучение с подкреплением и передачу предметной области в качестве областей, представляющих интерес. Кроме того, они признают проблемы с хранением данных в финансах и предполагают, что методы сжатия данных могут быть полезны для решения этих проблем.

Расширяя тему команды инженеров, ответственной за внедрение моделей глубокого обучения в количественных финансах, спикер объясняет, что команда работает над различными задачами, включая управление хранением, физические системы и уровни, построенные поверх этих систем. Они подчеркивают, что как модели глубокого обучения, так и статистическое моделирование играют свою роль в зависимости от конкретного варианта использования. Однако они отмечают, что если глубокая модель сводится к вырожденной форме линейной регрессии, она теряет свой внутренний интерес и силу.

В презентации подчеркивается применение глубокого обучения в количественных финансах, особенно в контексте последовательной обработки и конвейеров принятия решений. В нем освещаются проблемы и возможности, возникающие при использовании глубоких нейронных сетей в этой области, включая необходимость интерпретируемости, устранение нестационарности и использование различных архитектур. На протяжении всей презентации Two Sigma представлена как известная компания, активно внедряющая методы глубокого обучения в свою деятельность и активно ищущая талантливых людей для присоединения к своей команде.

  • 00:00:00 Спикер представляет мероприятие и рассказывает о компании Two Sigma, занимающейся финансовыми науками, которая применяет научные методы к финансам. Они объясняют, что компания работает в различных сферах финансового сектора, включая количественные хедж-фонды, брокерско-дилерские услуги, частные инвестиции, страхование и решения для инвесторов. Они также говорят о разнообразии опыта среди аудитории и подчеркивают, что их лекция предоставит некоторые идеи на каждом уровне о том, как глубокое обучение можно применять в количественных финансах. Наконец, они упоминают, что в Two Sigma по всему миру работает 1600 человек, из них 600 имеют ученые степени и более 200 имеют докторскую степень.

  • 00:05:00 Докладчик представляет концепцию глубокого обучения для последовательностей и то, как оно повлияло на различные приложения за последнее десятилетие, такие как классификация настроений, распознавание видеоактивности и машинный перевод. Он объясняет, что задачи обработки последовательности принимают последовательности в качестве входных данных и производят последовательности в качестве выходных, которые могут быть одинаковой или разной длины. Спикер также рассказывает о прогнозировании стоимости фондового рынка с использованием прошлых последовательностей и подчеркивает важность прогнозирования как высоких, так и низких точек, чтобы заработать больше денег.

  • 00:10:00 Докладчик объясняет типичный процесс количественного инвестирования в финансах, включающий последовательность процессов для принятия инвестиционных решений. Это включает в себя альфа-моделирование, которое предсказывает направление цен акций с помощью моделей возврата к среднему или импульсных моделей, а также извлечение признаков, которое включает в себя такие технические характеристики, как цена, объем и спред между спросом и предложением. Воронка в конечном итоге приводит к решениям о покупке или продаже на рынках с целью не потерять деньги и получить прибыль. Спикер подчеркивает важность избегания принятия эмоциональных решений и диверсификации портфелей в финансах.

  • 00:15:00 Дэвид Кригман из Two Sigma представляет различные факторы, которые следует учитывать при принятии решений в торговле акциями. Первый заключается в сборе фундаментальных данных, которые могут быть предоставлены компанией напрямую или получены на основе общедоступной информации. Кроме того, анализ настроений может быть выполнен путем интерпретации неструктурированных данных из таких источников, как новости, социальные сети и комментарии аналитиков. Нетрадиционные источники, такие как количество автомобилей на стоянке или резервные контейнеровозы в гавани, также могут предоставить информацию о том, как будет работать конкретный запас. Следующим шагом после использования альфа-модели для прогнозирования динамики акций является оптимизация портфеля. Это часто решается с помощью крупномасштабных задач оптимизации и требует определения того, сколько запасов уже имеется, уверенности в прогнозах, насколько должны быть диверсифицированы инвестиции и затрат, связанных с совершением сделок. Наконец, выполнение — это последний шаг, на котором принимаются решения о размере, размещении и типе ордера, а модель используется для понимания влияния предпринятых действий.

  • 00:20:00 Докладчик представляет конвейер принятия решений о покупке и продаже в количественных финансах, включая извлечение признаков, альфа-моделирование и выполнение, и подчеркивает последовательный характер процесса. Затем акцент смещается на глубокое обучение, которое представляет собой тип нейронной сети, характеризующийся большим количеством слоев. Докладчик объясняет ключевые изменения, которые произошли с момента первого появления нейронных сетей в 1950-х годах, такие как новые сетевые архитектуры, огромные объемы обучающих данных и массовые параллельные вычисления. Затем спикер иллюстрирует основную идею единого персептрона, который принимает входные данные и вычисляет взвешенную сумму перед передачей результата через нелинейную функцию. Традиционная функция активации была пороговой, но была заменена альтернативной, называемой выпрямленной линейной единицей (ReLU), которая выводит ноль для значений, меньших порога, и фактическое значение в противном случае.

  • 00:25:00 Докладчик знакомит с концепцией многослойного персептрона, в котором каждый круг представляет собой персептрон со своей функцией активации и набором весов. Это может быть представлено парой весовых матриц, что позволяет создавать более крупные сети. Далее спикер обсуждает использование нейронной сети для альфа-моделирования для прогнозирования цены акции на основе ее прошлых результатов. Сеть обучается с использованием набора обучающих данных, который включает в себя функции и данные о ценах, с целью оптимизации минимизировать общие потери. Это достигается с помощью набора методов обучения, таких как обратное распространение ошибки и стохастический градиентный спуск.

  • 00:30:00 Спикер обсуждает, как построить альфа-модель, используя несколько признаков вместо одного сигнала, такого как цена или предыстория. Взяв все соответствующие функции и объединив их, можно создать более мощную модель. Однако использование полносвязной сети с таким подходом создает проблему, поскольку количество весов может быть очень большим, и не все из них можно обучить. Чтобы решить эту проблему, спикер вводит еще один класс сетей обработки последовательностей, известных как рекуррентные нейронные сети. Эти сети вводят аспект памяти и передают информацию в обратном направлении, создавая состояние с каждым моментом времени и, следовательно, смягчая проблему слишком большого количества весов. Веса в этих сетях распределяются между каждым элементом, что делает эту сеть глубокой и обеспечивает гибкое решение.

  • 00:35:00 Докладчик обсуждает трудности обучения глубоких сетей и то, как закрытые сети, такие как GRU и LSTM, могут решить эти проблемы, позволяя информации распространяться дальше во времени. В закрытых сетях используются аналоговые вентили, чтобы контролировать количество информации, проходящей через них, и обновлять предыдущее состояние потенциальным новым состоянием. Компоненты вентилируемых сетей дифференцируемы и, следовательно, поддаются обучению с помощью обратного распространения ошибки. GRU имеют большую память по сравнению с LSTM, что означает долговременную кратковременную память.

  • 00:40:00 Спикер обсуждает различные архитектуры, используемые в глубоком обучении для последовательностей, включая сети LSTM и GRU, а также более свежие разработки, такие как сверточные нейронные сети, механизмы внимания и преобразователи. Они также вводят обучение с подкреплением, которое оптимизирует последовательные процессы принятия решений, например, связанные с торговлей и взаимодействием с рынком. В то время как обучение с подкреплением было успешным в играх, его применение в финансах требует хорошего симулятора, программной инфраструктуры и большого количества вычислений. В целом, различные рассмотренные архитектуры и модели представляют собой мощные инструменты количественного финансирования, каждая из которых имеет свои преимущества и проблемы.

  • 00:45:00 Дэвид Кригман обсуждает конвейер, используемый в количественных финансах, и то, как можно обучить глубокие нейронные сети для реализации его частей. Он упоминает, что Two Sigma работает в больших масштабах, торгуя тысячами акций и принимая сотни миллионов решений в день. Для обработки такого объема данных им требуется много вычислений, хорошая программная инфраструктура и творческие люди. На вопрос об отсутствии объяснимости и интерпретируемости, связанных с глубокими сетями, и о том, как это влияет на разработку стратегии, Кригман объясняет, что некоторые архитектуры могут вводить интерпретируемые представления, а некоторые торговые решения принимаются быстро и требуют различных распределений. Кроме того, у Two Sigma есть трейдеры-люди, которые отслеживают и внедряют системы в экстремальных рыночных условиях.

  • 00:50:00 Спикер обсудил, как подходы глубокого обучения могут взаимодействовать с гипотезой об эффективном рынке в количественных финансах. В то время как рынок в целом эффективен, глубокое обучение может помочь быстрее реагировать на информацию и усваивать ее по-другому, потенциально выявляя неэффективность и возможности для инвестиций. Существуют также аспекты компьютерного зрения, которые могут иметь отношение к последовательному моделированию в финансах, особенно на ранних этапах извлечения признаков из неструктурированной информации. Две сигмы активно набирают сотрудников как на инженерные, так и на моделирующие должности, и хотя разные роли связаны с разными командами, глубокое обучение находит определенное применение во всей организации. Недавним выпускникам колледжей и кандидатам на получение степени магистра рекомендуется подавать заявки через веб-сайт Two Sigma.

  • 00:55:00 Спикер отвечает на вопросы о проблемах применения глубокого обучения к количественным финансам. В частности, отсутствие стационарности в финансовых временных рядах создает проблему для глубокого обучения, которое лучше всего работает, когда будущее очень похоже на прошлое. Чтобы решить эту проблему, решающее значение имеет степень, в которой можно моделировать, прогнозировать и внедрять методы передачи домена. Кроме того, спикер отмечает, что уровень ошибок в этой области выше, чем у большинства, а показатель выше 50% может дать преимущество в торговле. Отвечая на вопрос о многообещающих последствиях для количественных финансов, спикер упоминает, что почти каждая область исследований в области глубокого обучения и нейронных сетей имеет многообещающие последствия, в частности, обучение с подкреплением и передача предметной области. Наконец, существуют проблемы с хранением данных, которые необходимо решить, и в этом процессе полезны методы сжатия данных.

  • 01:00:00 Спикер объясняет разнообразный характер команды инженеров, ответственной за выполнение моделей глубокого обучения для количественных финансов. Команда работает над различными задачами, включая хранение, физические системы и уровни, лежащие поверх этих физических систем. Кроме того, когда речь идет о моделях глубокого обучения и статистическом моделировании, у обеих есть роли, которые зависят от использования, и если глубокая модель превращается в вырожденную форму линейной регрессии, она перестает быть интересной.
 

Two Sigma представляет: модели машинного обучения финансовых данных


Two sigma представляет: модели машинного обучения финансовых данных

Джастин Чериано из Two Sigma Securities представляет всеобъемлющую презентацию об интеграции моделей машинного обучения в области финансов. Он начинает с того, что подчеркивает растущий интерес финансовых компаний к использованию машинного обучения для расширения своих возможностей прогнозирования и процессов принятия решений. В частности, алгоритмы машинного обучения можно использовать для прогнозирования будущих цен на финансовые инструменты и определения оптимальных торговых стратегий.

Чериано вводит концепцию обучения с подкреплением, которая относится к классу методов, способных изучать политику принятия решений непосредственно на основе доступных данных, чтобы максимизировать соответствующую целевую функцию. Обучение с подкреплением оказывается особенно ценным в финансах, где целью является оптимизация результатов на основе исторических данных.

Одним из обсуждаемых фундаментальных аспектов является применение моделей машинного обучения для анализа книг лимитных ордеров на электронных рынках. В этой системе покупатели и продавцы подают заявки, указывая цены, по которым они готовы купить или продать конкретный актив. Затем эти ордера сопоставляются на основе наилучшей доступной цены спроса или предложения. Чериано подчеркивает, что данные книги заказов, которые представляют видимый спрос и предложение на акции, образуют многомерную последовательность, которую можно эффективно использовать для прогнозирования будущих изменений цен с использованием моделей машинного обучения.

Более того, Чериано подчеркивает важность учета ненулевых спредов в торговых стратегиях. Эти спреды могут повлиять на прибыльность ценовых прогнозов, что требует тщательной оценки и корректировки.

Чтобы продемонстрировать практическое применение моделей машинного обучения, Сериано объясняет построение рекуррентной нейронной сети, предназначенной для прогнозирования изменений цен с использованием высокочастотных финансовых данных. Модель обучена прогнозировать, будет ли следующее изменение цены положительным или отрицательным, и ее производительность сравнивается с линейной рекуррентной моделью. Используемый набор данных состоит из высокочастотных данных о каждом событии за три года примерно по 1000 акций. Цель состоит в том, чтобы оценить, превосходят ли нелинейные модели машинного обучения, такие как рекуррентные сети, линейные статистические модели в улавливании нелинейных отношений в данных. Оптимизация прогнозов моделей достигается за счет алгоритма обратного распространения ошибки, сводящего к минимуму ошибку прогнозирования. Для уменьшения вычислительных затрат используется алгоритм усеченного обратного распространения во времени.

В презентации рассматриваются проблемы, связанные с оптимизацией рекуррентных сетей, в частности известная проблема исчезающего градиента. Проблема исчезающего градиента относится к проблеме, когда градиенты становятся чрезвычайно малыми по мере их распространения через нижние слои сети. Следовательно, это может снизить скорость обучения и затруднить сохранение в сети информации из удаленных частей последовательности. Ceriano представляет сеть Long Short-Term Memory (LSTM), один из самых популярных типов рекуррентных сетей, который был специально разработан для решения этой проблемы путем эффективного обновления состояния памяти, что позволяет модели сохранять релевантную информацию издалека. прошлое.

Презентация переходит к обсуждению обучения и оценки моделей машинного обучения с использованием высокочастотных данных книги заказов. Авторы сравнивают точность линейной модели с точностью рекуррентной сети LSTM, и результаты ясно указывают на превосходную производительность модели глубокого обучения при тестировании примерно на 500 акциях в течение трехмесячного периода вне выборки. Обсуждение также углубляется в универсальный характер взаимосвязи между данными книги заказов и движением цен, предполагая существование универсальной модели ценообразования, применимой к нескольким акциям. Этот вывод имеет важные практические последствия, такие как снижение вычислительных затрат и возможность улучшить модель для одной акции, используя данные из другой.

Эксперимент направлен на обучение универсальной модели путем объединения данных по многочисленным акциям и оценки ее точности по сравнению с моделями для конкретных акций. Результаты постоянно демонстрируют превосходство универсальной модели, указывая на общую универсальность в динамике портфеля заказов по разным акциям. Это не только уменьшает переобучение, но и повышает точность модели. Кроме того, универсальная модель демонстрирует стабильность более года и масштабируемость с помощью высокопроизводительных вычислений, использующих 25 графических процессоров с асинхронным стохастическим градиентным спуском.

В презентации также рассматривается применение обучения с подкреплением для оптимизации стратегий подачи заказов для оптимального выполнения. Основное внимание уделяется разработке политики для рыночных ордеров или ограниченных ордеров на одну акцию с целью максимизации ожидаемого вознаграждения и экономии затрат в течение дискретных интервалов времени. Используя исторические данные книги заказов, модель обучения с подкреплением обучается моделировать цены исполнения для небольших заказов. Модель определяет, следует ли отправить рыночный ордер немедленно или дождаться снижения наилучшей цены предложения, используя в качестве входных данных данные книги лимитных ордеров. Производительность модели оценивается с использованием данных за один год, а затем проверяется на отдельном наборе данных за шесть месяцев.

Представлены результаты моделирования по совокупности 100 акций с учетом временных горизонтов 10 и 60 секунд как для стратегии обучения с подкреплением, основанной только на рыночных ордерах, так и для простой стратегии лимитных ордеров. Результаты постоянно указывают на положительную экономию средств, достигнутую за счет модели обучения с подкреплением в 50 акциях, хотя и с некоторой изменчивостью. Кроме того, экономия средств имеет тенденцию к увеличению с увеличением временных горизонтов. В презентации представлена концепция использования исторических данных книги ордеров для имитации того, будет ли отправленный лимитный ордер исполнен в течение определенного интервала времени. Модель обучения с подкреплением обучена динамически выбирать оптимальное время для максимизации ожидаемой экономии средств. В то время как экономия средств варьируется в зависимости от разных акций, стратегия обучения с подкреплением постоянно дает положительные результаты, причем некоторые акции демонстрируют значительно более высокую экономию затрат, чем другие.

Презентация завершается рассмотрением необходимости разработки передовых методов оптимизации и архитектур глубокого обучения, специально предназначенных для финансовых данных. В нем подчеркиваются текущие проблемы, связанные с объединением обучения с подкреплением с точным моделированием для более крупных заказов, чтобы еще больше расширить применение машинного обучения в финансах. Чтобы эффективно понять обсуждаемые концепции, Чериано рекомендует получить практический опыт, применяя методы машинного обучения на крупномасштабных наборах данных. Он подчеркивает важность понимания базовой математической теории и владения библиотеками глубокого обучения, такими как TensorFlow и PyTorch. Кроме того, особое внимание уделяется навыкам высокопроизводительных вычислений для распараллеливания обучения моделей.

Кроме того, докладчики обсуждают политику найма Two Sigma и возможности удаленной работы. Хотя политика удаленной работы на полный рабочий день отсутствует, Two Sigma нанимает людей из разных стран мира и управляет онлайн-командой Alpha Studio для удаленной работы. Они подчеркивают важность приобретения знаний в области количественных финансов, вероятности и статистики с помощью нескольких курсов для тех, кто заинтересован в машинном обучении в области финансов. В презентации также упоминается использование библиотек глубокого обучения, таких как TensorFlow и PyTorch, в кодовой базе Two Sigma.

Обсуждается процесс найма в Two Sigma, при этом особое внимание уделяется набору персонала в течение всего года, особенно летом. Исключения делаются для осеннего и весеннего найма, и компания призывает заинтересованных лиц начинать как можно раньше, даже если это означает начало в декабре. Выступающие предполагают, что впечатляющие проекты включают выявление закономерностей и тенденций в реальных данных и применение подходов машинного обучения для решения реальных проблем. Принадлежность к проекту и подчеркивание своего вклада в проект подчеркиваются как ценные качества, к которым стремятся рекрутеры. Также кратко упоминается группа фундаментальных исследований капитала компании Two Sigma, которая тесно сотрудничает с инженерами и специалистами по данным.

Проясняется различие между специалистом по данным и исследователем квантов в Two Sigma. В то время как обе позиции связаны с моделированием и торговлей, наука о данных фокусируется в первую очередь на аспекте науки о данных и разработке функций, тогда как исследователи квантов рассматривают весь процесс торговли от начала до конца. Выступающие затрагивают офисную культуру и встречи в Two Sigma, описывая встречи как преимущественно неформальные и предлагая доски для совместных дискуссий. Иногда для конкретных совещаний требуются подготовленные презентации.

Наконец, подчеркиваются преимущества использования универсальной модели по сравнению с моделями для конкретных акций. В качестве ключевого преимущества подчеркивается способность универсальной модели использовать трансферное обучение и смягчать проблемы переобучения. Презентация завершается упоминанием о том, что запись сеанса будет доступна на канале Two Sigma на YouTube, и освещает глобальную практику найма компании, при этом большинство наймов базируется в Соединенных Штатах.

  • 00:00:00 Джастин Чериано из Two Sigma Securities представляет концепцию моделей машинного обучения в финансах. Он объясняет, почему финансовые компании заинтересованы в использовании машинного обучения для прогнозирования и принятия решений, таких как предсказание будущей цены финансового инструмента и определение оптимальной торговой стратегии. Чериано указывает, что обучение с подкреплением — это класс методов, которые могут изучать политику принятия решений непосредственно на основе данных с целью максимизации соответствующей целевой функции. В заключение он обсуждает проблемы переобучения с недостаточным количеством данных, преимущества моделей глубокого обучения и важность высокопроизводительных вычислений для обучения больших моделей на высокочастотных наборах финансовых данных.

  • 00:05:00 Представлена концепция книг лимитных ордеров на электронных рынках, когда покупатели и продавцы подают ордера по ценам, по которым они готовы покупать или продавать, и сопоставляются в соответствии с лучшей ценой спроса или предложения. Видимый спрос и предложение на акции представлены через данные книги заказов и представляют собой многомерную последовательность, используемую для прогнозирования будущих изменений цен с использованием моделей машинного обучения. Также важно учитывать ненулевые спреды в торговых стратегиях, которые могут сделать прогнозы цен менее прибыльными.

  • 00:10:00 Реализована рекуррентная нейронная сеть для прогнозирования ценовых изменений в высокочастотных финансовых данных. Модель будет предсказывать, будет ли следующее изменение цены положительным или отрицательным, и результаты будут сравниваться с линейной рекуррентной моделью. Набор данных состоит из высокочастотных данных о событиях за три года примерно по 1000 акций. Производительность модели глубокого обучения будет оцениваться, чтобы определить, могут ли нелинейные модели машинного обучения, такие как рекуррентные сети, превзойти линейные статистические модели при изучении нелинейных отношений в данных. Алгоритм обратного распространения будет использоваться для оптимизации целевой функции, чтобы минимизировать ошибку прогнозов. Алгоритм усеченного обратного распространения по времени используется для снижения вычислительных затрат.

  • 00:15:00 В видео обсуждается, как оптимизировать рекуррентные сети, что по духу похоже на оптимизацию многоуровневой сети с прямой связью. Однако проблема исчезающего градиента является хорошо известной проблемой, когда величина градиента мала по сравнению с нижними уровнями сети. Это может сделать обучение медленным, затруднить обучение сетей запоминанию данных из далекого прошлого и привести к медленной сходимости стохастического градиентного спуска. Стенограмма также представляет сеть LSTM как один из самых популярных типов рекуррентных сетей, который предназначен для эффективного обновления состояния памяти с целью помочь модели запомнить данные из далекого прошлого в последовательности.

  • 00:20:00 Авторы описывают, как они обучили серию моделей машинного обучения на высокочастотных данных книги заказов и оценили их производительность на тестовом наборе данных. Авторы сравнили точность линейной модели с рекуррентной сетью LSTM и обнаружили, что модель глубокого обучения явно превосходит линейную модель в тестовом наборе данных примерно из 500 акций за трехмесячный период тестирования вне выборки. Они исследуют вопрос о том, является ли взаимосвязь между данными книги заказов и ценовыми движениями универсальной для всех акций, или же для отдельных акций нужна собственная модель, и находят убедительные доказательства существования универсальной модели ценообразования, отображающей поток заказов на изменения цен. Они также обсуждают практические последствия этого вывода, в том числе более низкие вычислительные затраты и возможность улучшить модель для одной акции, используя данные из другой.

  • 00:25:00 Эксперимент направлен на обучение универсальной модели путем объединения данных сотен акций и сравнения ее точности с точностью моделей для конкретных акций. Результат показывает, что универсальная модель последовательно превосходит модели для конкретных акций, указывая на общую универсальность в динамике портфеля заказов различных акций. Это позволяет уменьшить переоснащение и повысить точность модели. Более того, универсальная модель способна обобщаться на новые акции, демонстрируя стабильность модели более года и масштабируемость модели с помощью высокопроизводительных вычислений с использованием 25 графических процессоров с асинхронным стохастическим градиентным спуском. Второй пример, представленный в этом разделе, — это оптимальное выполнение, когда обучение с подкреплением используется для разработки стратегий подачи заказов. Однако оптимальная политика для марковского процесса принятия решений является сложной задачей из-за неизвестной вероятности перехода.

  • 00:30:00 В видео обсуждается, как можно использовать обучение с подкреплением для изучения оптимальных политик для простого примера выполнения заказа. Модель обучения с подкреплением обучена точно моделировать цену исполнения небольшого ордера с использованием исторических данных книги ордеров. Основное внимание уделяется оптимальному исполнению рыночного ордера или ограниченного ордера на одну акцию с целью максимизации ожидаемого вознаграждения и экономии затрат в каждый дискретный момент времени вплоть до временного горизонта. Модель обучения с подкреплением выбирает, следует ли отправить рыночный ордер или дождаться снижения лучшей цены предложения, при этом входными данными являются данные книги лимитных ордеров, а модель оценивается на данных за один год, а затем тестируется на данных за шесть месяцев.

  • 00:35:00 В видео представлены результаты моделирования во вселенной 100 акций с временными горизонтами 10 и 60 секунд для стратегии обучения только с подкреплением рыночного ордера и простой стратегии лимитного ордера. Результаты показывают, что модель обучения с подкреплением постоянно обеспечивает положительную экономию средств, хотя и со значительной вариабельностью, для 50 акций. Экономия средств увеличивается в целом, учитывая более длительный временной горизонт. В видео также рассказывается об использовании исторических данных книги ордеров для имитации того, будет ли отправленный лимитный ордер на одну акцию выполняться в интервале времени, и обучения модели обучения с подкреплением для адаптивного выбора времени для максимизации ожидаемой экономии затрат. Результаты показывают, что стратегия обучения с подкреплением неизменно обеспечивает положительную экономию затрат, хотя экономия затрат варьируется для некоторых акций, в то время как для других она относительно велика.

  • 00:40:00 Видео подчеркивает необходимость разработки более совершенных методов оптимизации и архитектур глубокого обучения, специально предназначенных для финансовых данных. Есть открытые проблемы, которые еще предстоит решить, такие как объединение обучения с подкреплением с точным моделированием для больших размеров заказов, чтобы применить машинное обучение к финансовым данным. Джастин рекомендует, чтобы лучший способ изучить машинное обучение — это реализовать его на крупномасштабных наборах данных и понять лежащую в его основе математическую теорию. Крайне важно иметь опыт работы с библиотеками глубокого обучения, такими как PiTorch или TensorFlow, и высокопроизводительными вычислениями для распараллеливания обучения моделей для применения машинного обучения к финансовым данным. Наконец, запись сеанса будет доступна на их канале YouTube, и Two Sigma нанимает сотрудников по всему миру, причем большинство их сотрудников находится в США.

  • 00:45:00 Представители Two Sigma рассказывают о своей политике в отношении найма и удаленной работы. Хотя у них нет политики удаленной работы на полный рабочий день, они нанимают людей из разных стран мира и имеют онлайн-команду под названием Alpha Studio для удаленной работы. Они также обсуждают важность прохождения нескольких курсов по количественным финансам, вероятности и статистике для тех, кто интересуется машинным обучением в этой области. Наконец, докладчики сообщают, что в их коде используются библиотеки глубокого обучения TensorFlow и PyTorch.

  • 00:50:00 Спикеры обсуждают процесс найма в Two Sigma и разные времена года, когда они нанимают, уделяя особое внимание лету, но также делая исключения для осени и весны. Они также упоминают, что нанимают постоянно и призывают людей начать работу как можно скорее, даже если это означает, что они начнут работать в декабре. Что касается проектов, которые могут быть интересны рекрутерам, они предлагают находить закономерности и тенденции в реальных данных и применять подходы машинного обучения к реальным проблемам, уделяя особое внимание праву собственности на проект и подчеркивая, чем владел человек в проекте, над которым он работал. на. Спикеры также упоминают группу фундаментальных исследований акций Two Sigma, которая тесно сотрудничает с инженерами компании, специалистами по данным и другими сферами бизнеса. Наконец, они решают вопрос об использовании обучения с подкреплением для оптимизации автоматических торговых операций.

  • 00:55:00 Спикер обсуждает разницу между специалистом по данным и исследователем квантов в Two Sigma. В то время как обе позиции связаны с моделированием и торговлей, наука о данных фокусируется на аспекте науки о данных и разработке функций, в то время как количественные исследования рассматривают полную картину торговли от начала до конца. Спикер также отвечает на вопрос об офисной культуре и встречах в Two Sigma, объясняя, что, хотя иногда встречаются встречи, требующие подготовленных презентаций, встречи чаще бывают случайными, когда для обсуждения доступны доски. Наконец, спикер обсуждает преимущества универсальной модели по сравнению с моделью для конкретных акций, ссылаясь на трансферное обучение и потенциальные проблемы переобучения в качестве причин, по которым одна универсальная модель, обученная на комбинированном наборе данных, может превзойти специализированные модели.
 

ключи к успеху в алгоритмической торговле | Подкаст | Доктор Э.П. Чан


ключи к успеху в алгоритмической торговле | Подкаст | Доктор Э.П. Чан

Количественный трейдинг или трейдинг в целом считается одной из самых сложных профессий для достижения успеха. Доктор Д. Э. Шоу, пионер количественного трейдинга и основатель многомиллиардного хедж-фонда в Нью-Йорке, признал, что С каждым годом эта область становится все более сложной. Это мнение разделяют многие опытные трейдеры в отрасли.

Несмотря на свою сложность, количественная торговля по-прежнему стоит того, чтобы ею занимались те, кто ею увлечен. Точно так же, как стать успешным актером, певцом, моделью или писателем-фантастом, достижение успеха в алгоритмической торговле требует самоотверженности и настойчивости. Хотя не каждый может достичь уровня известных трейдеров, таких как DE Shaw или Renaissance Technologies, начинающим трейдерам не следует отчаиваться. Важно быть готовым к неудаче, поскольку успех в этой области является исключением.

Людям, которые еще не работают в финансовой сфере, рекомендуется не увольняться с основной работы сразу после окончания учебы и запуска своей первой торговой стратегии. Рекомендуется иметь по крайней мере две прибыльные торговые стратегии, действующие в течение двух лет, прежде чем рассматривать возможность торговли на постоянной основе. Этот совет основан на личном опыте и опыте других успешных трейдеров.

Трейдеры часто совершают ошибку, чрезмерно оптимистично оценивая эффективность стратегии в прошлом, что приводит к слишком высокому кредитному плечу. Крайне важно избегать чрезмерного кредитного плеча, так как оно может быстро уничтожить средства на счете. Кроме того, эффективность стратегии обычно не продолжает развиваться в том же направлении. Распределение капитала исключительно на основе прошлых результатов является распространенной ошибкой. Вместо этого, распределение капитала по паритету риска, когда капитал распределяется обратно пропорционально волатильности стратегии, как правило, является лучшим подходом.

Еще одна распространенная ошибка — неспособность инвестировать прибыль в оборудование для обработки данных и персонал в хорошие времена. Важно реинвестировать часть прибыли для улучшения инфраструктуры данных и найма квалифицированного персонала, так как это может помочь предотвратить будущие просадки.

Положительным моментом является то, что рекомендуется начинать с простых стратегий, которые имеют интуитивное обоснование. Целесообразно понять и улучшить существующие стратегии, прежде чем углубляться в более сложные подходы, такие как рекуррентные нейронные сети или глубокое обучение. Начав с простых стратегий, трейдеры могут лучше понять причины успехов или неудач, связывая их с конкретными факторами.

В заключение, количественная торговля — сложная, но потенциально полезная профессия. Это требует настойчивости, непрерывного обучения и тщательного принятия решений. Хотя есть подводные камни, которых следует избегать, есть и ценные уроки, которые можно извлечь из опыта опытных трейдеров. Начав с простых стратегий, управляя рисками и инвестируя в инфраструктуру и персонал, начинающие трейдеры могут увеличить свои шансы на успех в области количественного трейдинга.

 

«Основы статистического арбитража: понимание математики парной торговли» Макса Маржено


«Основы статистического арбитража: понимание математики парной торговли» Макса Маржено

Добро пожаловать на встречу Quanto Peon Algorithmic Trading Meetup, посвященную изучению мира количественных финансов. Я Макс Маргит, специалист по данным в Quanto Peon, и сегодня я буду углубляться в увлекательную тему статистического арбитража и связанных с ним фундаментальных статистических концепций.

Прежде чем мы углубимся в теоретические аспекты, позвольте мне представить вам краткое введение в Quanto Peon. Наша главная цель — сделать количественные финансы доступными для всех, предлагая бесплатные инструменты с открытым исходным кодом, которые позволяют людям исследовать и разрабатывать свои собственные алгоритмические торговые стратегии. Алгоритмическая торговля включает в себя использование инструкций для автоматического совершения сделок на финансовых рынках, начиная от простых правил, таких как покупка акций Apple каждый день в 10:00, и заканчивая более сложным количественным анализом с использованием статистических моделей.

Статистический арбитраж, в центре внимания сегодняшнего обсуждения, вращается вокруг использования неэффективности рынка с использованием статистического анализа вместо того, чтобы полагаться на физические дисбалансы. Этот подход направлен на выявление и использование статистических диспропорций в ценах на активы. Чтобы лучше понять эту концепцию, важно понять некоторые фундаментальные статистические концепции.

Одной из ключевых концепций, которые мы рассмотрим, является стационарность, особенно в контексте данных временных рядов. Стационарность относится к ряду точек данных, где каждая выборка берется из одного и того же распределения вероятностей с постоянными параметрами во времени. Проще говоря, это означает, что среднее значение и стандартное отклонение данных остаются постоянными во времени. Это важно, потому что многие статистические модели, используемые в финансах, предполагают стационарность. Обеспечивая стационарность, мы можем доверять результатам, полученным с помощью этих моделей.

Чтобы проиллюстрировать концепцию стационарности, давайте создадим несколько точек данных. Я буду использовать базовую функцию под названием «generate_data_point», чтобы создать набор выборок из стандартного нормального распределения. Эти выборки представляют собой стационарный временной ряд, часто называемый белым шумом. В этом случае среднее значение равно нулю, а стандартное отклонение равно единице. Когда мы наносим эти данные на график, мы наблюдаем случайный паттерн, напоминающий белый шум.

Однако не все данные временных рядов демонстрируют стационарность. Если мы вводим тренд в среднее значение, временной ряд становится нестационарным. В финансах нестационарность может быть намного сложнее, чем этот простой пример. Описательная статистика, такая как среднее значение, становится бессмысленной для нестационарных данных, поскольку они не точно представляют весь временной ряд.

Теперь, как мы определяем, является ли временной ряд стационарным или нет? Именно здесь вступают в игру проверки гипотез, такие как расширенный тест Дики-Фуллера, обычно используемый в анализе стационарности. Этот тест помогает нам оценить вероятность нестационарности данного временного ряда.

Давайте применим расширенный тест Дики-Фуллера к нашим сгенерированным данным временных рядов. Тест обеспечивает значение p, которое указывает вероятность отклонения нулевой гипотезы о нестационарности временного ряда. В нашем первом примере, где данные были преднамеренно сгенерированы как стационарные, p-значение близко к нулю. Это позволяет нам отвергнуть нулевую гипотезу и сделать вывод, что временной ряд, вероятно, является стационарным. С другой стороны, во втором примере с введенным трендом p-значение превышает пороговое значение (0,01), и мы не можем отвергнуть нулевую гипотезу, что указывает на то, что временной ряд, вероятно, нестационарен.

Однако важно отметить, что проверка гипотез имеет ограничения. Могут возникать ложные срабатывания, особенно при работе с тонкими или сложными отношениями в финансовых данных. Поэтому важно проявлять осторожность и не полагаться исключительно на проверку гипотез для определения стационарности.

Теперь давайте переключим наше внимание на парную торговлю. Если я хочу заниматься парной торговлей, мне нужно рассмотреть несколько пар и делать независимые ставки на каждую из них. Вместо того, чтобы полагаться на одну пару, диверсификация моего портфеля путем торговли 100, 200 или даже 300 парами позволяет мне использовать любое преимущество, которое я могу иметь в каждой паре, тем самым увеличивая мои общие шансы на успех.

Для торговых пар требуется надежная структура для эффективного управления и мониторинга сделок. Это включает в себя постоянное обновление отношений между парами и соответствующую корректировку позиций. Поскольку бета-значения, которые представляют отношения между парами, могут меняться со временем, мне нужна система, которая динамически адаптируется к этим изменениям.

Кроме того, крайне важно иметь четкую стратегию выхода из каждой сделки. Я должен определить, когда закрыть позицию, если пара больше не демонстрирует ожидаемого поведения или если связь между парами нарушается. Это требует постоянного мониторинга спреда и наличия заранее определенных критериев для выхода из сделки.

Более того, управление рисками играет значительную роль в парной торговле. Очень важно тщательно рассчитать размеры позиций для каждой пары на основе таких факторов, как волатильность, корреляция и общий риск портфеля. Диверсифицируя свои сделки и эффективно управляя рисками, я могу свести к минимуму влияние неблагоприятных рыночных условий и максимизировать потенциальную прибыль.

Чтобы эффективно реализовать стратегии парной торговли, трейдеры часто полагаются на передовые количественные методы и разрабатывают сложные алгоритмы. Эти алгоритмы автоматически сканируют рынок в поисках потенциальных пар, оценивают их коинтеграцию и статистические свойства и генерируют торговые сигналы на основе заранее определенных критериев.

В заключение, понимание стационарности и проведение соответствующих тестов имеют решающее значение при построении статистических моделей для алгоритмической торговли. Понимая концепцию стационарности и используя такие тесты, как расширенный тест Дики-Фуллера, трейдеры могут оценить вероятность нестационарности данных временных рядов. Торговля парами, как стратегия статистического арбитража, позволяет трейдерам использовать временные отклонения от исторических отношений между двумя коррелирующими ценными бумагами. Однако для успешного внедрения требуются надежные основы, непрерывный мониторинг, управление рисками и использование передовых количественных методов.

В Quanto Peon мы стремимся преодолеть разрыв между финансами и технологиями, предлагая бесплатные лекции по статистике и финансам в нашей серии лекций Quanto Peon. Наша миссия состоит в том, чтобы демократизировать количественные финансы и предоставить людям инструменты и знания для разработки их стратегий алгоритмической торговли.

 

Броуновское движение для финансовой математики | Броуновское движение для квантов | Стохастическое исчисление


Броуновское движение для финансовой математики | Броуновское движение для квантов | Стохастическое исчисление

Здравствуйте, YouTube, и добро пожаловать на канал ASX Portfolio. Меня зовут Джонатан, и сегодня мы собираемся погрузиться в увлекательный мир броуновского движения, особенно в контексте финансовой математики. Это важная тема, поскольку она формирует основу стохастических процессов и стохастического исчисления, которые необходимы в области финансовой математики. Броуновское движение лежит в основе интегралов Ито и имеет большое значение, поэтому его понимание имеет первостепенное значение. В будущих видеороликах мы углубимся в изучение математики, охватив такие темы, как геометрическое броуновское движение, его приложения и интегралы Ито. Не забудьте нажать кнопку подписки, если хотите быть в курсе следующих видео.

В этом видео мы пробежимся по записной книжке Jupyter, которую я подготовил, чтобы объяснить, что такое броуновское движение и как оно возникает. Итак, давайте сразу приступим. Мы начнем с рассмотрения симметричного случайного блуждания, а затем перейдем к масштабированному случайному блужданию, демонстрируя, как они сходятся к броуновскому движению. В этом объяснении мы будем использовать обозначения и примеры из книги Стивена Шрива «Стохастическое исчисление для финансов II».

Прежде всего, важно понимать, что основные свойства броуновского движения таковы: это мартингал, то есть ожидание основано исключительно на текущем положении частицы или цене акции. Кроме того, это марковский процесс, и он накапливает квадратичные вариации. Квадратичная вариация — уникальная концепция стохастического исчисления, отличающая ее от обычного исчисления. В этом эпизоде мы углубимся в то, что влечет за собой квадратичная вариация.

Если вы хотите следовать коду, он доступен на моем веб-сайте. Я импортировал необходимые зависимости, которые нам понадобятся для этой демонстрации. Важно отметить, что броуновское движение — это стохастический процесс, и для наших целей мы будем рассматривать отфильтрованное вероятностное пространство с исходами и фильтрацию F вместе с вероятностным пространством P. Здесь у нас есть набор реальных исходов в интервале от 0 до времени Т.

Броуновское движение всегда имеет начальное значение, равное нулю. Он имеет независимые приращения, следует распределению Гаусса и почти наверняка демонстрирует непрерывные пути выборки. Мы объясним все эти свойства подробно.

Начнем с простейшего примера: симметричного случайного блуждания. Если вы не знакомы с понятием случайного блуждания, подумайте о нем как о последовательности последовательных подбрасываний монеты. Каждый результат, представленный переменной омега, может быть либо орлом, либо решкой. Мы будем использовать переменную X_j для представления каждого результата, принимая значение 1 для орла и -1 для решки.

Если мы определим процесс с m_0 равным нулю, то m_k будет суммированием по всем возможным путям подбрасывания монеты для k подбрасываний. В этом случае у нас есть случайное блуждание, в котором процесс может двигаться вверх на 1 или вниз на 1, и мы суммируем эти приращения по путям. Я написал скрипт для создания 10 примеров путей за 10-летний период времени. График демонстрирует, как случайное блуждание перемещается вверх или вниз на 1 на каждом временном шаге вдоль путей.

Этот пример раскрывает некоторые интересные свойства. Во-первых, приращения между периодами времени, такие как m_k+1 - m_k, независимы. Кроме того, математическое ожидание этих независимых приращений равно нулю, а дисперсия равна разнице во времени или расстоянию между временными шагами (k_i+1 - k_i). Дисперсия накапливается со скоростью один в единицу времени.

Кроме того, симметричное случайное блуждание является мартингалом. Это означает, что условное математическое ожидание следующего значения для текущей позиции равно текущей позиции. В контексте симметричного случайного блуждания ожидание

Продолжая с того места, где мы остановились, в следующем видео мы рассмотрим, как создавать образцы геометрического броуновского движения с помощью Python. Геометрическое броуновское движение — это стохастический процесс, обычно используемый в финансовой математике для моделирования цен на акции. Это важная концепция для понимания в этой области.

Но прежде чем мы углубимся в это, давайте вспомним некоторые ключевые свойства броуновского движения. Броуновское движение представляет собой стохастический процесс, характеризующийся рядом свойств:

  1. Независимые приращения: приращения броуновского движения независимы, что означает, что изменение между любыми двумя моментами времени не связано с изменением между любыми другими двумя точками.

  2. Распределение Гаусса: приращения броуновского движения следуют гауссовскому или нормальному распределению. Это распределение описывает вероятность различных исходов и является фундаментальным понятием теории вероятностей.

  3. Непрерывные пути выборки: Броуновское движение имеет непрерывные пути выборки, что означает, что оно не дифференцируемо в каждый период времени. Это свойство делает его пригодным для моделирования различных явлений со случайными флуктуациями.

  4. Квадратичная вариация: Квадратичная вариация — уникальное свойство броуновского движения в стохастическом исчислении. Он измеряет накопленные колебания во времени и имеет решающее значение для понимания поведения случайных процессов.

Теперь давайте обсудим геометрическое броуновское движение. Геометрическое броуновское движение является расширением броуновского движения, которое включает экспоненциальный рост. Он обычно используется для моделирования поведения финансовых активов, таких как цены акций. Геометрическое броуновское движение имеет следующий вид:

dS(t) = µS(t)dt + σS(t)dW(t)

Здесь S(t) представляет цену актива в момент времени t, μ — ожидаемая доходность или скорость дрейфа, σ — волатильность или стандартное отклонение доходности, dt — небольшой интервал времени, а dW(t) — стандартное броуновское движение. приращение.

Чтобы смоделировать геометрическое броуновское движение, мы можем дискретизировать процесс, используя численные методы, такие как метод Эйлера или интеграл Ито. Эти методы позволяют аппроксимировать непрерывный процесс с помощью последовательности дискретных шагов.

В следующем видео мы рассмотрим математические детали геометрического броуновского движения и его применения в финансовой математике. Мы также предоставим практические примеры и фрагменты кода на Python для моделирования и визуализации геометрического броуновского движения.

Если вам интересно узнать больше об этой теме, обязательно подпишитесь на наш канал и следите за обновлениями для следующего видео. Мы с нетерпением ждем возможности поделиться с вами новыми идеями. Спасибо за внимание, и до встречи в следующем видео!

 

Моделирование геометрического броуновского движения в Python | Стохастическое исчисление для квантов


Моделирование геометрического броуновского движения в Python | Стохастическое исчисление для квантов

Добрый день, YouTube, и добро пожаловать на канал портфолио ASX. Меня зовут Джонатан, и сегодня мы будем моделировать геометрическое броуновское движение в Python. В этом уроке мы не будем рассматривать вывод динамики геометрического броуновского движения или охватывать исчисление Ито, интегралы Ито и случайные процессы. Тем не менее, мы подробно рассмотрим эти темы в следующем руководстве. Если вам интересно узнать о них больше, подпишитесь на наш канал и нажмите на колокольчик, чтобы получать уведомления, когда это видео будет выпущено.

Перейдем к симуляции. Я буду использовать этот блокнот Jupyter для демонстрационных целей. Во-первых, мы определим параметры для нашей симуляции. Коэффициент дрейфа mu устанавливается равным 0,1 или 10% в течение года. Мы определим количество временных шагов как «n» и установим его равным 100 для детального моделирования. Время будет измеряться в годах, обозначаемых буквой «Т». Количество симуляций будет обозначено как «m» и установлено на 100. Начальная цена акции, S0, установлена на 100, а волатильность, сигма, установлена на 30. Давайте импортируем необходимые зависимости: numpy as np и matplotlib .pyplot как plt.

Теперь давайте смоделируем траектории геометрического броуновского движения. Чтобы вычислить шаг по времени, мы делим T на n. Далее мы будем использовать массивы numpy для выполнения моделирования за один шаг вместо повторения путей. Мы определим массив с именем «st» и используем экспоненциальную функцию numpy. Внутри функции мы определим компоненты: mu минус сигма в квадрате, деленное на 2, умноженное на dt. Затем мы умножим сигму на функцию numpy random.normal, которая выбирается из нормального распределения, и умножим ее на квадратный корень из dt. Размер этого массива будет m на n, что соответствует количеству симуляций и временных шагов соответственно. Поскольку нам нужна симуляция для каждого временного шага, мы выполним транспонирование этого массива.

Чтобы включить начальную точку для каждой симуляции, мы будем использовать функцию vstack numpy, чтобы сложить массив numpy из единиц с массивом st симуляции. Это гарантирует, что каждое моделирование начинается с начального значения. Наконец, мы умножим сложенный массив на начальное значение, чтобы учесть ежедневные изменения с точки зрения дрейфа, дисперсии и стохастической составляющей. Это даст нам реализацию шага по времени. Чтобы накапливать эти значения с течением времени, мы будем использовать функцию кумулятивного продукта numpy для каждого пути моделирования, указав ось 1. Это будет вычислять кумулятивный продукт для каждого пути.

Теперь, когда у нас есть смоделированные пути, давайте рассмотрим интервалы времени в годах. Мы будем использовать функцию linspace numpy для создания равномерно распределенных временных шагов от 0 до T с n+1 пробелами. Это даст нам массив под названием «время». Затем мы создадим массив numpy с именем «fill» той же формы, что и st, чтобы мы могли построить функцию. Мы будем использовать полную функцию numpy и установим fill_value на время. Транспонируя этот вектор, мы можем построить график с годами по оси x и ценой акции по оси y, принимая во внимание дисперсию, возникающую в результате 30-процентной волатильности и 10-процентного увеличения среднего или дрейфа за это геометрическое броуновское движение.

Геометрическое броуновское движение является полезной моделью для теории ценообразования опционов и различных приложений финансовой математики. Я надеюсь, что вы нашли ценность в этом уроке. В следующем видео мы углубимся в финансовую математику, исчисление Ито, интегралы Ито и узнаем, как повысить сложность стохастических дифференциальных уравнений, добавив различные параметры. Если вы хотите узнать больше, не забудьте подписаться на наш канал и нажать на колокольчик, чтобы получить уведомление, когда это видео будет выпущено на следующей неделе. А пока следите за более ценным контентом. Спасибо за просмотр, и увидимся в следующем видео.

 

Стохастическое исчисление для квантов | Понимание геометрического броуновского движения с использованием исчисления Ито


Стохастическое исчисление для квантов | Понимание геометрического броуновского движения с использованием исчисления Ито

Добрый день, YouTube, и добро пожаловать в ASX Portfolio. Сегодня мы обсудим, почему броуновское движение не подходит для моделирования финансовых рынков. Совершенно очевидно, что броуновское движение приведет к отрицательным ценам акций, что нереально. Вместо этого нам нужен способ сохранить некоторые стохастические свойства броуновского движения и включить их в наши модели. Этого можно добиться, используя процессы Ито, которые позволяют добавить источник риска от броуновского движения.

Одним из хорошо известных процессов Ито является геометрическое броуновское движение (GBM), с которым многие из вас, возможно, знакомы. Мы можем использовать свойства броуновского движения для разработки новых моделей, которые лучше соответствуют реальным примерам. Для этого мы используем специальный тип исчисления, известный как исчисление Ито, который обычно используется в финансовой стохастической математике.

Сегодня мы сосредоточимся на понимании интеграла Ито и на том, как он может помочь нам решать сложные задачи. Мы обсудим лемму Ито, которая служит тождеством в исчислении Ито и помогает в выводе правил. Кроме того, мы изучим формулу Ито-Добелина и вывод динамики геометрического броуновского движения.

Чтобы глубже погрузиться в эти концепции, я настоятельно рекомендую вторую книгу Стивена Шрива «Модели непрерывного времени для стохастического исчисления». Глава 4 охватывает материал, который мы будем обсуждать сегодня.

Теперь давайте начнем с понимания того, что такое интеграл Ито. Важно помнить, что вся математика, которую мы будем обсуждать, основана на фильтрованном вероятностном пространстве. Это пространство включает результаты, фильтрацию и меры вероятности. Фильтрация относится к сигма-алгебре, которая содержит всю информацию до момента времени t. Хотя теория вероятностей сложна, сегодня мы коснемся ее лишь вкратце. Для более глубокого понимания рекомендую обратиться к первым трем главам книги Шрива.

Интеграл Ито обозначается символом ∫δdW, где δ — случайный процесс, а dW — винеровский процесс. Чтобы понять его значение, давайте представим себе разделение периода времени от 0 до T на небольшие интервалы. Мы можем обозначить случайный процесс δ в степени n, где n представляет количество временных интервалов. Этот процесс адаптирован, то есть его значения определяются результатами подбрасывания монеты в каждый временной интервал.

Теперь рассмотрим интеграл как предел суммы при стремлении числа интервалов к бесконечности. Каждое слагаемое состоит из случайного процесса δ, умноженного на изменение винеровского процесса между интервалами. По мере уменьшения интервалов мы сходимся по интегралу Ито. Однако для существования этого предела необходимо выполнение двух условий: процесс δ должен быть адаптирован к фильтрации и должен быть квадратично интегрируемым.

Теперь, когда мы поняли обозначения, давайте перейдем к общим процессам Ито. Эти процессы происходят в одной и той же временной области с одним и тем же исходным пространством. Они включают основанные на времени интегралы и интегралы Ито по отношению к винеровскому процессу. Интеграл по времени аналогичен обычному интегралу Римана, а интеграл Ито отражает стохастический характер процесса. Эти процессы можно разделить на дрейфовые и диффузионные.

Примером процесса Ито является геометрическое броуновское движение (GBM). Он включает в себя дрейфовый член и диффузионный член. Дрейф определяется константой μ, а диффузия контролируется параметром летучести σ. Динамика GBM может быть выражена с помощью интегралов, как показано в уравнении.

Расширяя это, мы также можем рассмотреть интеграл процесса Ито. Например, интеграл процесса Ито может представлять торговые прибыли и убытки (P&L).

В разложении Ито-Дуба у нас есть этот общий процесс, представленный интегралом дрейфового члена, интегралом диффузионного члена и интегральным членом Ито. Теперь формула Ито-Дуба позволяет вычислить дифференциал функции процесса. В нем говорится, что дифференциал функции равен частной производной функции по времени плюс частные производные функции по переменным состояния, умноженные на члены дрейфа, плюс частные производные функции по времени к переменным состояния, умноженным на члены диффузии, плюс интеграл частных производных функции по отношению к переменным состояния, умноженный на интегральный член Ито.

Эта формула позволяет вычислить изменение значения функции по мере развития процесса во времени. Это фундаментальный инструмент исчисления Ито, который широко используется в стохастическом анализе и математических финансах.

Переходя к геометрическому броуновскому движению (GBM), это особый тип процесса Ито, который обычно используется для моделирования динамики цен на акции и другие финансовые активы. GBM включает в себя как компоненты дрейфа, так и диффузии. Термин дрейфа представляет собой ожидаемую норму прибыли на актив, а термин диффузии отражает волатильность или случайность в движении цены актива.

Динамику ГБМ можно рассчитать с помощью исчисления Ито. Применяя формулу Ито к логарифму цены актива, мы получаем выражение, описывающее изменение логарифма цены во времени. Это изменение равно члену дрейфа, умноженному на приращение времени, плюс член диффузии, умноженному на интеграл Ито. Возводя в степень обе части уравнения, мы восстанавливаем динамику цены самого актива.

Понимание динамики GBM имеет решающее значение для ценообразования опционов и управления рисками. Это позволяет нам моделировать стохастическое поведение цен на активы и оценивать вероятности различных исходов. GBM широко используется в финансовой математике и служит основой для многих моделей ценообразования, таких как модель Блэка-Шоулза для оценки опционов.

Таким образом, исчисление Ито обеспечивает мощную основу для моделирования и анализа стохастических процессов в финансах. Включив интегралы Ито и применив лемму Ито и формулу Ито-Дуба, мы можем вывести динамику различных финансовых переменных и разработать модели, учитывающие стохастические свойства реальных рынков. Исчисление Ито произвело революцию в области математических финансов и продолжает оставаться важным инструментом для понимания финансовых рисков и управления ими.

 

Стохастическое исчисление для квантов | Нейтральное к риску ценообразование для деривативов | Объяснение цены опциона


Стохастическое исчисление для квантов | Нейтральное к риску ценообразование для деривативов | Объяснение цены опциона

В этом видео мы углубимся в финансовую математику, лежащую в основе оценки производных финансовых инструментов, с использованием моделирования Монте-Карло и нейтрального к риску ценообразования. Мы ответим на такие вопросы, как, почему используется моделирование методом Монте-Карло, что такое ценообразование с нейтральным риском и почему темпы роста акций не учитываются в производной модели.

Нейтральное к риску ценообразование — это методология, в которой стоимость опциона представляет собой дисконтированное ожидание его будущих выплат. Другими словами, это ожидаемая стоимость всех возможных выплат дериватива, дисконтированная до настоящего времени. Базовый темп роста акций не влияет на цену опциона в нейтральной к риску структуре ценообразования. Это связано с тем, что дериватив и базовая акция имеют идеальную корреляцию, что позволяет воспроизводить и создавать безрисковый портфель.

Существует несколько преимуществ использования нейтрального к риску подхода к ценообразованию по сравнению с другими методами оценки. Во-первых, в случае составов сложных производных решения в закрытой форме могут оказаться невозможными. В таких случаях использование методов репликации и решение дифференциальных уравнений в частных производных (УЧП) может потребовать значительных вычислительных ресурсов. Ценообразование, нейтральное к риску, с другой стороны, позволяет легко приблизить стоимость опциона с помощью моделирования Монте-Карло, которое требует меньше вычислительных ресурсов.

Чтобы объяснить нейтральное к риску ценообразование, мы начнем с рассмотрения однопериодной биномиальной модели. В этой модели акции могут расти или падать, и стоимость опциона зависит от этих двух возможных исходов. Создав портфель из базовой акции и безрискового актива, мы можем воспроизвести выплату по опциону. Используя принцип отсутствия арбитража, стоимость опциона в нулевое время должна быть равна стоимости портфеля в нулевое время. Решая линейные уравнения, мы можем получить формулу, представляющую дисконтированное математическое ожидание в биномиальной модели.

Мы вводим понятие нейтральной к риску вероятностной меры, обозначаемой как q, которая позволяет нам перейти от физических вероятностей цены акции к нейтральным к риску вероятностям. Этот сдвиг достигается путем повторного взвешивания физических вероятностей случайной величиной, называемой производной случайного никдема. Эта производная позволяет нам перевести стоимость опциона из мира ценообразования, нейтрального к риску, в мир физической вероятности.

Цель нейтрального к риску ценообразования состоит в том, чтобы идентифицировать производный процесс случайного никдема, обозначаемый как Zt, который гарантирует, что все дисконтированные цены акций являются мартингалами при нейтральной к риску вероятностной мере q. Выполняя замену меры, мы можем преобразовать исходное броуновское движение при физической вероятностной мере в новое броуновское движение при нейтральной к риску мере вероятности. Это новое броуновское движение представляет собой мартингальный процесс, указывающий на то, что его математическое ожидание остается постоянным во времени.

Чтобы применить эти концепции, мы рассмотрим геометрическую модель броуновского движения, которая представляет динамику акций, не приносящих дивиденды. Модель состоит из детерминированного компонента и стохастического компонента, представляющего волатильность. Однако исходная динамика акций не является мартингейлом по физическим вероятностям из-за детерминированной составляющей. Чтобы сделать динамику мартингальной, мы вводим производную Радона-Никодима, которая удаляет член дрейфа и превращает динамику акции в мартингальный процесс при нейтральной к риску вероятностной мере.

Таким образом, нейтральное к риску ценообразование и моделирование по методу Монте-Карло обеспечивают ценную основу для оценки производных финансовых инструментов. Нейтральный к риску подход к ценообразованию предлагает такие преимущества, как простота, вычислительная эффективность и возможность работы со сложными производными структурами. Используя производную случайного никдема и изменив меру с физических вероятностей на нейтральные к риску вероятности, мы можем точно оценить производные и воспроизвести их выплаты без риска.