Quantitative trading - страница 7

 

Мартин Шолль (Оксфордский университет): «Изучение экологии рынка с использованием агентных моделей»



Мартин Шолль (Оксфордский университет): «Изучение экологии рынка с использованием агентных моделей»

Мартин Шолль, исследователь из Оксфордского университета, углубился в изучение экологии рынка с помощью агентных моделей. В отличие от традиционных подходов, основанных на предположениях, таких как гипотеза эффективного рынка, Шолль не согласен с теорией равновесия рациональных ожиданий, обычно используемой в неоклассических финансах. Он считает, что эта теория требует от всех участников совершенного понимания реального мира, что нереально, учитывая когнитивные ограничения как розничных инвесторов, так и управляющих фондами. Вместо этого он выступает за применение инструментов из биологии для анализа реальных финансовых данных, предлагая свежий взгляд на понимание финансовых рынков.

Чтобы исследовать рыночную экологию, Шолль сравнивает инвестиционные стратегии с видами в биологии, где индивидуальные инвесторы представляют особей данного вида. Совокупное богатство, инвестированное с использованием определенной стратегии, сравнимо с численностью или общей численностью популяции этого вида. В игрушечной модели инвестиционной игры Шолль представляет упрощенный сценарий, в котором агенты могут оставить свое состояние на счете денежного рынка или инвестировать в акции, по которым выплачиваются дивиденды. Эта модель позволяет исследовать различные инвестиционные стратегии и возражения против неоклассического предположения о совершенной рациональности.

Шолль определяет различные инвестиционные стратегии, используемые в агентных моделях для изучения экологии рынка. Первая — это совершенно рациональная стратегия, при которой стоимость чистых активов делится между акциями и наличными. Стоимостной инвестор оценивает темпы роста дивидендов, чтобы делать прогнозы на будущее и понимать будущую цену акций. Вторая стратегия включает в себя последователей тренда, которые анализируют последние цены и экстраполируют тренды. Третья стратегия включает в себя шумовых трейдеров, которые выходят на рынок для удовлетворения потребностей в ликвидности, но не чувствительны к цене в краткосрочной перспективе. Однако их шумовой процесс, обращающий среднее значение, связан с фундаментальной величиной на длительном временном масштабе.

Для моделирования рыночных механизмов и изучения рыночной экологии Шолль и его команда используют агентные модели с помощью программных пакетов. Они обеспечивают сопоставимость между различными прогонами модели, фиксируя одаренность и распределяя первоначальную одаренность между особями разных видов, отслеживая относительную долю. Моделирование выполняется в течение 200 лет, что позволяет наблюдать среднегодовой доход для каждого вида. Интересно, что они обнаружили, что у каждой стратегии есть по крайней мере один регион, где она наиболее прибыльна, независимо от ее распространенности.

В своих экспериментах Шолль исследует поведение последователей тренда и влияние реинвестирования прибыли. Он отмечает, что рынок проводит большую часть своего времени в нестабильной, хаотичной области с большими выбросами, что приводит к крапчатому шуму. Когда инвесторы реинвестируют свою прибыль, траектории колеблются вокруг определенной центральной точки, но не сходятся к ней полностью. Увеличение концентрации последователей тренда приводит к более высокой волатильности доходности. Шолль объясняет быстрое отступление от последователей тренда рациональностью инвесторов и положительной автокорреляцией в процессе выплаты дивидендов.

Шолль объясняет, что модели на основе агентов можно использовать для построения матрицы финансового сообщества, аналогичной уравнениям Вольтерра «хищник-жертва», используемым в биологии. Отдача от конкретной стратегии приравнивается к размеру популяции, а чувствительность отдачи к изменениям численности популяции представляет собой матрицу сообщества. На финансовом рынке конкуренция между различными стратегиями возникает, когда цены отклоняются от точек равновесия. Шолль подчеркивает, что финансовые рынки демонстрируют зависимость от плотности, что делает взаимодействие видов более сложным, чем в биологических системах. Эта зависимость от плотности приводит к таким сценариям, как рост цен, подобный пузырю, но признает, что такие ситуации нереалистичны.

В контексте экологии рынка Шолль обсуждает практическое значение своих выводов. Он представляет линейную модель, которая использует обилие видов для описания отношений между различными типами хищников, тем самым влияя на рыночные результаты. Этот подход подчеркивает многоаспектный характер инвестиций и демонстрирует важность надлежащего выбора стратегий, чтобы избежать убытков или стать добычей на финансовых рынках, сильно зависящих от плотности. Он бросает вызов традиционному представлению о том, что цены на акции отражают всю доступную фундаментальную информацию, и представляет финансовые рынки как сложные системы, подверженные влиянию различных условий.

Далее Шолль подробно описывает использование им простой линейной модели в рамках агентных моделей для изучения экологии рынка. Анализируя активы и относительное изобилие рыночной деятельности, он обнаружил, что этот подход превосходит модели, основанные на отделах, которые предполагают рациональность и автоматически преобразуют основные принципы. Однако он признает ограничения своей модели и подчеркивает необходимость дальнейших исследований для повышения ее реалистичности. Один аспект, который он затрагивает, — это чувствительность модели к различным рецептам и определениям, особенно в отношении следования за трендом. Хотя дивиденды играют важную роль в его модели, включение более реалистичных элементов для реальных финансовых рынков потребует дополнительных шагов.

Что касается приспособляемости убеждений агентов в его модели, Шолль указывает, что рыночные операции часто вовлекают управляющих фондами, которые следуют стратегиям, изложенным в проспектах, в течение длительных периодов времени. Это указывает на тенденцию к механическим процессам распределения активов. В результате Шолль склоняется к моделированию менее адаптивного поведения и меньшего интеллекта. Однако он подчеркивает, что другие исследователи из его группы в Оксфордском университете активно изучают применение эволюционных алгоритмов для изменения параметров и даже для разработки новых стратегий.

Исследования Мартина Шолля сосредоточены на изучении экологии рынка с использованием агентных моделей. Он бросает вызов традиционным финансовым теориям и предположениям, применяя концепции из биологии, чтобы лучше понять финансовые рынки. Сравнивая инвестиционные стратегии с видами в биологии, анализируя различные стратегии и моделируя рыночные механизмы, Шолль раскрывает сложность финансовых рынков и взаимодействие между различными стратегиями. Его выводы показывают, что финансовые рынки сильно зависят от плотности, и правильный выбор инвестиционных стратегий имеет решающее значение, чтобы избежать потерь и стать добычей в этой динамичной экосистеме. Работа Шолля дает ценную информацию о природе рынков как сложных систем, в отличие от традиционного взгляда на то, что цены на акции отражают исключительно фундаментальную информацию.

  • 00:00:00 Мартин Шолль из Оксфордского университета обсуждает свое исследование по экологии рынка с использованием агентных моделей. Он объясняет, что вместо того, чтобы сосредоточиться на общих предположениях, таких как гипотеза эффективного рынка, он не согласен с теорией равновесия рациональных ожиданий, используемой в неоклассических финансах, поскольку она требует, чтобы понимание всех участников соответствовало реальному миру. Он также сообщает, что в финансовой литературе насчитывается более 300 факторных моделей, что затрудняет определение наилучшей из них, а также существуют физические пределы когнитивных способностей как розничных инвесторов, так и управляющих фондами. Кроме того, он обсуждает важность применения инструментов из биологии к реальным данным для лучшего понимания финансовых рынков.

  • 00:05:00 Мартин обсуждает, как можно изучать экологию рынка с помощью агентных моделей. Он объясняет, что инвестиционные стратегии можно уподобить видам в биологии, где индивидуальные инвесторы соответствуют особям данного вида. Совокупное богатство, инвестированное с использованием определенной стратегии, представляет собой численность или общий размер популяции этого вида. Шолл представляет игрушечную модель инвестиционной игры, в которой агентам предоставляется выбор: оставить свое состояние на счете денежного рынка или инвестировать в акции, по которым выплачиваются дивиденды. Модель работает с одной акцией, что является упрощающим предположением, позволяющим в большинстве случаев использовать уникальные клиринговые цены. Шолль также обращается к неоклассическому предположению об идеальном рациональном инвесторе и выделяет возражения против этого подхода.

  • 00:10:00 Мартин Шолль объясняет концепцию рыночной экологии, используя метафоры из биологии. Он делит агентов на рынке в соответствии с причинами их участия и вводит функцию избыточного спроса как способ определения стратегии. Он объясняет, как сигнальная функция используется в инвестиционном процессе и как различные инвестиционные фонды склонны специализироваться на разных вещах, основанных на получении информации и анализе. Разделение стратегий имеет решающее значение на развивающихся рынках, где выгодно специализироваться в определенной нише, чтобы оптимизировать что-то.

  • 00:15:00 Мартин Шолль обсуждает различные стратегии, используемые в агентных моделях для изучения экологии рынка. Первая стратегия является совершенно рациональной стратегией, при которой стоимость чистых активов делится между акциями и наличными. Стоимостной инвестор оценивает скорость роста дивидендов, чтобы сделать прогноз, помогая понять цену акций в будущем. Вторая стратегия основана на следовании за трендом, которые смотрят на последние цены и экстраполируют эти тренды. Наконец, модель включает в себя шумовых трейдеров, которые приходят на рынок для удовлетворения потребностей в ликвидности, но не чувствительны к цене, поэтому их сигналы выглядят случайными в краткосрочном масштабе. Однако их шумовой процесс обращения среднего значения связан с фундаментальным значением в долгосрочной шкале и будет медленно возвращаться к среднему значению, как подсчитали Бушер и его коллеги.

  • 00:20:00 Мартин объясняет, как они моделируют рыночные механизмы с помощью агентных моделей, что позволяет им изучать экологию рынка. Из-за множества возможных решений аналитическая обработка моделирования затруднительна. Поэтому они используют пакет программного обеспечения для моделирования различных рыночных механизмов. Они фиксируют запасы, чтобы гарантировать, что результаты сопоставимы между разными прогонами модели. Они также делят начальные запасы между особями разных видов и отслеживают относительную долю. Они запускают моделирование на 200 лет и смотрят на средний годовой доход для каждого из видов. Они отмечают, что для всех трех стратегий существует по крайней мере один регион, в котором они наиболее прибыльны, даже если этот регион не является местом, где виды наиболее многочисленны.

  • 00:25:00 Мартин Шолл из Оксфордского университета обсуждает эксперимент с участием последователей тренда, в котором цены отклоняются от фундаментальных значений, что приводит к огромным прибылям и убыткам из-за случайной реализации процесса дивидендов и внесенного шума. Система проводит большую часть своей конструкции в нестабильной, хаотичной области с большими выбросами, которые создают пятнистый шум. Во втором эксперименте инвесторам было разрешено реинвестировать прибыль, а траектории прослеживались в симплексе с перераспределением богатства, но они слабо сходились к определенной центральной точке, вместо этого колеблясь из стороны в сторону. Система, как правило, находится в районе привлекательной фиксированной точки, и рыночная клиринговая цена объявляется каждый торговый день, что влияет на оценку трейдеров и цены.

  • 00:30:00 Мартин объясняет различные линии потока, полученные с помощью экспериментов Монте-Карло, при анализе фиксированной точки в системе с последователями тренда, стоимостными инвесторами и шумовыми трейдерами. Толщина линий указывает на объем богатства, ежегодно перераспределяемого между стратегиями, что показывает, как обилие последователей тренда может привести к огромным потерям в системе. Далее Шолль подчеркивает, что краудфандинг работает иначе для последователей тренда, чем для стоимостных инвесторов, и что увеличение концентрации последователей тренда приводит к более высокой волатильности доходности. Коренной причиной того, почему система быстро уходит от следования за трендом, является рациональность инвесторов и положительная автокорреляция в процессе выплаты дивидендов.

  • 00:35:00 Мартин Шолль объясняет, как можно использовать агентные модели для изучения экологии рынка и как можно построить матрицу финансового сообщества. Шолль проводит аналогию с уравнениями Вольтерра «хищник-жертва», используемыми в динамике популяций в биологии, которые используются для описания динамики различных популяций, а именно того, как разные виды взаимодействуют в зависимости от размера популяции. Он отмечает, что эту концепцию можно применять и к финансовым рынкам, где отдача от конкретной стратегии будет рассматриваться как размер популяции, а чувствительность возврата одного вида к изменениям размера популяции будет представлять собой матрицу сообщества.

  • 00:40:00 Мартин из Оксфордского университета объясняет, как виды в экологии финансового рынка конкурируют сами с собой в точке равновесия, поскольку все диагональные входы отрицательные, а все положительные входы положительные. Система устойчива, поскольку фиксированная точка устойчива с матрицей сообщества, устойчивой к определенным изменениям в популяции. Однако, когда рынок уходит достаточно далеко от точек равновесия, начинается конкуренция между последователями тренда и стоимостными инвесторами, когда стоимостных инвесторов довольно много. Зависимость от плотности делает взаимодействие между видами более сложным, чем биологическое, и она гораздо чаще встречается в финансах, чем в природе. В нестабильной области, где цены расходятся, последователи тренда выигрывают от других последователей тренда, и цена продолжает расти, как мыльный пузырь, но этот сценарий совершенно нереалистичен.

  • 00:45:00 Мартин Шолль обсуждает преимущества следования за трендом в краткосрочной перспективе, поскольку они могут извлечь выгоду из последователей тренда, которые немного медленнее, чем они, потому что они могут продавать на вершине или, по крайней мере, не раньше, чем цена полностью рухнет. Однако в этой модели последователи тренда просты и работают в одном и том же временном масштабе, независимо от индивидуальной стратегии. Шолль также обсуждает, как пассивный фонд или средство отслеживания индексов можно представить как фонд, который имеет согласованное распределение богатства по конкретным активам. Более высокая доля индексаторов сделает систему более стабильной и ослабит всю систему. Наконец, Шолль отмечает, что он вычислил всю эту информацию, чтобы понять бинарные отношения между видами, что привело к тому, что называется пищевой сетью.

  • 00:50:00 Мартин обсуждает изучение экологии рынка с помощью агентных моделей. Шолль объясняет, что узлы — это разные виды, а ребра — взаимодействие между ними. Используя трофический уровень, они могут определить, какой вид имеет самый низкий уровень прибыли, то есть он не охотится на другие виды, и какой из них имеет самый высокий уровень трафика, то есть он охотится на все другие виды, что делает его высшим хищником. Шолль объясняет, как уровни трафика резко меняются в зависимости от плотности и как каждая группа следует за дисконтом дивидендов, при этом стоимостные инвесторы охотятся на шумовых трейдеров, а последователи тренда используют корреляции.

  • 00:55:00 Мартин Шолль объясняет практические последствия изучения экологии рынка с помощью агентных моделей. Эксперимент, основанный на рыночном качестве и неправильном ценообразовании, показывает, что простая линейная модель, использующая обилие видов, достаточно хорошо описывает отношения между различными типами хищников, влияя на рыночные результаты. Разработанная модель позволяет наблюдать за многомерностью инвестиций, подчеркивая, что стратегии по-разному влияют на качество рынка. Согласно исследованию Шолля, финансовые рынки в значительной степени зависят от плотности, а это означает, что инвесторы должны соответствующим образом оценивать свою стратегию, чтобы не понести убытков или не стать добычей. Этот подход позволяет описывать рынки как сложную систему, на которую влияют различные условия, в отличие от традиционных финансов, где считается, что цены на акции отражают всю доступную фундаментальную информацию.

  • 01:00:00 В этом разделе видео Мартин Шолль обсуждает использование им простой линейной модели для изучения экологии рынка с помощью агентных моделей. Посмотрев на активы и относительное изобилие рыночной деятельности, он обнаружил, что этот подход предлагает лучший прогноз, чем использование моделей, основанных на отделах, которые предполагают рациональность и автоматически преобразуют основные принципы. Он также обсуждает ограничения своей модели и необходимость дальнейших исследований, чтобы сделать ее более реалистичной. Один из вопросов, который он решает, касается чувствительности модели к различным рецептам и определениям, особенно в отношении следования за трендом, который, как он объясняет, в основном определяется дивидендами в его модели, но потребует дальнейших шагов, чтобы сделать ее более реалистичной для реальных финансовых условий. рынки.

  • 01:05:00 Мартин Шолль обсуждает свой подход к изучению экологии рынка с использованием агентных моделей. Шолль не предполагает, что агенты способны адаптировать свои убеждения к его модели. Рыночные операции обычно включают управляющих фондами, которые следуют стратегиям, изложенным в проспектах на протяжении десятилетий, что указывает на то, что процесс распределения активов имеет тенденцию быть механическим. Шолль склоняется к менее адаптивному поведению и меньшему интеллекту в своем моделировании. Однако другие члены исследовательской группы Оксфордского университета работают над применением эволюционных алгоритмов для изменения параметров стратегий и даже над созданием новых.
 

Кевин Вебстер: «Как влияние цены искажает отчетность о прибылях и убытках»



Кевин Вебстер: «Как влияние цены искажает отчетность о прибылях и убытках»

В видеоролике на YouTube Кевин Вебстер подробно рассматривает вопрос о том, как влияние цен может исказить бухгалтерские отчеты о прибылях и убытках (P&L). Он подчеркивает важность точного моделирования воздействия на цену для эффективного управления рисками и подчеркивает важность управления риском ликвидности, чтобы не остаться с неликвидной позицией. Вебстер признает, что существуют различные доступные модели воздействия на цену, но в целом они совпадают по большинству данных.

Разговор начинается с рассмотрения пересечения между влиянием цен и риском ликвидности, в частности с учетом того, что ликвидность основных рынков часто воспринималась как должное до финансового кризиса. Вебстер делится яркими цитатами, иллюстрирующими, как влияние цены создает иллюзию прибыли, что приводит к отклонению цены от финансовых показателей. Цель доклада состоит в том, чтобы математически формализовать эту концепцию, предоставив количественную основу, основанную на оценке рыночного воздействия ликвидации для устранения иллюзии прибыли.

Вебстер объясняет влияние цены как причинно-следственную модель торговли, в которой более агрессивная торговля толкает цены дальше и наоборот. Модели воздействия на цену широко используются при анализе транзакционных издержек и оптимальном исполнении, выступая в качестве предторговых инструментов для оценки ожидаемых транзакционных издержек и оптимизации стратегий исполнения. Он демонстрирует отчет об анализе имитационных транзакционных издержек, который позволяет трейдерам ежеквартально оценивать работу своих алгоритмов с акцентом на минимизацию проскальзывания ордеров и рассмотрение как механических движений, так и альфа-проскальзывания.

Спикер обсуждает рекомендации, опубликованные Европейским управлением по ценным бумагам и рынкам (ESMA) в отношении стресс-тестов ликвидности, которые включают моделирование ликвидации активов в периоды рыночного стресса. Моделирование реакций рынка, таких как колебания цен, и использование стратегий хеджирования имеют решающее значение для снижения подверженности риску. Вебстер ссылается на различную литературу по стресс-тестам ликвидности и влиянию цен на учет прибылей и убытков, включая работы Cascioli, Boucheron, Farmer и регулирующих комитетов, таких как ESMA и Baffled Committee. Он подчеркивает необходимость стресс-тестирования ликвидности для смягчения ситуаций, которые могут повлиять на учет прибылей и убытков и привести к высоким затратам на ликвидацию.

Вводится понятие торгового следа, которое измеряет искажающий эффект влияния цены на учет прибылей и убытков и связывает воедино различные определения прибылей и убытков. Вебстер представляет простую модель срочной распродажи, чтобы проиллюстрировать существенные выводы об учете прибылей и убытков, сделанные в статье Casadio-Bouchard-Farmer. Он объясняет, как количество трейдеров и управляющих платформ, которые ежедневно наблюдают, завышает их окончательные прибыли и убытки, что приводит к дефляции после завершения сделки. Однако это свойство инфляции можно измерить и отобразить в режиме реального времени, предоставляя трейдерам полезную информацию. Вебстер отмечает, что убытки от инфляции позиций часто носят временный характер и зависят от допустимого риска.

Обсуждаются вопросы, связанные с оценкой стоимости акций и ее влиянием на прибыль и убытки компании. Вебстер подчеркивает двусмысленность в определении того, какие цены использовать для обозначения позиции акций, и разницу между учетными прибылями и убытками и фундаментальными прибылями и убытками, используемыми торговыми алгоритмами. Торговый след определяется как разница между бухгалтерскими прибылями и убытками и фундаментальными прибылями и убытками, при этом неоднозначность разрешается при закрытии позиции. Спикер исследует инфляцию позиции, делая определенные предположения, при которых это свойство выполняется. Также затрагивается импактная модель и два ее случая, исходный моль OW и моль W, изученные Фрювиртом и Бондом.

Вебстер объясняет, что для того, чтобы модель имела смысл, необходимо выполнить условие отсутствия арбитража между лямбда и бета, а также условие уравнения самофинансирования. Он углубляется в расчет ожидаемых прибылей и убытков на момент закрытия и в то, как торговый след вносит предвзятость в учет прибылей и убытков. Свойство раздувания позиции приводит к тому, что позиция раздувается во время фазы входа в позицию, остается на фазе удержания и, в конечном итоге, испаряется. Все эти аспекты можно наблюдать в режиме реального времени на торговом экране, предоставляя трейдерам ценную информацию.

Вебстер также объясняет искажения в бухгалтерском учете прибылей и убытков, вызванные ценовым влиянием. Он обсуждает, как трейдеры могут совершать прибыльные сделки даже без альфы, но предупреждает, что эта прибыль недолговечна из-за транзакционных издержек. Мониторинг ценовых дислокаций на ранней стадии имеет решающее значение, чтобы избежать потерь. Кроме того, Вебстер отмечает, что портфельные менеджеры предпочитают рассматривать свои портфели как единое целое, и вводит концепцию стационарного портфеля, которая контролирует размер и оборот портфеля в мире математических финансов.

Затем исследуется концепция стационарного портфеля в связи с оценкой текущих транзакционных издержек. Понимая временную шкалу распространителя, трейдеры могут оценить степень раздувания их позиций и иллюзию прибыли, которую они могут потерять при ликвидации своих позиций. Вебстер демонстрирует структуру, используя эмпирические данные, демонстрируя ее применимость к реальным сценариям. Он применяет эту структуру к модели срочной распродажи и объясняет различия между учетными прибылями и убытками и фундаментальными прибылями и убытками, подчеркивая, как они влияют на различные целевые функции, основанные на неприятии трейдером риска.

Докладчик подробно рассматривает влияние распродаж или торговой активности других участников рынка на прибыль и убытки трейдера. Агрессивное хеджирование может привести к эффектам скопления людей и инфляции позиций, что приведет к постоянным убыткам. Точное моделирование влияния цены имеет решающее значение для эффективного управления рисками, и особое внимание уделяется управлению риском ликвидности, чтобы избежать неликвидных позиций.

Вебстер признает, что, хотя существует множество различных моделей воздействия на цену, они в целом согласуются с большинством данных. Однако могут возникать различия в степени и продолжительности воздействия. Временные вывихи могут длиться от пары дней до месяца. С точки зрения управления рисками существует четкий план действий, тогда как с точки зрения трейдера и эффективности ключевым моментом становится эффективная коммуникация. Понимание того, являются ли P&L механическими или нет, и удаление механической части, позволяет трейдерам сосредоточиться на фактической альфе или преимуществе в своих сделках.

Спикер объясняет принцип «без манипулирования ценами», подчеркивая, что даже если трейдеры получают прибыль, они не могут ее сохранить, поскольку в конечном итоге она испарится. Инфляция позиции приводит к дефляции стоимости сделки с течением времени или немедленной ликвидации, что приводит к нулевым или даже отрицательным прибылям и убыткам. Поэтому трейдерам необходимо полагаться на другие переменные для получения устойчивой прибыли. Вебстер дополнительно исследует корреляцию между начальным состоянием воздействия, воздействием, вызванным остальной частью рынка, и влиянием хеджирования трейдера и остального рынка.

В заключение Кевин Вебстер дает исчерпывающее представление о том, как влияние цены может исказить учет прибылей и убытков. Он проливает свет на дополнительные расходы при режимах ликвидности с высокой волатильностью и их корреляцию с более широким рынком, подчеркивая их влияние на предвзятость. С точки зрения регулирования, корпоративные облигации и страховые компании, скорее всего, больше пострадают от этой предвзятости. Хотя Вебстер признает, что ему не хватает подробных ответов для рынков, не связанных с акциями, он обеспечивает прочную математическую основу для понимания влияния цены и его потенциального искажения прибылей и убытков.

  • 00:00:00 — основа этого разговора о том, как влияние цены искажает отчетность о прибылях и убытках. Разговор мотивирован пересечением влияния цены и риска ликвидности, а также тем фактом, что до финансового кризиса ликвидность на основных рынках часто воспринималась как нечто само собой разумеющееся. Спикер приводит две убедительные цитаты, которые иллюстрируют иллюзию прибыли, вызванную ценовым влиянием, и то, как это приводит к отклонению цены от финансовых ценностей. Доклад направлен на математическую формализацию этой идеи и предоставление количественной основы, основанной на предполагаемом влиянии ликвидации на рынок, чтобы устранить эту иллюзию прибыли.

  • 00:05:00 Спикер обсуждает влияние цены как причинно-следственную модель для торговли и то, как оно вызывает дальнейшее движение цены при более агрессивной торговле и наоборот. В отрасли используются модели воздействия на цену для анализа транзакционных издержек и оптимального исполнения, а специалисты-практики используют их в качестве предторгового инструмента для оценки ожидаемых транзакционных издержек ордера и оптимизации стратегии исполнения. Спикер дает макет отчета TCA, чтобы подражать этой перспективе ликвидности, чтобы трейдеры могли ежеквартально оценивать, как работают их алгоритмы. Трейдеры пытаются свести к минимуму проскальзывание ордера, и в игру вступают влияние на цену и проскальзывание альфы в зависимости от процента проскальзывания ордера, вызванного механическими движениями или альфой.

  • 00:10:00 Кевин Вебстер обсуждает рекомендации, опубликованные Европейским управлением по ценным бумагам и рынкам, о том, как проводить стресс-тесты ликвидности, которые включают моделирование ликвидации активов в периоды рыночного стресса. Он также объясняет важность имитации реакции рынка, такой как колебания цен, и то, как хеджирование может снизить подверженность риску. Кроме того, он рассматривает два направления литературы по стресс-тестам ликвидности и влиянию цен на бухгалтерские отчеты о прибылях и убытках, включая работы Cascioli Boucheron Farmer и регулирующих органов, таких как Baffled Committee и ESMA. Наконец, он подчеркивает необходимость стресс-тестирования ликвидности, чтобы избежать ситуаций, которые могут повлиять на бухгалтерский учет прибылей и убытков и привести к высоким затратам на ликвидацию.

  • 00:15:00 Докладчик обсуждает выводы из различных документов по стресс-тестам ликвидности, в том числе необходимость их использования лицами, принимающими решения, и их структуру, основанную на моделировании. Они рекомендуют конкретную статью Франчелли о моделировании ценовых дислокаций во время рыночного стресса, а также пару статей Швейцера и Урзуа, которые предоставляют альтернативное доказательство модели OB и значительно повышают ее применимость. Докладчик также представляет концепцию торгового следа, которая связывает воедино различные определения прибылей и убытков и измеряет искажающий эффект влияния цены на учет прибылей и убытков. Наконец, они разработали простую модель срочной распродажи, чтобы проиллюстрировать убедительные выводы об учете прибылей и убытков, сделанные в статье Casadio-Bouchard-Farmer.

  • 00:20:00 Кевин Вебстер обсуждает, как влияние цены может исказить учет прибылей и убытков. Он объясняет, как число, на которое ежедневно смотрят трейдеры и менеджеры платформ, завышает их окончательные прибыли и убытки, заставляя их уменьшаться, когда они заканчивают сделку. Однако свойство инфляции можно измерить и отобразить в режиме реального времени, что делает его полезным для трейдеров. Вебстер отмечает, что часть убытков, связанная с инфляцией позиции, часто носит временный характер и зависит от допустимого риска. В заключение он знакомит с математическими установками, переменными и величинами, которые трейдеры должны учитывать при расчете прибылей и убытков.

  • 00:25:00 В этом разделе Кевин Вебстер объясняет вопросы, связанные с оценкой позиции по акциям и тем, как это влияет на прибыль и убытки (P&L) компании. Он говорит о неоднозначности в определении того, какие цены использовать для обозначения позиции акций, и о разнице между бухгалтерскими прибылями и убытками и фундаментальными прибылями и убытками, которые использует торговый алгоритм. Он определяет торговый след как разницу между бухгалтерскими прибылями и убытками и фундаментальными прибылями и убытками и объясняет, как устраняется двусмысленность при закрытии позиции. Он также обсуждает инфляцию позиции и приводит некоторые допущения, при которых выполняется это свойство. Наконец, он упоминает импактную модель и два ее случая, первоначальный моль OW и моль W, которые изучали Фрювирт и Бонд.

  • 00:30:00 Кевин Вебстер объясняет, что для того, чтобы модель имела смысл, должно быть условие отсутствия арбитража между лямбда и бета, а также условие уравнения самофинансирования, которое должно быть выполнено. Он также рассказывает, как рассчитать ожидаемые прибыли и убытки на момент закрытия и как торговый след вносит погрешность в бухгалтерские отчеты о прибылях и убытках. Наконец, он обсуждает, как свойство инфляции позиции приводит к тому, что позиция раздувается во время фазы входа в позицию, остается на фазе удержания и, в конечном итоге, испаряется. Все это можно наблюдать в режиме реального времени и на торговом экране.

  • 00:35:00 В этом разделе Кевин Вебстер, эксперт по финансам, объясняет искажения, связанные с влиянием цены, которые возникают в бухгалтерском учете прибылей и убытков. Он обсуждает, как трейдеры могут совершать прибыльные сделки, даже если их сделка не имеет альфы, а также предупреждает, что эта прибыль не будет длиться долго из-за транзакционных издержек и что трейдерам следует заранее отслеживать эти ценовые местоположения, чтобы избежать убытков. Кроме того, он объясняет, что портфельные менеджеры предпочитают думать о своем портфеле в целом, и он определяет стационарный портфель, чтобы контролировать размер и оборот портфеля в мире математических финансов.

  • 00:40:00 Кевин Вебстер обсуждает концепцию стационарного портфеля и то, как его можно использовать для оценки текущих транзакционных издержек. Зная временной масштаб распространителя, трейдеры могут оценить, насколько раздута их позиция, и какую иллюзию прибыли они могут потерять, если начнут ликвидировать свою позицию. Затем Вебстер моделирует структуру на основе эмпирических данных и подчеркивает, что эти формулы можно применять к реальным сценариям. Наконец, он применяет эту структуру к модели срочной распродажи и объясняет различия между учетными прибылями и убытками и фундаментальными прибылями и убытками, а также то, как они могут влиять на различные целевые функции в зависимости от неприятия риска трейдером.

  • 00:45:00 Кевин обсуждает, как распродажи или торговая деятельность других участников рынка могут повлиять на прибыль и убытки трейдера. Он демонстрирует, что агрессивное хеджирование может привести к эффекту краудинга и инфляции позиции, что может привести к необратимым убыткам. Кроме того, он подчеркивает важность точного моделирования влияния цены для эффективного управления рисками и подчеркивает важность управления риском ликвидности до того, как в конечном итоге окажется неликвидная позиция. Наконец, он отмечает, что, хотя существует множество различных моделей воздействия на цену, они обычно согласуются с большинством данных.

  • 00:50:00 Спикер обсуждает, как разные модели воздействия могут противопоставляться не только по величине или изменению ценового воздействия, но и по продолжительности исчезновения воздействия. Они приводят пример временной дислокации, которая может длиться от пары дней до месяца. Однако, если трейдеры или менеджеры по эффективности хотят устранить предвзятость в своих позициях или выполнить управление рисками, любой модели воздействия должно быть достаточно, и существует действенный набор для эффективного общения с заинтересованными сторонами. С точки зрения управления рисками существует четкий набор действий. Напротив, с точки зрения трейдера и производительности, это в основном коммуникативная вещь, понимая, является ли P/L механическим или нет, удаляя механическую часть P/L, можно сосредоточиться на фактической альфе или фактическом преимуществе в сделке. .

  • 00:55:00 Кевин Уэбстер объясняет, что принцип отсутствия манипулирования ценами означает, что даже если трейдеры получают прибыль, они не могут зафиксировать ее, поскольку в конечном итоге она испарится. Инфляция доказательной позиции приводит к дефляции стоимости сделки с течением времени или немедленной ликвидации, что приводит к нулевым или даже отрицательным прибылям и убыткам. Трейдеры вынуждены полагаться на другие переменные для получения прибыли, поскольку инфляция позиции не позволяет прибыли стать постоянной. Далее Вебстер обсуждает корреляцию между начальным состоянием воздействия, первоначальным воздействием, вызванным остальным рынком, и влиянием хеджирования трейдера и остального рынка.

  • 01:00:00 Кевин Вебстер обсуждает, как влияние цен искажает учет прибылей и убытков. Он объясняет, что дополнительные расходы при режимах ликвидности с высокой волатильностью и корреляция с остальным рынком могут внести существенный вклад в предвзятость. С точки зрения регулирования, корпоративные облигации и страховые компании, скорее всего, больше пострадают от этой предвзятости. Однако, как он признает, у него нет подробных ответов, поскольку он не знает, как отвечать на некоторые вопросы, не связанные с акциями. В целом, он дает математическое понимание влияния цены и того, как оно может исказить прибыль и убытки.
 

Лаура Лил (Принстонский университет) - «Изучение функционального контроля для высокочастотных финансов»



Лаура Лил (Принстонский университет) - «Изучение функционального контроля для высокочастотных финансов»

Лаура Лил, исследователь из Принстонского университета, выступила с информативной презентацией о применении глубоких нейронных сетей в высокочастотных финансах. Она подчеркнула ограничения традиционных решений и исследовала преимущества использования нейронных сетей в этой области. Леал подчеркнул их способность адаптироваться к сложным факторам, таким как автокорреляция и внутридневная сезонность, с которыми борются традиционные модели. Используя нейронные сети, трейдеры могут добиться оптимального исполнения, сводя к минимуму влияние на рынок и обеспечивая бесперебойную торговлю.

Чтобы устранить опасения по поводу природы нейронных сетей как черного ящика, Лил ввел понятие объяснимости. Она обсудила проекцию управления нейронной сетью на многообразие более низкого измерения, что позволяет лучше понять связанные риски и отклонения от знакомых секторов риска. Команда оценила эффективность управления нейронной сетью, сравнив его с классическим решением PDE (уравнение в частных производных) в закрытой форме. Они изучили функцию стоимости, рыночную оценку богатства и относительные ошибки в прогнозах, чтобы оценить точность и эффективность подхода нейронной сети.

Леал углубился в тонкости обучения нейронной сети, подчеркнув важность включения реальных данных и точной динамики. Она также предложила контроллер с несколькими предпочтениями, который позволяет трейдерам вводить свои предпочтения в отношении риска, что позволяет быстрее адаптироваться к новым рыночным условиям. Рассматривая параметры неприятия риска и учитывая предпочтения трейдера, нейронная сеть может генерировать решение задачи стохастической оптимизации в высокочастотных финансах.

Докладчик обсудил структуру нейронной сети, используемой для управления рисками, подчеркнув ее рекуррентный характер. Хотя сеть не слишком глубокая, она использует повторяющуюся структуру на каждом временном шаге, одновременно обновляя веса. Входные данные для сети включают время и запасы, а выходные данные — это сам контроль, определяющий оптимальное количество акций для торговли на каждом временном шаге. Чтобы решить проблему ограниченной доступности финансовых данных, используется трансферное обучение, моделирующее данные с использованием методов Монте-Карло.

Лил описал процесс проецирования управления нейронной сетью на линейное функциональное пространство с использованием линейной регрессии. Этот метод проецирования способствует лучшему пониманию нелинейных функций нейронной сети и их согласованию с решениями управления в закрытой форме. Результаты продемонстрировали влияние включения параметров сезонности и неприятия риска на реакцию модели на рынок. Кроме того, докладчик подчеркнул значение гаммы, которая обычно устанавливается равной двум в литературе, но показывает нелинейное решение, когда берется три вместо двух.

Были тщательно оценены производительность и точность управления нейронной сетью при выполнении сделок высокочастотного финансирования. Лил сравнил функцию стоимости, рыночную оценку богатства и относительные ошибки в прогнозах для разных сценариев и значений гаммы. Хотя нейронная сеть продемонстрировала превосходную производительность, она выполняла сделки нелинейным образом, отклоняясь от известного управляющего решения. Это вызвало вопросы о решении торговать с использованием нейронной сети и определении соответствующих уровней маржи на основе ее отклонения от установленного решения.

Леал изучил преимущества подхода контроллера с несколькими предпочтениями, который позволяет трейдерам вводить свои параметры преобразования риска и сразу же начинать торговать с предварительно обученной моделью. Хотя решение для нейронной сети требовало больше времени для выполнения, чем решение PDE, оно предлагало большую гибкость и адаптируемость к различным предпочтениям риска. Чтобы повысить объяснимость, Лил предложил идею проецирования с использованием линейной регрессии, снижающей вычислительную нагрузку при сохранении возможности множественных предпочтений. Она также подчеркнула более широкое применение концепции аппроксимации нейронной сети, предполагая ее актуальность в других финансовых проблемах, таких как хеджирование.

Обсуждался процесс обучения нейронной сети в высокочастотных финансах, при этом особое внимание уделялось автономному обучению, чтобы избежать проблем с задержкой, связанных с онлайн-обучением с подкреплением. Сеть использует время, инвентарь и потенциальное неприятие риска в качестве входных данных и производит скорость в качестве выходных данных. Лил также описал процедуру тонкой настройки в трансферном обучении, переход от смоделированных данных к реальным приращениям данных, полученным с фондовой биржи Торонто после конвергенции сети. Докладчик подчеркнул важность использования реальных данных и точной динамики в процессе обучения, поскольку это повышает способность сети учитывать сложности высокочастотных финансов.

В следующем разделе Лаура Лил рассказала о входных данных и целевой функции, используемых в нейронной сети для высокочастотных финансов. Нейронная сеть включает запасы как долю среднего объема для определенного запаса в течение дня, что позволяет нормализовать представление. Целевая функция сформулирована как задача максимизации, а результат служит контролем оптимального выполнения. Структура нейронной сети основана на аппроксимации функций с использованием двух входных узлов и четырех скрытых слоев для захвата базовых взаимосвязей.

Отвечая на вопрос о несоответствии между двумя контрольными решениями, Леаль пояснил, что это можно интерпретировать как отражение изменяющейся полезности инвестора. Регулируя параметр гаммы, можно использовать различные полезные функции, что приводит к изменениям в решениях по управлению. В своем исследовании команда выбрала значение гаммы из трех половин на основе эмпирического тестирования с реальными трейдерами, что привело к удовлетворительным результатам.

Леал также подчеркнул, что выходные данные нейронной сети можно наблюдать и анализировать. Они могут отслеживать позиции, занятые сетью, и то, как они меняются в течение торгового дня, обеспечивая прозрачность и понимание процесса принятия решений. Этот уровень интерпретируемости и понимания позволяет трейдерам обрести уверенность в стратегиях исполнения нейронной сети.

Леал также обсудил проблемы, связанные с разработкой функциональных средств управления высокочастотными финансами. В то время как усредненный процесс контроля может дать общее представление об исполнении сделки, он может не точно отражать поведение отдельных траекторий. Динамика рынка, такая как появление акций мемов, требует адаптации методов контроля для эффективного учета меняющихся условий.

В заключение, презентация Лауры Лил пролила свет на сложности создания эффективного контроля в сфере высокочастотных финансов. Используя глубокие нейронные сети, исследователи и трейдеры могут преодолеть ограничения традиционных моделей и адаптироваться к сложной динамике этой области. Включение предпочтений риска, показателей объяснимости и реальных данных способствует разработке надежных и адаптируемых решений управления. Благодаря своей работе Леал и ее команда предлагают ценные идеи и решения, которые прокладывают путь к более эффективному и обоснованному принятию решений в высокочастотных финансах.

  • 00:00:00 Лаура Лил представляет свою совместную работу с Матиасом и Шарлоттой по использованию глубокой нейронной сети для решения проблемы оптимального исполнения в высокочастотных финансах. Цель состоит в том, чтобы избежать значительного влияния на рынок и торговать как можно более плавно и скрытно. Команда вводит идею объяснимости, чтобы решить проблему нейронных сетей как черного ящика, где они проецируют управление нейронной сетью на многообразие более низкого измерения, чтобы лучше понять риск и насколько далеко решение нейронной сети от знакомого риска. сектор. Они оценивают производительность, рассматривая функцию стоимости, отмеченный рынок богатства и относительные ошибки в прогнозах, и сравнивают решение нейронной сети с классическим решением PDE закрытой формы.

  • 00:05:00 Лаура Лил из Принстонского университета обсуждает, как нейронные сети могут улучшить ограничения традиционных решений, таких как модели PD (частный дифференциал), которые изо всех сил пытаются адаптироваться к сложностям высокочастотных финансов, таких как автокорреляция, тяжелые хвосты и внутридневная сезонность. Однако для запуска нейронных сетей может потребоваться много времени, поэтому она предлагает контроллер с несколькими предпочтениями, который вводит предпочтения трейдера в отношении риска, чтобы быстрее адаптироваться к новым дням, создавая решение проблемы стохастической оптимизации. Затем Лил предоставляет обзор литературы, включая модели оптимального исполнения, и объясняет переменные состояния, такие как запасы, контроль и цена, на которых нейронная сеть может учиться в высокочастотных финансах.

  • 00:10:00 Лаура обсуждает эволюцию ценового процесса в высокочастотных финансах и то, как на него влияет скорость торговли. Она объясняет, что чем быстрее вы торгуете, тем больше ликвидности вы потребляете, что толкает цену вверх и оказывает постоянное влияние на рынок. Объективный критерий минимизации зависит от контроля, которым является скорость торговли, и имеет терминальную составляющую и составляющую текущих затрат. Стоимость терминала разбита на три части, которые включают в себя окончательное состояние в наличных деньгах, штраф за хранение инвентаря и то, за сколько можно продать окончательный инвентарь. Текущие расходы — это штраф за хранение запасов в течение дня, и эти два параметра необходимы для управления рисками. Лил также обсуждает, насколько важна гамма для решения их нейронной сети, и в литературе она обычно принимается равной двум.

  • 00:15:00 Лаура Лил, спикер из Принстонского университета, объясняет использование нейронной сети для изучения аппроксимации в высокочастотной финансовой задаче, где функция стоимости имеет некоторый квадратичный член в запасах. Эквивалентное решение при использовании нейронной метрики отличается от оптимизации управления mu, поскольку необходимо выбрать параметры нейронной сети. Нейронная сеть используется для всех временных шагов, что позволяет ей научиться реагировать на основе цены, запасов и богатства агента. В этом процессе используется полностью связанная структура нейронной сети с прямой связью и вводом данных о времени и запасах. Однако входные данные могут быть обобщены многими способами, чтобы включать больше входных данных, чем параметры предпочтения риска, используемые в видео для иллюстративных целей.

  • 00:20:00 Лаура Лил объясняет структуру нейронной сети, которая используется для контроля рисков в высокочастотных финансах. Сеть не очень глубокая, но рекуррентная, повторно использующая одну и ту же структуру на каждом временном шаге для одновременного обновления весов. Вход в сеть — это время и запасы, а выход — управление, которым является сама нейронная сеть, выводящая для каждого временного шага определенное количество акций для торговли. Трансферное обучение используется для моделирования данных с использованием Монте-Карло вместо использования дорогих или разреженных финансовых данных. Используемые данные взяты с фондовой биржи Торонто за период с января 2008 г. по декабрь 2009 г., а нейронная сеть используется для решения проблем тяжелых хвостов, автокорреляции и внутридневной сезонности.

  • 00:25:00 В этом разделе Лаура Лил объясняет процесс проецирования управления, полученного нейронной сетью, на пространство линейных функций от q, используя линейную регрессию для нахождения членов бета1 и бета2 для определения квадрата r, показывая, сколько из нелинейные функции нейронной сети можно спроецировать на пространство замкнутых управлений. Результаты показали, что при добавлении в код функциональности, такой как сезонность и изучение параметров неприятия риска агентом, оказывалось существенное влияние на реакцию модели на рынок, но при учете гаммы, равной 3 больше 2, не было -линейное решение для нейронной сети.

  • 00:30:00 Лаура проверяет производительность и точность управления нейронной сетью при выполнении сделок для высокочастотных финансов. Она сравнивает функцию стоимости и оценку с рыночным богатством для различных сценариев и значений гаммы. Она также оценивает относительную ошибку в прогнозе и отмечает, что, хотя нейронная сеть имеет лучшую производительность, она работает нелинейно, что отличается от известного элемента управления. Это поднимает вопросы о том, стоит ли торговать с использованием нейронной сети и какую маржу устанавливать в зависимости от ее удаленности от удобного известного решения.

  • 00:35:00 В этом разделе Лаура обсуждает свои выводы о контроллере множественных предпочтений для оптимального исполнения в высокочастотных финансах. Леал обнаружил, что решение нейронной сети выполняется дольше, чем решение PDE для всех наборов параметров, потому что первое реагирует на сезонность. Однако при таком подходе трейдеры могут ввести свои текущие параметры преобразования риска и сразу же начать торговать с уже обученным инструментом. Лил также предлагает объяснимость через идею проекции, которая использует линейную регрессию и версию одной и той же задачи с несколькими предпочтениями, чтобы снять часть вычислительной нагрузки. Кроме того, Лил обсуждает другие статьи в своей диссертации и то, как эта идея аппроксимации нейронной сети может быть применена ко многим другим финансовым проблемам, включая хеджирование.

  • 00:40:00 Лаура Лил обсуждает процесс обучения нейронной сети, используемой в высокочастотных финансах. Она объясняет, что сеть обучается в автономном режиме, а не с помощью онлайн-обучения с подкреплением, чтобы избежать проблем с задержкой. После того, как сеть обучена, она получает время и инвентарные входные данные, потенциально с параметрами предотвращения риска, и выводит скорость. Конечному пользователю не нужно понимать внутреннюю работу сети. Леал также объясняет процедуру тонкой настройки, используемую в трансферном обучении, которая включает в себя переключение на приращения реальных данных с фондовой биржи Торонто после конвергенции сети. Наконец, она отвечает на вопросы о предварительной обработке и оптимизации, подчеркивая важность использования реальных данных и точной динамики в процессе обучения.

  • 00:45:00 В этом разделе видео Лаура Лил обсуждает входные данные и целевую функцию, используемые в нейронной сети для высокочастотных финансов. Нейронная сеть берет запасы как долю от среднего объема для этого запаса в течение дня, которая принимается как значение от минус одного до одного. Целевая функция представляет собой задачу максимизации с выходом, являющимся управлением, а структура нейронной сети основана на аппроксимации функции. Леал также объясняет, что в структуре нейронной сети есть два входных узла и четыре скрытых слоя. Наконец, она обращается к вопросу о разнице между двумя контрольными решениями и поясняет, что ее можно интерпретировать как результат изменения полезности для инвестора.

  • 00:50:00 Лаура обсуждает различия между моделями гаммы 2 и трех половинок и их полезными функциями. Она объясняет, что с гаммой 2 решение больше не является решением в закрытой форме, а вместо этого с помощью нейронной сети создается приближенное решение. Причина выбора гаммы три половины заключалась в том, что она была протестирована с реальными трейдерами внутри фирмы, и это дало хорошие результаты. Кроме того, Леал подтверждает, что выходные данные нейронной сети можно наблюдать и анализировать, и они знают, какие позиции они занимают и как они меняются в течение дня.

  • 00:55:00 В этом разделе Лаура Лил обсуждает проблемы создания функционального контроля для высокочастотных финансов. Хотя усредненный процесс контроля может дать представление о том, как будет выглядеть исполнение сделки, он может быть не совсем точным при рассмотрении одной траектории. Она также затрагивает вопрос об использовании двухблочного метода для оптимизации и объясняет, как этот метод должен адаптироваться к меняющейся динамике, например, в отношении акций мемов. В целом, презентация Леала проливает свет на тонкости создания функциональных элементов управления высокочастотными финансами.
 

Zihao Zhang (Oxford-Man Institute) — «Глубокое обучение для рынка на основе данных о заказах»



Zihao Zhang (Oxford-Man Institute) — «Глубокое обучение для рынка на основе данных о заказах»

Zihao Zhang, научный сотрудник Oxford-Man Institute и член исследовательской группы по машинному обучению, представляет недавнюю работу своей команды по применению глубокого обучения к рыночным данным по заказам. Их внимание сосредоточено на данных о микроструктуре рынка, в частности на книге лимитных ордеров, которая дает ценную информацию об общей динамике спроса и предложения для конкретного финансового инструмента. Комбинируя данные рынка по ордерам и книги лимитных ордеров, Чжан и его команда обнаружили, что они могут уменьшить дисперсию сигналов и получить более точные прогнозные сигналы. Это приложение их модели обладает потенциалом для улучшения исполнения сделок и стратегий создания рынка.

Чжан начинает свою презентацию с краткого введения в данные о микроструктуре рынка, особо подчеркивая значение рынка по данным о заказах. Этот источник данных предлагает очень детализированную информацию, обеспечивая частые обновления и события по сравнению с данными книги лимитных ордеров, которым уделялось больше внимания в существующей литературе. Он представляет их модель глубокого обучения, объясняя сетевые архитектуры, которые они разработали для анализа рынка по данным заказов. Чжан подчеркивает, что их работа представляет собой первую прогностическую модель, использующую рыночные данные по заказам для прогнозирования высокочастотных движений, предлагая альтернативный источник информации, расширяющий возможности альфа-обнаружения.

Затем Чжан углубляется в концепцию книги лимитных ордеров, которая служит всеобъемлющей записью всех невыполненных лимитных ордеров по финансовому инструменту в определенный момент времени. Он подчеркивает, что в то время как графические данные предлагают информацию с низкой периодичностью, цена акции на самом деле представлена книгой лимитных ордеров, которая представляет собой многомерный временной ряд. Чжан объясняет, как книга лимитных ордеров организована по разным ценовым уровням в зависимости от поданных ордеров, причем каждый ценовой уровень состоит из множества небольших ордеров, сегментированных разными трейдерами. Он также обсуждает, как обновляется книга заказов при поступлении новых сообщений, которые могут вводить новые позиции, отменять существующие заказы или изменять текущие заказы. Чжан отмечает, что полученные данные из книги лимитных ордеров раскрывают общую взаимосвязь между спросом и предложением для конкретного финансового инструмента, и его цель состоит в том, чтобы определить, может ли использование данных о рынке по ордерам, содержащих информацию о размещении и отмене ордеров, дать дополнительную информацию. для составления прогнозов.

Двигаясь вперед, Чжан исследует, как данные о рынке по заказам можно использовать в глубоком обучении для прогнозирования движений рынка. Хотя строки сообщений в данных рыночных ордеров имеют меньшие размеры по сравнению с книгой лимитных ордеров, они предлагают дополнительную информацию, которую можно использовать для прогнозов. Чжан объясняет, как прошлые события могут быть преобразованы в 2D-матрицы, формируя изображения, которые можно передавать в нейронную сеть для прогнозирования. Полученные функции из сверточного слоя затем можно интегрировать в рекуррентные нейронные слои, чтобы изучить структуру и зафиксировать дополнительные зависимости. Последний слой создает прогнозы на основе настройки классификации с использованием пороговых результатов.

Чжан переходит к обсуждению сетевой архитектуры, используемой для прогнозирования с использованием данных книги лимитных ордеров. В этом случае первые два компонента заменяются сообщениями от отдельных трейдеров, а сверточные слои заменяются слоем LSTM или уровнем внимания. Чжан кратко объясняет механизм внимания, который облегчает одноточечное предсказание и включает в себя структуру кодер-декодер. Кодер извлекает значимые функции из входного времени и суммирует их в скрытое состояние, а декодер генерирует прогноз. Нормализация используется для определения того, является ли ордер покупкой или продажей на основе средней цены.

В следующем разделе Чжан представляет результаты своей модели, обученной с группой активов, нормализованной до аналогичного масштаба и протестированной с использованием различных моделей, таких как простая линейная модель, многослойный персептрон, LSTM и модель внимания, включающая как предельный порядок книжные данные и чистые окружающие данные. Результаты показывают, что прогностические сигналы из внешних данных демонстрируют меньшую корреляцию с сигналами из книги лимитных ордеров, предполагая, что комбинация этих двух источников может уменьшить дисперсию сигнала, извлечь выгоду из диверсификации и дать превосходные прогностические сигналы. Таким образом, модель ансамбля, которая усредняет прогностические сигналы от обоих типов данных, демонстрирует наилучшую производительность.

Чжан переходит к обсуждению потенциальных преимуществ включения данных о рынке по заказам (MBO) в прогнозы и подчеркивает возможность выполнения проектирования функций с этими данными. Он представляет результаты для горизонтов прогнозирования в диапазоне от двух до 20 тиков вперед, отмечая аналогичное поведение, наблюдаемое для 50 и 100 тиков вперед. Чжан также отвечает на вопросы аудитории, включая возможность обучения одной модели с использованием всех инструментов для улучшения обобщения и источник данных MBO с Лондонской фондовой биржи. Отвечая на вопрос зрителя о том, чтобы сосредоточиться на NF1 вместо PNL, Чжан соглашается и признает, что PNL является более подходящим показателем успеха.

Далее Чжан обсуждает использование прогнозирующих сигналов и различные способы их определения, такие как использование необработанного сигнала или установка порогового значения на основе вероятностей softmax. Он резюмирует ключевые моменты статьи, в которых предлагается моделировать данные рынка по заказам (MBO) вместо данных книги лимитных заказов и тестировать модели глубокого обучения, включая механизм хранения LSTM. Результаты показывают, что комбинация данных MBO и книги лимитных ордеров дает наилучшие результаты. Чжан отвечает на вопросы аудитории, касающиеся автокорреляции между движениями рынка, фильтрации шумных сделок и мотивации использования слоев CNN при моделировании изображений лимитных ордеров.

В следующем разделе Чжан объясняет, как можно рассматривать книгу заказов как пространственную структуру, которую можно эффективно исследовать с помощью сверточных нейронных сетей (CNN). Использование CNN для извлечения информации из каждого уровня цен оказалось полезным для прогнозов. Слой долговременной кратковременной памяти (LSTM) предпочтительнее многослойных персептронов, поскольку он поддерживает временной поток данных и суммирует прошлые события для прогнозирования. Чжан отмечает, что преимущества использования механизма внимания ограничены из-за характера финансовых временных рядов. Документ включает подробное описание гиперпараметров, используемых в их модели.

Чжан обращается к озабоченности по поводу большого количества параметров, используемых в методах нейронных сетей, и их эффективности при прогнозировании фондового рынка. Он признает, что обилие параметров может стать предметом критики, но подчеркивает, что его команда точно настроила лишь несколько параметров, характерных для их модели. Они еще не рассматривали использование спреда спроса и предложения в качестве критерия успеха, но признают его потенциал для дальнейшего изучения. Чжан считает, что их модель имеет практическое значение для стратегий исполнения сделок и создания рынка. Однако он упоминает, что если кто-то намеревается пересечь спред, может потребоваться уменьшение выборки данных, поскольку частые обновления данных в книге заказов могут усложнить выполнение сделки. Наконец, при моделировании книги лимитных ордеров Эло они объединяют общий размер на каждом ценовом уровне, а не включают информацию об отдельных размерах ордеров.

В заключительном разделе Чжан объясняет разницу между рынком по ордерам и рынком по ценовым данным. Данные рынка по заказам позволяют отслеживать отдельные заказы, что невозможно с данными рынка по ценам. При правильном проектировании функций данные о рынке по заказам могут предоставить дополнительную информацию и генерировать альфу. Чжан также обсуждает, как его модель учитывает изменения цены конкретного лимитного ордера при неизменном размере. Каждое новое сообщение с обновленными ценами рассматривается как новое обновление, обогащающее набор данных.

В целом, презентация Zihao Zhang демонстрирует применение глубокого обучения к рынку по данным заказов, подчеркивая его потенциал для извлечения ценных идей из данных о микроструктуре рынка. Объединив данные рынка по ордерам и книги лимитных ордеров, команда Чжана продемонстрировала снижение дисперсии сигналов и создание улучшенных прогнозирующих сигналов. Их работа обещает улучшить исполнение сделок и стратегии создания рынка, предлагая ценный вклад в область анализа финансового рынка.

  • 00:00:00 Цзихао Чжан, постдоктор Оксфордского института человека и член исследовательской группы по машинному обучению, представляет свою недавнюю работу с Брайаном Лингом и Стефаном Лореном по применению модели глубокого обучения для вывода на рынок данных о заказах. Чжан начинает с краткого введения данных о микроструктуре рынка, включая книгу лимитных ордеров и данные о рынке по ордерам. Он подчеркивает, что последний, возможно, является наиболее подробным источником информации, предоставляющим больше обновлений и событий по сравнению с данными книги лимитных ордеров, и все же в текущей литературе им в значительной степени пренебрегают. Чжан представляет свою модель глубокого обучения и обсуждает сетевые архитектуры, которые они разработали для этого типа данных. Он также подчеркивает, что их работа является первой прогностической моделью, использующей рыночные данные по заказам для прогнозирования высокочастотных движений, и что она обеспечивает ортогональный источник информации, расширяющий вселенную альфа-обнаружения.

  • 00:05:00 Zihao объясняет концепцию книги лимитных ордеров, которая представляет собой запись всех невыполненных лимитных ордеров по финансовому инструменту в данный момент времени. Он подчеркивает, что, хотя данные диаграммы предоставляют информацию с низкой частотой, цена акции на самом деле представляет собой многомерный временной ряд, представленный книгой лимитных ордеров. Чжан объясняет, как книга лимитных ордеров сортируется по разным ценовым уровням в зависимости от отправленных ордеров, и каждый ценовой уровень состоит из множества небольших ордеров, которые сегментируются разными трейдерами. Он также обсуждает, как обновляется книга заказов при поступлении нового сообщения, которое может добавить новую позицию, отменить существующий заказ или обновить существующие заказы. Чжан отмечает, что производные данные из книги лимитных ордеров показывают общую взаимосвязь между спросом и предложением для конкретного финансового инструмента, и его внимание сосредоточено на том, чтобы увидеть, может ли использование данных рынка по ордерам, которые содержат информацию о размещении и отмене ордеров, предоставить дополнительную информацию для прогнозирования.

  • 00:10:00 Цзыхао Чжан обсуждает, как данные рыночных ордеров можно использовать для глубокого обучения, чтобы делать прогнозы движения рынка. Хотя строки сообщений в данных рыночных ордеров имеют меньшую размерность, чем книга лимитных ордеров, они предоставляют дополнительную информацию, которую можно использовать для прогнозов. Чжан объясняет, что изображения прошлых событий могут быть сформированы в виде 2D-матрицы и введены в нейронную сеть для прогнозирования. Полученные в результате функции из сверточного слоя затем можно поместить в рекуррентные нейронные слои для изучения структуры и дополнительных зависимостей. Последний слой выводит прогнозы на основе настройки классификации с использованием пороговых результатов.

  • 00:15:00 Zihao Zhang из Oxford-Man Institute объясняет сетевую архитектуру, используемую для прогнозирования на основе данных книги лимитных ордеров, где первые два компонента заменены сообщениями от отдельных трейдеров, а сверточные слои заменены слоем LSTM или вниманием. слой. Чжан также кратко объясняет механизм внимания, который в данном случае используется для одноточечного прогнозирования и включает в себя структуру кодировщика и декодера, при этом кодировщик извлекает значимые признаки из входного времени и суммирует их в скрытое состояние, в то время как декодер генерирует предсказание. . Нормализация используется для определения того, является ли ордер покупкой или продажей на основе средней цены.

  • 00:20:00 В этом разделе видео Цзихао Чжан представляет результаты модели, обученной с группой активов, нормализованной до аналогичного масштаба и протестированной на различных моделях, таких как простая линейная модель, многослойное восприятие, LSTM и модель внимания, использующая как данные группы лимитных ордеров, так и чистые внешние данные. Результаты показывают, что прогностические сигналы из внешних данных в меньшей степени коррелируют с сигналами из книги лимитных ордеров, что позволяет предположить, что комбинация этих двух сигналов может уменьшить дисперсию сигнала, извлечь выгоду из диверсификации и дать более точные прогностические сигналы. Таким образом, модель ансамбля, которая усредняет прогностические сигналы из обоих типов данных, дает наилучшую производительность.

  • 00:25:00 Zihao Zhang обсуждает потенциальные преимущества включения данных о рынке по заказам (MBO) в прогнозы и упоминает возможность разработки функций с данными. Были показаны результаты для горизонта прогнозирования на два-20 тиков вперед, с аналогичным поведением, наблюдаемым для 50 и 100 тиков вперед. Чжан также отвечает на вопросы аудитории о внедрении, включая возможность обучения одной модели с использованием всех инструментов для улучшения обобщения и происхождения данных MBO с Лондонской фондовой биржи. Один из зрителей задает вопрос, сосредоточив внимание на NF1, а не на PNL, с чем Чжан соглашается и признает, что PNL является более подходящим показателем успеха.

  • 00:30:00 Zihao Zhang обсуждает использование прогностических сигналов и различные способы их определения, такие как использование необработанного сигнала или установка порога вероятности из softmax. Он резюмирует документ, в котором предлагается моделировать данные рынка по заказам (MBO) вместо данных книги лимитных заказов и тестировать модели глубокого обучения, включая механизм хранения LSTM. Результаты показывают, что сочетание данных MBO и книги лимитных ордеров дает наилучшие результаты. Чжан также отвечает на вопросы аудитории об автоматической корреляции между движениями рынка, фильтрации шумовых сделок и мотивации использования слоев CNN при моделировании изображений лимитных ордеров.

  • 00:35:00 В этом разделе видео Zihao Zhang из Oxford-Man Institute объясняет, как книгу заказов можно рассматривать как пространственную структуру, которую можно исследовать с помощью тех же слоев. Использование сверточной нейронной сети (CNN) для извлечения информации из каждого уровня цен оказалось полезным для прогнозов. Слой долговременной кратковременной памяти (LSTM) был выбран вместо многослойного восприятия, потому что он не искажает течение времени и суммирует прошлые события, чтобы делать прогнозы. Было обнаружено, что преимущества использования механизма внимания ограничены из-за свойства финансовых временных рядов. В документе содержится подробное описание используемых гиперпараметров.

  • 00:40:00 Zihao Zhang обсуждает количество параметров, используемых в методах нейронных сетей, и их эффективность в прогнозировании фондового рынка. Он отмечает, что, хотя большое количество параметров может быть критикой методов нейронных сетей, он и его команда настроили только несколько параметров для своей конкретной модели. Они не рассматривали возможность использования спреда спроса и предложения в качестве критерия успеха, но признают, что его можно исследовать дальше. Чжан считает, что применение их модели полезно для стратегий исполнения сделок и создания рынка, но если кто-то хочет пересечь спред, им может потребоваться уменьшить выборку данных, чтобы совершить сделку, поскольку данные книги часто могут иметь слишком много обновлений для совершить сделку. Наконец, при моделировании книги лимитных ордеров Эло они объединяют общий размер на каждом ценовом уровне вместо включения информации об отдельных размерах ордеров.

  • 00:45:00 В этом разделе Цзыхао Чжан из Института Оксфорд-Мэн объясняет разницу между рынком по заказам и рынком по ценовым данным. Рынок по ордерным данным позволяет отслеживать отдельные ордера, что невозможно с рынком по ценовым данным. При правильной разработке функций данные с рынка по порядку могут предоставить дополнительную информацию и генерировать альфу. Кроме того, Чжан обсуждает, как его модель учитывает изменения цены конкретного лимитного ордера при неизменном размере. Он объясняет, что каждое новое сообщение с обновленными ценами рассматривается как новое обновление.
 

Питер Карр (Нью-Йоркский университет) "Stoptions" с участием. Лоренцо Торричелли (Пармский университет)



Питер Карр (Нью-Йоркский университет) "Stoptions" с участием. Лоренцо Торричелли (Пармский университет)

Питер Карр представляет финансовый продукт под названием «стопы», который сочетает в себе функции фьючерсных контрактов и опционов пут. Стопы позволяют владельцу избежать неблагоприятных изменений цены за счет включения элемента бермудского пут-опциона. Карр объясняет концепцию опционов и приводит пример трехдневного опциона с разными этажами, связанными с ним. Затем он переходит к обсуждению стоимостной оценки однодневных и двухдневных остановок, причем последние имеют два этажа и гибкость для исполнения в первый или второй день.

Далее Карр исследует оценку стоп-опциона на более длительные периоды, углубляясь в обратную рекурсию, оценку бракованного пут-опциона и использование псевдосумм. Он предлагает использовать логистическое распределение для представления изменений цен в женатых опционах пут. Стоимость остановок может быть получена с использованием простых формул для опционов «при деньгах», а оценка и хеджирование могут быть выполнены аналитически.

Карр завершает статью обсуждением проблем, связанных с принятием таких опций рынком. Он подчеркивает важность поиска покупателя и продавца для этих продуктов и делится своими беседами с потенциальными покупателями и продавцами. Кроме того, Карр признает, что модель остановок является альтернативой существующим моделям, таким как Блэк-Шоулз и Башелье, но она может не подходить оптимально для каждой ситуации. Тем не менее, он подчеркивает, что их модель нацелена на то, чтобы охватить множество бинарных операций, имеющих особое значение в финансах.

В более позднем разделе Карр и Лоренцо Торричелли предлагают модель «остановок», используя сопряженную парадигму и логистическое распределение. Эта модель обеспечивает гибкость временной структуры с одним параметром, что позволяет использовать различные временные структуры за один страйк. Однако он может не идеально соответствовать рынку из-за нисходящего графика подразумеваемой волатильности. Авторы признают ограничения своей модели и признают бесчисленное множество бинарных операций в финансах, которые их модель призвана охватить. Они обсуждают необязательность между страйком и одиночным опционом, а также повторную необязательность посредством псевдосуммирования. Раздел завершается взаимной признательностью и ожиданием посещения семинаров друг друга.

  • 00:00:00 Питер Карр представляет «стопы», новый финансовый продукт, представляющий собой гибрид фьючерсного контракта и опциона пут. У остановки есть базовый актив и фиксированный срок, а также ежедневный мониторинг, при этом владелец накапливает каждое изменение цены базового актива. Стоп-опцион отличается от фьючерсного контракта тем, что владелец может избежать неблагоприятного изменения цены благодаря элементу опциона пут. Пут является бермудским, что означает, что владелец может исполнить его в конце любого дня, заменив изменение цены в этот день на нижний предел, указанную в контракте константу, которая может быть любой функцией времени.

  • 00:05:00 Питер Карр объясняет концепцию опционов и то, как они функционируют в финансовых соглашениях. Опцион — это финансовый продукт, который позволяет выбирать, когда прекращать подверженность изменениям цен, если в контракте «стоп-стрельба» есть более одного дня, что обеспечивает гибкость. Опцион можно исполнить только один раз, и в этот момент он должен исполнить. Термин «опцион» относится к тому, когда прекратить воздействие на базовый актив путем исполнения. Карр иллюстрирует эту концепцию на примере трехдневного опциона и описывает три разных этажа, связанных с этим опционом. Затем срок действия контракта истекает, когда кто-то исполняет опцион, что должно произойти только один раз. Хотя такие контракты в настоящее время не торгуются, они встроены во многие финансовые соглашения.

  • 00:10:00 Питер Карр обсуждает пример контракта с бермудским стилем упражнений под названием «остановки». Хотя он не торгуется напрямую, стоп-приказы могут помочь понять бермудские свопы и их отличия от опционов, написанных на ценовых уровнях. Допуская одно и то же изменение цены, стоимостная оценка сводится к итерации функции, а путем наложения конкретного допущения о распределении на изменения цены оценка сводится к псевдосуммированию. Понимание, полученное от стопов, может быть использовано для ликвидных опционов на Бермудских островах, и Карр продолжает объяснять оценку однодневных и двухдневных стопов. Однодневные остановки оплачиваются по фиксированному полу, а двухдневные остановки имеют два этажа и могут быть осуществлены либо в первый, либо во второй день.

  • 00:15:00 В этом разделе Питер Карр обсуждает выигрыш в конце второго дня, если упражнение будет выполнено тут же. Известный как u1, он рассчитывается в конце первого дня. Карр отмечает, что, поскольку u1 является известной константой в конце первого дня, ее также можно было бы принять в конце первого дня. Кроме того, Карр предлагает вынести u1 в нулевой момент времени и изменить выигрыш a1 на a1 - u1. Это делает выплату похожей на женатый пут или пут, записанный на u1, где u1 добавляется к выплате пут. Карр объясняет, что, как только модель для оценки ванильного опциона существует, многодневный опцион, в том числе двухдневный, может быть оценен путем расчета встроенного пут.

  • 00:20:00 В этом разделе Питер Карр из Нью-Йоркского университета и Лоренцо Торричелли из Пармского университета обсуждают, как оценивать двухдневные и трехдневные опционы, предполагая, что приросты цен статистически независимы друг от друга и имеют одинаковое распределение. Они используют распространенное в статистике предположение, известное как iid (независимые и одинаково распределенные), для последовательности случайных величин. Чтобы оценить супружеский пут для двухдневного опциона, они используют нотацию, которая включает в себя известную часть платежа, называемую а1, и текущую цену базового актива, называемую а2. Для трехдневного опциона они вводят значение продолжения, которое они обозначают как cv, и используют динамическое программирование для расчета его значения.

  • 00:25:00 Питер Карр объясняет процесс обратной рекурсии и оценку женатого пута. Он начинает со второго дня, потому что все неопределенности, необходимые в задаче, разрешаются к концу второго дня. Он устанавливает значение продолжения на второй день с одной оставшейся возможностью исполнения, то есть на третий день, а затем возвращается к первому дню, чтобы рассчитать значение выплаты и значение продолжения. Затем он возвращается к нулевому моменту времени на дату оценки и вычисляет стоимость продолжения и выплату, которая является стоимостью супружеского пута. Среднее значение случайного выигрыша представляет собой рассчитанное ранее значение супружеского пут, а параметры, влияющие на распределение изменений цен, известны в нулевой момент времени.

  • 00:30:00 В этом разделе Питер Карр обсуждает оценку супружеского пута со страйком A1, основой которого является другой женатый пут со страйком A2. Он объясняет, что эта оценка включает в себя итерацию функции с параметром, который может различаться в разное время, и позволяет функции составить себя. Итерируемая функция представляет собой однодневную ванильную функцию значения put в европейском стиле, и Карр отмечает, что функцию, которая описывает это значение и выполняет итерацию в закрытой форме, можно найти, используя то, что называется ассоциативным функциональным уравнением. Оценивая функцию супружеской стоимости пут напрямую и требуя, чтобы она решала функциональное уравнение ассоциативности, нейтральное к риску распределение может быть определено с использованием результатов Бридена-Литценбергера. Раздел завершается объяснением того, что с помощью функции одного аргумента и обратимого g можно определить женатую стоимость пут.

  • 00:35:00 Питер Карр объясняет концепцию псевдосуммы, которая представляет собой комбинацию двух аргументов в функции. Используя обратимую функцию, это количество можно использовать для нахождения значения варианта на основе n через повторяющиеся псевдосуммы этажей. Чтобы сделать этот метод безарбитражным, функция должна быть тщательно выбрана и представлена как нейтральное к риску ожидание ее выигрыша. Карр показывает, что генератор этого метода должен быть логарифмом любого основания, а скаляр b должен быть положительным. Супружеский пут также должен быть оценен надлежащим образом с использованием обратных значений натурального логарифма g, что требует двойного дифференцирования по отношению к страйку, чтобы получить функцию распределения. В конечном счете, этот метод предполагает использование пропорционального коэффициента b, который не является стандартным отклонением, но пропорционален ему.

  • 00:40:00 Питер Карр обсуждает использование логистического распределения для представления изменений цены в супружеском опционе пут. Он выводит формулу для супружеского пута со страйком a1 и базовым средним значением a2, используя экспоненту финансового продукта с двумя базовыми компонентами. Он называет это псевдосуммой и расширяет набор действительных чисел, включая минус бесконечность в качестве нейтрального элемента. Он объясняет, что это создает коммутативную моноидную структуру, которая возможна только при безарбитражной оценке опционов и симметричном логистическом распределении с экспоненциальными хвостами. Логистическое распределение допускает явную кумулятивную функцию распределения и считается более дружественным, чем нормальное распределение. Карр предполагает, что масштаб логистического распределения является возрастающей функцией времени до погашения опциона.

  • 00:45:00 Питер обсуждает «стопы» — контракт, сочетающий в себе черты опционов и свопов. Остановки включают обмен одной логистической случайной переменной на другую, где переменные независимы и одинаково распределены. Чтобы оценить остановку на n дней, нужно указать функцию b от t, которая связывает ширину логистического распределения с длиной временного горизонта. Стоимость бермудской остановки с этажами определяется простыми формулами, а оценка и хеджирование могут быть выполнены аналитически. Для остановки «при деньгах» стоимость растет простым способом, логарифмом времени.

  • 00:50:00 Питер Карр обсуждает модель ценообразования «остановки», которая предполагает приращение iid и сводит оценку к повторной оценке функции. Предполагая логистическое распределение для общих приращений, модель дополнительно упрощается до псевдосуммы определенного вида, называемой экспоненциальной функцией логарифмической суммы. Цены базовых ценных бумаг должны быть реальными и неотрицательными из-за ограниченной ответственности. Модель можно распространить на акции, переопределив опционный контракт, чтобы умножить относительные цены вместо добавления приращений цены. Результирующее распределение, поддерживающее положительную случайную величину, называется сопряженным степенным числом, которое представляет собой распределение с тяжелым хвостом и отрицательной асимметрией, что делает его хорошим выбором. У этой модели есть возможности для будущих исследований, и ее можно применять для практического использования, например, для синхронизированных контрактов с заседаниями Федеральной резервной системы.

  • 00:55:00 Питер Карр, профессор Нью-Йоркского университета, обсуждает принятие рынком опциона и процесс поиска покупателя и продавца. Он рассказывает о своем разговоре с главным трейдером экзотики из Bank of America, который проявил интерес к покупке опциона, и возможных продавцах, таких как страховая компания или пенсионный план. Процесс усыновления включает в себя поиск покупателя, и Питер рассказывает, что у него запланирован звонок через Zoom с другом, который работает в страховой компании по этому поводу. Разговор заканчивается обсуждением Лоренцо Торричелли финансовых моделей, основанных на логистическом распределении и связанных с ним процессах.

  • 01:00:00 В этом разделе Питер Карр обсуждает технические детали структуры сбора логарифмических доходов положительной модели и доходов в моделях, которые включают логарифмическую логистику, асимметричную логистику и логистические процессы возврата. Он объясняет, что эти процессы являются чисто скачкообразными и могут рассматриваться как бесконечно делимое временное семейство, для которого теорема гарантирует существование аддитивного процесса, стохастически непрерывного с независимыми приращениями. Кроме того, этот аддитивный процесс поддерживает подразумеваемое распределение цен, лежащее в основе формулы распределения ценных бумаг. Затем Карр объясняет, почему этот процесс по своей природе является рынком и как он обладает хорошими желательными свойствами, поддерживающими простые формулы ценообразования. Наконец, он представляет результаты численных тестов и сравнение плотности логистических моделей ценообразования со стандартными нормальными моделями.

  • 01:05:00 Питер Карр обсуждает различия между формой нормального и логистического распределения в модели CPDA. Он отмечает, что в модели CPDA асимметрия и форма распределения меняются со временем, тогда как в обычном мире этого не происходит. Глядя на сравнение между нормальным и логистическим распределением, он утверждает, что распределения очень похожи, но эксцесс можно ясно оценить. Он также показывает результаты своей кумулятивной структуры системы, где он отмечает, что может генерировать гораздо более гибкие формы, такие как взрывной вариант и кратковременное, очень резкое увеличение асимметрии. Наконец, он обсуждает поверхности подразумеваемой волатильности для моделей cpda, где отмечает, что поверхность волатильности может быть гибкой всего с несколькими параметрами.

  • 01:10:00 Питер Карр из Нью-Йоркского университета и Лоренцо Торричелли из Университета Пармы обсуждают предложенную ими модель «остановок», в которой используется сопряженная парадигма и логистическое распределение для создания полностью гибкой временной структуры только с одним параметром. Один параметр одновременно создает большую ширину и большую отрицательную асимметрию, но должен быть между нулем и единицей, чтобы предотвратить отсутствие среднего значения момента. Модель может учитывать любую временную структуру при одном страйке, но не всегда может оптимально соответствовать рынку, поскольку она дает нисходящий график, в отличие от восходящих графиков подразумеваемой волатильности по отношению к страйку. Карр и Торричелли признают, что их модель является альтернативой моделям Блэка-Шоулза и Башелье, но предполагают, что их модель не будет достаточно хороша для каждой ситуации. Они утверждают, что существует бесчисленное множество бинарных операций с такими же свойствами, как сложение и умножение, которые имеют особое значение для финансов, и их модель призвана отразить.

  • 01:15:00 В этом разделе Питер Карр и Лоренцо Торричелли обсуждают идею факультативности между забастовкой и одиночной, как европейский опцион, а также повторяющуюся факультативность в виде повторного псевдосуммирования, что является опцией Бермудских ремутантов. Они упоминают о важности помнить о том, что при выборе дистрибутива существует более двух соотношений бинарных операций, и заканчивают обсуждение, благодаря друг друга и с нетерпением ожидая посещения семинаров друг друга.
 

Лоренцо Торричелли (Университет Пармы) – «Аддитивные логистические процессы в ценообразовании опционов»



Лоренцо Торричелли (Университет Пармы) – «Аддитивные логистические процессы в ценообразовании опционов»

Лоренцо Торричелли, выдающийся профессор Университета Пармы, углубляется в тонкости ценообразования опционов, исследуя аддитивную логистическую модель и самоподобную спецификацию. В своей поучительной презентации он разъясняет формулу ценообразования ванильных опционов с использованием этих инновационных моделей и иллюстрирует их применение, демонстрируя сравнение плотности между логистической моделью ценообразования и традиционными нормальными моделями.

Кроме того, Торричелли проводит сравнительный анализ кумулятивной временной структуры для логистической модели в сравнении с линейной революцией временной структуры для однородных моделей. Его проницательные наблюдения показывают, что логистическая модель предлагает значительно большую гибкость в формировании структуры терминов, что обеспечивает заметное преимущество по сравнению с традиционными подходами.

Чтобы обеспечить всестороннее понимание, Торричелли также исследует поверхности волатильности, связанные с этими моделями. Он отмечает наличие положительной асимметрии в модели, возникающей из-за асимметричного распределения логарифмических возвратов и эксцесса логистического распределения. Однако он подчеркивает отсутствие перекоса в самом логистическом распределении, поскольку оно демонстрирует симметрию. Далее Торричелли обсуждает влияние модальных параметров на временную структуру волатильности, признавая потенциал для улучшения выбранной параметризации.

В заключение Торричелли подчеркивает, что формулы опционов, полученные из этих моделей, являются явными и хорошо известными, что облегчает их практическую реализацию. В частности, он высоко оценивает впечатляющую скорость, продемонстрированную во время теста производительности. В качестве свидетельства прозрачности и академического сотрудничества Торричелли планирует сделать код, связанный с этими моделями, общедоступным, что принесет пользу как исследователям, так и практикам.

  • 00:00:00 Лоренцо Торричелли из Университета Пармы представляет финансовые модели, основанные на распределении логистики, начиная с уравнений оценки для опционных функционалов и функций для оценки киоска по заслугам. Взяв производную по k, можно получить подразумеваемое распределение цены ценной бумаги, и видно, что логистическая функция связана с реальным ценным базовым активом, в то время как асимметричное логистическое распределение связано с процессом положительной цены, возникающим в результате оценки пут-пут. . Бесконечно делимая структура распределений рассматривается как временное семейство, и проверяется существование аддитивного процесса, приводящего к стохастически непрерывным процессам с независимыми приращениями, которые поддерживают подразумеваемое ценовое распределение и определяют формулу утверждения.

  • 00:05:00 Лоренцо Торричелли, профессор Университета Пармы, обсуждает аддитивную логистическую модель и самоподобную спецификацию в ценообразовании опционов. Он объясняет формулу ценообразования ванильных опционов с помощью моделей и конкретизирует их с точки зрения цены функции термина. Он показывает сравнение плотности между логистической моделью ценообразования и нормальными моделями и отмечает, что форма распределения логистической модели меняется со временем, а форма нормального распределения - нет. Он также сравнивает кумулятивную временную структуру для логистической модели с линейной революцией временной структуры для однородных моделей и наблюдает гораздо более гибкие формы с первой.

  • 00:10:00 Лоренцо Торричелли обсуждает графики для модели CPDA и поверхности подразумеваемой волатильности для моделей SLA и CPDA. Поверхности волатильности показывают, что в положительной модели имеется перекос из-за перекоса распределения логарифмических доходов и эксцесса логистического распределения. Однако в логистическом распределении нет перекоса, поскольку оно симметрично. Торричелли отмечает, что модальные параметры также аналогичным образом влияют на временную структуру волатильности и что есть возможности для улучшения выбранной параметризации. В целом, формулы опционов явные и известные, а тест скорости прошел очень быстро. Код также будет обнародован.
 

Сильвия Руис (Cornell MFE '20): «Как предсказывать движение акций с помощью методов NLP»



Сильвия Руис (Cornell MFE '20): «Как предсказывать движение акций с помощью методов NLP»

Сильвия Руис, недавняя выпускница программы Cornell MFE, делится своими мыслями о своем проекте, посвященном прогнозированию цен на акции с использованием методов NLP(обработки естественного языка). Цель исследования ее группы состояла в том, чтобы изучить взаимосвязь между корпоративными документами, такими как отчеты 10-K и 10-Q, и их последующее влияние на цены акций. Для этого они собрали значительный набор данных, состоящий из 1095 отчетов с веб-сайта EDGAR, охватывающих 50 компаний из пяти секторов S&P 500.

Первоначально Руиз и ее команда экспериментировали с моделями на основе словарей, но столкнулись с ограничениями их эффективности. Чтобы решить эту проблему, они внедрили передовые методы, такие как модель word to back и Finberg, которые оказались решающими для понимания контекстуальных нюансов, заложенных в корпоративных документах. Кроме того, они использовали различные меры настроений, включая полярность и сложность слов, а также модель повышения xg для прогнозирования движения цен на акции.

Точность их прогнозов оценивалась в двух разных временных рамках. В краткосрочной перспективе их модель достигла замечательной точности в 61%, а в долгосрочной перспективе она продемонстрировала респектабельную точность в 53%. Используя эти прогнозы как сигналы для инвестиционных решений, они превзошли портфель с таким же весом. Тем не менее, Руис подчеркивает необходимость дальнейших исследований в различных секторах, чтобы повысить точность и обобщаемость их результатов.

Сильвия Руис завершает обсуждение, щедро предлагая свою контактную информацию и предоставляя ссылку на репозиторий своего проекта на Github. Этот жест поощряет последующие запросы и способствует сотрудничеству в продвижении понимания и применения методов НЛП в области прогнозирования цен на акции.

  • 00:00:00 Сильвия Руис, недавняя выпускница Корнеллского университета MFE, рассказывает о своем проекте о том, можно ли предсказать цены акций с помощью методов НЛП. Сильвия и ее команда стремились исследовать влияние корпоративных заявок, таких как 10k и 10q, на цены акций компании, и собрали данные 1095 отчетов с веб-сайта edgar о 50 компаниях S&P 500 из пяти секторов. Они обнаружили, что использование моделей на основе словаря неэффективно и требует использования методов слова для поддержки модели и Финберга для понимания контекста. Наконец, они использовали различные меры настроений, в том числе полярность и сложность слов, и запустили модель повышения xg с переменной прогнозирования цен на акции.

  • 00:05:00 Сильвия Руис объясняет, как она пыталась предсказать движение акций с помощью методов НЛП. Она упоминает, что ее команда учитывала рыночную доходность, взяв цены акций до публикации отчета и через пять дней после нее, сравнивая их с рыночной доходностью. Долгосрочная краткосрочная точность составила 61%, а долгосрочная — 53%, и они использовали свои прогнозы как сигналы для инвестирования в акции. Их стратегия оказалась более эффективной, чем портфель с одинаковым весом, но для получения более точных результатов необходимы дальнейшие исследования, особенно в различных секторах. Она делится своей контактной информацией и ссылкой на Github для дальнейших запросов.
 

Юмэн Дин (Cornell MFE '20) - "Интерпретация моделей машинного обучения"



Юмэн Дин (Cornell MFE '20) - "Интерпретация моделей машинного обучения"

Юмэн Дин, опытный исследователь, углубляется в область интерпретации моделей машинного обучения для прогнозирования цен на акции. В своем всестороннем анализе она исследует ряд методов интерпретации, включая графики частичной зависимости, важность признаков перестановки, граничную статистику и LIME, чтобы пролить свет на внутреннюю работу этих моделей. Используя эти методы, Дин стремится выявить вклад отдельных факторов и их взаимодействий в прогнозирование цен на акции.

Исследование Дина вращается вокруг трех типов факторов: технических, качественных и стоимостных, которые используются в качестве входных данных для различных моделей машинного обучения, таких как классификаторы и регрессии. Используя методы интерпретации, упомянутые ранее, она распутывает сложные взаимосвязи между этими факторами и прогнозами цен на акции. Благодаря тщательному тестированию на исторических данных Дин обнаруживает, что нелинейные модели превосходят линейные модели с точки зрения производительности. Кроме того, она отмечает, что влияние различных факторов подвержено временным вариациям, что подчеркивает динамическую природу прогнозирования цен на акции. В конечном счете, Дин определяет AdaBoost как наиболее подходящую модель для своего конкретного сценария.

Важно отметить, что Дин подчеркивает важность методов интерпретируемости для понимания моделей машинного обучения. Она подчеркивает, что, хотя векторный подход обеспечивает быстрое понимание наиболее предсказуемых взаимодействий, он не позволяет выявить качество этих взаимодействий. Дин подчеркивает важность использования двумерных графиков частичной зависимости для эффективной визуализации более простых взаимодействий. Кроме того, она рекомендует метод линейного графика для углубления в тонкости индивидуальных взаимодействий и визуализации локальных эффектов, если данные достаточно свободны от шума.

Подводя итоги своих выводов, Дин подчеркивает два ключевых вывода из своего проекта. Во-первых, она подтверждает, что модели машинного обучения превосходят линейные наивные регрессии в большинстве сценариев благодаря их способности фиксировать сложные эффекты взаимодействия. Во-вторых, она подчеркивает возможность интерпретации моделей машинного обучения, используя различные методы интерпретации. Эти методы позволяют исследователям выяснить вклад отдельных факторов и понять их интерактивное влияние на прогнозы.

  • 00:00:00 Юмэн Дин рассказывает об их подходе к интерпретации моделей машинного обучения, используемых для прогнозирования цен на акции. Они использовали три типа факторов: технические, качественные и стоимостные, чтобы делать прогнозы с использованием различных моделей машинного обучения, таких как классификаторы и регрессии. Для интерпретации своих моделей они использовали методы интерпретируемости, такие как графики частичной зависимости, важность признаков перестановки, граничную статистику и LIME, которые позволили разбить эффекты отдельных признаков и их взаимодействия. В ходе обратного тестирования они обнаружили, что нелинейные модели превосходят линейные модели, а влияние факторов со временем меняется. Они пришли к выводу, что AdaBoost — лучшая модель для их сценария.

  • 00:05:00 Юмэн Дин обсуждает различные методы интерпретации моделей машинного обучения. Она подчеркивает, что, хотя векторный подход позволяет быстро и эффективно находить наиболее предсказуемые взаимодействия, он показывает только силу, а не качество взаимодействий. Она подчеркивает, что двумерная частичная зависимость необходима для визуализации некоторых простых взаимодействий. Дин предполагает, что метод линейного графика подходит для детального изучения отдельных взаимодействий и визуализации локальных взаимодействий при условии, что данные не слишком зашумлены. В заключение она отмечает, что их проект подчеркивает два вывода: во-первых, модели машинного обучения превосходят линейные наивные регрессии в большинстве сценариев благодаря их способности фиксировать эффекты взаимодействия. Во-вторых, интерпретация моделей машинного обучения возможна с помощью различных доступных методов интерпретации, которые позволяют нам объяснить, как отдельные факторы влияют на прогнозы как индивидуально, так и интерактивно.
 

Шарль-Альберт Лехалль: «Попытка понять обработку естественного языка»



Шарль-Альберт Лехалль: «Попытка понять обработку естественного языка»

В этой видео-презентации Чарльз-Альберт Лехалле и его команда углубляются в применение обработки естественного языка (NLP) в финансовой сфере. Их обсуждение вращается вокруг трех ключевых областей: анализ настроений, прогнозирование цен на акции и моделирование транзакционных издержек. Они признают проблемы, связанные с НЛП, такие как риск переобучения и предвзятости при встраивании, и предлагают возможные решения, включая многозадачное обучение и расширение словарного запаса. Команда исследует как потенциал, так и ограничения НЛП в финансовой индустрии, подчеркивая важность понимания контекста и языковых моделей в разных секторах.

Лехалле и его команда представляют свои собственные эксперименты с использованием методов НЛП, предоставляя ценную информацию о том, как НЛП может сжимать информацию и предлагать информативные индикаторы для финансовых аналитиков. Они подчеркивают проблемы использования NLP в финансах, в том числе требования к предметно-ориентированным знаниям и сложность извлечения значимой информации из неструктурированных текстовых данных. Также обсуждаются этические проблемы, связанные с использованием NLP в финансах, такие как использование данных социальных сетей для торговых целей.

На протяжении всей презентации Чарльз-Альберт Лехалле делится своим опытом и знаниями по различным темам НЛП. Он объясняет использование методов НЛП на основе лексики и встраивания в финансах, предлагая комбинацию обоих подходов для захвата лексических и вероятностных признаков в текстовых данных. Проблемы различения синонимов и антонимов во вложениях решаются, и команда Лехалле исследует генеративные модели для управления структурой и настроением текста. Подчеркивается важность понимания вложений и эталонных моделей, таких как матрицы, представляющие общие распределения слов.

Лехалле далее исследует значение контекста в НЛП, обсуждая, как вложения могут быть смещены для положительных и отрицательных слов в зависимости от контекста. Он объясняет использование цепей Маркова для структурирования эталонных матричных моделей и представляет эксперименты по выявлению синонимов во вложениях. Признаются ограничения НЛП в захвате названий компаний и связанных с ними полярностей, а также предложение многозадачного обучения для контролируемых вложений. Спикеры также коснулись дисбаланса положительных и отрицательных слов в лексиконе Лограна-Макдональда и проблем обработки иронии в финансовых текстах.

Презентация завершается обзором проекта Сильвии Руис, недавней выпускницы Корнеллского финансового инжиниринга. Проект фокусируется на прогнозировании цен на акции с использованием методов НЛП, в частности путем извлечения разделов обсуждения руководства из документов 10-K и 10-Q 50 компаний S&P 500 и анализа настроений для оценки их влияния на цены акций. Лехалле обсуждает ограничения моделей на основе словаря и объясняет, как их команда расширила словарь, использовала FinBERT для понимания контекста и использовала различные функции для измерения настроений. Они достигли лучших результатов, чем портфель с одинаковым весом, как в краткосрочной, так и в долгосрочной перспективе.

Таким образом, Чарльз-Альберт Лехалле и его команда пролили свет на потенциал и проблемы НЛП в финансах. Они предлагают идеи, эксперименты и стратегии для эффективного применения методов НЛП, подчеркивая при этом важность ответственного использования и глубокого понимания как технологии, так и финансовой области.

  • 00:00:00 Спикер представляет Шарля-Альберта Лехалле, эксперта по квантовым финансам, который проводит 40-минутную презентацию по НЛП. Докладчик упоминает прошлые публикации Лехалле по квантовым финансам, которые охватывают несколько тем НЛП. Спикер также представляет Сильвию Руис, которая недавно окончила Корнелл и работала над проектом НЛП в Rebellion Research. Доклад направлен на то, чтобы помочь людям начать работу с NLP, который часто может показаться пугающим из-за необходимости очистки данных и применения пакетов. Докладчик вкратце касается использования НЛП в финансах и упоминает, что команда Лехалле использует НЛП уже более года, а некоторые предикторы и стратегии находятся в разработке. Выступление основано на текущей работе Менгедара, и спикер призывает аудиторию присылать ссылки или документы, которые, по их мнению, должны быть включены в презентацию.

  • 00:05:00 Шарль-Альберт Лехалль обсуждает возможности использования обработки естественного языка (NLP) в финансовой торговле. Используя НЛП, трейдеры могут быстро получать доступ к информации в текстовой форме, такой как стенограммы объявлений о доходах, социальные сети и финансовые новости. Эта информация может дать трейдерам преимущество в скорости покупки перед другими и, таким образом, сдвинуть цену вверх. Кроме того, трейдеры могут использовать НЛП для анализа большого количества текстов о многих компаниях и ранжирования их на основе ожидаемой доходности. Однако Лехалле отмечает, что НЛП имеет высокий риск перекармливания из-за количества возможных параметров. Тем не менее, понимая полученную информацию, трейдеры могут соответствующим образом корректировать свои стратегии для получения потенциальной прибыли.

  • 00:10:00 Чарльз-Альберт Лехалле обсуждает использование методов обработки естественного языка (NLP) на основе лексики и встраивания в финансах. Он объясняет, как системы на основе лексики строятся аналитиками-людьми, которые аннотируют большое количество текста, чтобы определить положительное или отрицательное отношение к акциям, тогда как системы на основе встраивания моделируют вероятностный контекст слов. Лехалле предлагает объединить эти два метода, чтобы уловить как лексические, так и вероятностные характеристики текстовых данных на финансовых рынках. Он также излагает свой подход к изучению того, как встраивания могут фиксировать синонимы и антонимы, что может иметь практическое значение для прогнозного анализа в финансах.

  • 00:15:00 В этом разделе Чарльз-Альберт Лехалль обсуждает проблемы, связанные с обработкой естественного языка (НЛП). В то время как захват синонимов может уменьшить сложность текста, встраивания могут иметь трудности с различением синонимов и антонимов. Это создает проблему, если вы хотите внедрить свой лексикон в систему, которая не может различать их. Команда Лехалле пытается разработать генеративную модель текста, чтобы контролировать структуру текста и настроения и посмотреть, смогут ли они восстановить то, что они вложили в язык. Они планируют использовать большой массив финансовых новостей, чтобы применить эти методы и проанализировать, как они работают. Теоретические аспекты этого процесса включают использование метода ключевых диаграмм слова 2x и стохастической матрицы.

  • 00:20:00 В этом разделе Чарльз-Альберт Лехалле объясняет обработку естественного языка с помощью модели word2vec с пропуском грамма. Он обсуждает низкоранговую декомпозицию матрицы для встраивания и то, как ее можно переписать в виде нейронной сети с мягким максимальным выходом. Он также объясняет, почему заголовки внимания в таких моделях, как BERT, являются более локальными, с большим количеством локальных вложений, обращающихся к контексту. Он подчеркивает важность понимания вложений и эталонной модели, которая представляет собой большую скрытую матрицу, используемую для оптимизации функции потерь.

  • 00:25:00 Шарль-Альберт Лехалль объясняет концепцию эталонных моделей в обработке естественного языка. Он обсуждает различные типы эталонных моделей, в том числе большую матрицу, представляющую совместное распределение всех слов, статистическую оценку истинной эталонной модели и скрытую эталонную модель, сгенерировавшую текст. Он также говорит о частотных синонимах, то есть словах, которые имеют одинаковое вложение, даже если они являются антонимами с семантической точки зрения, из-за их частого появления в одном и том же месте в корпусе. Это понимание важно при обсуждении этики обработки естественного языка.

  • 00:30:00 В этом разделе Лехалле обсуждает важность контекста в обработке естественного языка и приводит примеры того, как вложения могут быть смещены для положительных и отрицательных слов в зависимости от контекста. Он также объясняет, как создание корпуса с использованием цепи Маркова может помочь структурировать модель большой эталонной матрицы для слов и как функция потерь для правильного встраивания слова представляет собой перекрестную энтропию между двумя распределениями. Первый представленный эксперимент включает разработку синтетических языков с синонимами и попытку восстановить синонимы в виде блоков во вложениях. Однако оказалось, что вложения плохо идентифицируемы, что затрудняет восстановление пространства низкой размерности из большого вложения. Наконец, вычисляется косинусное сходство между вложениями синонимов.

  • 00:35:00 Чарльз-Альберт Лехалле обсуждает использование микролексикона Lung Hand Micro Lexicon для обучения встраиваниям различать положительные и отрицательные заголовки финансовых новостей. Он отмечает, что встраивания не предназначены для различения синонимов, которые часто встречаются вместе, например слов в заголовках, поэтому использование вложений в заголовках для определения положительных и отрицательных слов является сложной задачей. Однако при просмотре свода финансовых новостей с течением времени метрики косинусного сходства показывают, что положительные и отрицательные слова четко отличаются друг от друга. Лехалле также показывает, что названия компаний, например банков, во время финансового кризиса ближе к отрицательным словам, чем к положительным. В целом, расположение словарного запаса во вложениях сильно влияет на их способность различать положительные и отрицательные слова в финансовых новостях.

  • 00:40:00 Спикер Чарльз-Альберт Лехалле обсуждает ограничения обработки естественного языка (NLP), когда речь идет о названиях компаний и связанных с ними полярностях, а также о нестационарности вложений. Он предполагает, что встраивания сосредоточены на определении приоритетов распределения соседних слов, что затрудняет для них различие между частотами и синонимами. Далее Лехалле предполагает, что многозадачное обучение, обучение встраиваниям одновременно с задачей, контролируемой поляризованным словарем, может быть хорошей идеей. Кроме того, он отмечает, что названия компаний могут быть полезным индикатором репутации, и что новости, созданные НЛП, вызывают большую озабоченность, чем компании, пытающиеся обмануть алгоритмы НЛП. Наконец, он объясняет, что алгоритмы НЛП потенциально могут использоваться для извлечения информации и присвоения ей нового значения, что позволяет выводить оценки аналитиков, а не цены.

  • 00:45:00 В этом разделе видео спикеры обсуждают дисбаланс отрицательных и положительных слов в лексиконе Лофрана-Макдональда, который был создан людьми и используется в обработке естественного языка (NLP) для финансового анализа текстов. Они предполагают, что дисбаланс может быть связан с юридическим и структурированным характером финансовых документов, написанных юристами, которые, как правило, защищают. Спикеры также коснулись использования НЛП в моделировании транзакционных издержек и проблем обработки иронии в длинных финансовых текстах. Затем они представляют Сильвию Руис, недавнюю выпускницу программы финансового инжиниринга Корнелла, которая представляет проект своей команды по прогнозированию цен на акции с использованием методов НЛП. Проект был сосредоточен на извлечении разделов обсуждения руководства из документов 10K и 10Q 50 компаний из S&P 500 и анализе настроений для определения влияния на цены акций.

  • 00:50:00 Чарльз-Альберт Лехалль обсуждает проблемы с использованием моделей на основе словаря для обработки естественного языка (НЛП) и то, как он и его команда использовали методы НЛП для улучшения своих моделей. Он объясняет, как они расширили свой словарь, чтобы иметь более сбалансированную классификацию слов, используя модель скипграммы и модель FinBERT для понимания контекста. Затем они использовали различные функции для измерения тональности и сложности слов, прежде чем запустить модель повышения xg, чтобы предсказать, будет ли цена акций расти или падать. Хотя их точность была относительно низкой, они смогли создать стратегию, которая работала лучше, чем портфель с одинаковым весом, как в краткосрочной, так и в долгосрочной перспективе.

  • 00:55:00 Шарль-Альберт Лехалль обсуждает потенциал обработки естественного языка (NLP) в финансовой индустрии. Он предполагает, что необходимы дополнительные исследования и что может быть полезно разделить отрасль на секторы, потому что каждый сектор имеет свою языковую модель. Кроме того, он советует не пытаться одновременно понимать текст и предсказывать такие вещи, как ожидания, поскольку НЛП лучше использовать для сжатия информации и предоставления информативных индикаторов. Вместо этого аналитики могут использовать свои собственные рассуждения, чтобы сравнить прогнозы с ожиданиями и создать «неожиданный предсказатель». В целом Лехалле подчеркивает необходимость понимания ограничений и сильных сторон НЛП, прежде чем пытаться интегрировать его в финансовый анализ.

  • 01:00:00 В этом разделе спикеры обсуждают использование состязательного обучения для моделей НЛП для повышения их надежности. Этот метод можно применять для устранения языковых предрассудков, таких как гендерная нейтральность. Выступающие также рассматривают возможность использования состязательного обучения для нарушения нейтральности между положительными и отрицательными словами, но предупреждают, что это может не подходить для построения торговых стратегий. Затем обсуждение переходит к проблемам извлечения разделов из финансовых документов, таких как 10K файлов, из-за различий в том, как компании маркируют и форматируют свои разделы.

  • 01:00:00 Спикеры обсуждают использование состязательного обучения моделей НЛП для повышения их надежности. Этот метод можно применять для устранения языковых предрассудков, таких как гендерная нейтральность. Выступающие также рассматривают возможность использования состязательного обучения для нарушения нейтральности между положительными и отрицательными словами, но предупреждают, что это может не подходить для построения торговых стратегий. Затем обсуждение переходит к проблемам извлечения разделов из финансовых документов, таких как 10K файлов, из-за различий в том, как компании маркируют и форматируют свои разделы.

  • 01:05:00 В этом разделе видео Чарльз-Альберт Лехалль объясняет, что он не сравнивал свои собственные вложения и индекс настроений Bloomberg, поскольку это не было целью исследования. Он считает, что предикторы Bloomberg, вероятно, пытаются создавать предикторы, а не индексы, с которыми трудно сравнивать. Он сообщает, что есть статьи о построении эмпирических факторов оценки активов с использованием НЛП, и объясняет, что НЛП можно использовать для создания многочисленных факторов на основе информации, содержащейся в корпусе, например, фактор 10k или фактор раздела риска. Поэтому НЛП — это всего лишь техника, а корпус — самый важный фактор в данном случае.
 

Vineel Yellapantula (Cornell MFE '20): "Количественная оценка текста в документах SEC"



Винил Йеллапантула (Cornell MFE '20): «Количественная оценка текста в документах SEC»

Винил Йеллапантула представляет свой летний проект, который включает в себя применение методов обработки естественного языка (NLP) для торговли акциями на основе текстовой информации, содержащейся в документах SEC, особенно в разделе MD&A. Цель проекта состоит в том, чтобы присвоить оценку каждому отчету по 430 акциям, присутствующим на рынке США, и проанализировать их эффективность, сгруппировав их в пять квантилей на основе оценки. Yellapantula использует традиционные методы, такие как косинус и сходство Жаккара, для определения оценки сходства между текстами, при этом сходство Жаккара со временем становится более постоянным. Он также исследует создание модели анализа настроений с использованием рекуррентных нейронных сетей (RNN) с Keras в наборе текстовых данных, достигнув впечатляющей точности 87,5% с помощью своей модели.

Во время презентации Yellapantula подчеркивает важность выбора подходящего метода для каждой конкретной проблемы и включения дополнительных данных для улучшения результатов. Он подчеркивает обилие информации, доступной в текстовых данных, особенно в заявках 10-K, и упоминает, что факторы, разработанные с использованием предыдущих документов, могут быть более эффективными, чем факторы, основанные исключительно на настоящем документе. Йеллапантула указывает на различные альтернативы использованию методов глубокого обучения с текстовыми данными, включая перчатки, word2vec, BERT и RNN. Он также предлагает включить больше источников данных, таких как документы 8-K и новостные циклы, чтобы повысить прогностическую силу моделей. Тем не менее, он признает наличие предвзятости в своем исследовании, поскольку оно сосредоточено на хорошо работающих акциях, представленных в индексе с 2007 по 2020 год.

В разделе, посвященном анализу настроений, Йеллапантула объясняет процесс создания модели с использованием RNN с помощью Keras. Эти шаги включают в себя токенизацию текста, чтобы понять его значение, уменьшение размерности за счет встраивания и использование слоя LSTM и плотного слоя с сигмоидной функцией для классификации настроений. Он демонстрирует применение этого подхода, используя обзоры IMDB, ограничивая длину обзора до 500 слов и дополняя более короткие обзоры нулями для обеспечения согласованности. Благодаря тщательной оценке Йеллапантула достигает уровня точности 87,5% с помощью своей модели анализа настроений.

Кроме того, Yellapantula подчеркивает важность корреляции информации в определении эффективности факторов и их постоянства во времени. Он ссылается на исследование, которое предполагает, что компании со стабильной отчетностью, как правило, работают хорошо, указывая на это как на многообещающий фактор для изучения. В заключение Yellapantula выражает благодарность аудитории за проявленный интерес и надеется на дальнейшее сотрудничество в будущем.

Проект Винила Йеллапантулы демонстрирует применение методов НЛП для извлечения ценных сведений из текстовой информации в файлах SEC. Присваивая баллы отчетам и анализируя их эффективность, его работа способствует пониманию того, как язык может влиять на торговлю акциями. Более того, его исследование анализа настроений с использованием RNN демонстрирует потенциал глубокого обучения в улавливании настроений из текстовых данных. Благодаря тщательному выбору методологии и включению дополнительных источников данных Yellapantula подчеркивает возможность повышения точности и эффективности таких моделей.

  • 00:00:00 В этом разделе Винил Йеллапантула описывает свой летний проект, который включал использование методов обработки естественного языка (NLP) для торговли акциями на основе текстовой информации, представленной в документах SEC, в частности, в разделе MD&A. Проект был сосредоточен на поиске оценки для каждого отчета по 430 акциям, представленным на рынке США, и анализе их эффективности после их группировки в пять квантилей на основе оценки. Винил использовал традиционные методы, такие как косинус и сходство жаккарда, чтобы найти оценку сходства между текстами, при этом сходство жаккарда со временем оказалось более постоянным. Винил также упоминает, что для этой цели можно использовать методы глубокого обучения, такие как RNN.

  • 00:05:00 В этом разделе Винил Йеллапантула объясняет, как создать модель анализа тональности с помощью рекуррентных нейронных сетей (RNN) с keras в текстовом наборе данных. Процесс включает в себя токенизацию текста, чтобы понять его значение, уменьшение размерности с помощью встраивания, а затем использование слоя LSTM и плотного слоя с сигмовидной функцией для классификации тональности текста. Винил показывает, как он обрабатывал данные, используя обзоры IMDB, ограничивая длину обзоров до 500 слов и дополняя более короткие отзывы нулями, чтобы сохранить постоянство длины. Он смог достичь точности 87,5% со своей моделью.

  • 00:10:00 В этом разделе видео Винил Йеллапантула обсуждает обилие информации, доступной через текстовые данные, особенно в файлах 10-K. Он отмечает, что многие факторы могут быть разработаны с помощью этих заявок, и факторы, которые используют предыдущие документы, могут быть более эффективными, чем те, которые сосредоточены исключительно на настоящем документе. Кроме того, Йеллапантула указывает, что существуют различные альтернативы использованию глубокого обучения с текстовыми данными, такие как перчатка, word2vec, BERT и RNN. Он подчеркивает, что выбор правильного метода для конкретной проблемы имеет решающее значение, а включение большего количества данных, таких как файлы 8-K и новостные циклы, может привести к лучшим результатам. Наконец, Йеллапантула признает, что в его исследовании есть некоторая предвзятость, поскольку он сосредоточился на хорошо работающих акциях, представленных в индексе с 2007 по 2020 год.

  • 00:15:00 В этом разделе Винил Йеллапантула обсуждает важность корреляции информации для определения того, работает фактор или нет, а также постоянство факторов во времени. Он также упоминает исследование, которое показало, что компании со стабильной отчетностью работают хорошо, указывая на то, что это хороший фактор для изучения. В заключение он поблагодарил публику за интерес и с нетерпением ждет встречи с ними осенью.