Quantitative trading - страница 6

 

Эрнест Чан (Predictnow.ai) — «Как использовать машинное обучение для оптимизации»



Эрнест Чан (Predictnow.ai) — «Как использовать машинное обучение для оптимизации»

Эрнест Чан, соучредитель Predictnow.ai, вникает в проблемы, с которыми сталкиваются традиционные методы оптимизации портфеля при изменении режима на рынках. Он предполагает, что машинное обучение может обеспечить решение этой проблемы. Чан объясняет, как его команда применяет методы машинного обучения для оптимизации портфеля, уделяя особое внимание включению функций временных рядов, которые измеряют различные финансовые аспекты, такие как волатильность, цены и процентные ставки. Сочетая трехфакторную модель Farmer-French с пониманием того, что ранжирование важнее, чем предсказание, они стремятся достичь оптимальной оптимизации портфеля.

Далее Чан делится конкретными результатами эффективности модели CBO и приводит примеры клиентов, которые добились улучшения эффективности своего портфеля с помощью этого подхода. Он подчеркивает, что модели машинного обучения способны адаптироваться к изменениям режима, что позволяет им эффективно реагировать на меняющиеся рыночные условия. Кроме того, он обсуждает, как можно рассчитать доходность индекса S&P 500 и его компонентов с помощью алгоритма машинного обучения, использующего функции временных рядов.

Кроме того, Чан выделяет комплексный подход, используемый его командой для оптимизации и спекуляции. Он упоминает их «секретный соус», который устраняет необходимость в больших вычислительных мощностях. Вместо того, чтобы следовать двухэтапному процессу прогнозирования режимов и обусловливания их распределения доходности, они используют визуальные факторы для прямого прогнозирования эффективности портфеля. Более того, Чан поясняет, что при включении значительной части обучающей выборки в их алгоритм ожидаемая отдача согласуется с прошлыми результатами.

Доктор Эрнест Чен объясняет проблемы, с которыми сталкиваются традиционные методы оптимизации портфеля при изменении режима, и подчеркивает роль машинного обучения в решении этой проблемы. Он обсуждает применение методов машинного обучения, важность характеристик временных рядов и значение ранжирования для достижения оптимальной оптимизации портфеля. Он делится конкретными результатами и историями успеха клиентов, подчеркивая адаптируемость моделей машинного обучения к изменяющимся рыночным условиям. Чан также дает представление о вычислении доходности с использованием алгоритмов машинного обучения и проливает свет на их ансамблевый подход и уникальную методологию.

  • 00:00:00 В этом разделе Эрнест Чен обсуждает традиционные методы оптимизации портфеля и проблему изменения режима на рынке, что означает, что портфель, который был оптимальным в прошлом, может не быть оптимальным в будущем. Он объясняет, что большинство методов используют прошлые исторические доходы или информацию в качестве исходных данных и не принимают во внимание изменения режима. Он предполагает, что машинное обучение может помочь решить эту проблему, используя большие данные и все переменные, наблюдаемые на разных рынках. Машинное обучение может генерировать ожидаемую отдачу, которая основана не только на исторической отдаче, и поэтому может лучше подходить для борьбы с изменениями режима.

  • 00:05:00 В этом разделе Эрнест Чен обсуждает концепцию режима в финансах и то, как он влияет на оптимизацию. Он объясняет, что, хотя существуют некоторые возможные режимы, такие как медвежий или бычий рынок, существуют также скрытые режимы, которые невозможно определить явно и которые постоянно меняются. Эти режимы трудно предсказуемы и разрушают классические методы оптимизации. Это понимание привело доктора Чена к разработке метода условной оптимизации портфеля, который может измерять и адаптировать текущий режим с использованием большого количества переменных. Этот метод может улучшить эффективность торговой стратегии в различных рыночных условиях.

  • 00:10:00 В этом разделе Эрнест Чен обсуждает использование машинного обучения для оптимизации и способы адаптации параметров с помощью обучения с учителем. Он объясняет, что в обучении с учителем существует помеченная целевая переменная, такая как параметр, который необходимо оптимизировать, который представляет собой резкое соотношение или будущую доходность торговой стратегии за один месяц. Входные данные представляют собой комбинацию рыночных и макроэкономических переменных, которые измеряют текущий режим, и контрольных переменных, которые трейдер может настроить, образуя большой набор данных. Для оптимизации проводится исчерпывающий перебор различных комбинаций параметров для нахождения максимального резкого соотношения, что и является оптимизацией условного параметра. В заключение Эрнест Чен приводит простой пример с игрушечной стратегией, которая иллюстрирует сочетание рыночных и контрольных функций для формирования одной строки ввода.

  • 00:15:00 В этом разделе Эрнест Чан объясняет, как его команда применяет машинное обучение для оптимизации портфеля. Команда использует тот же подход машинного обучения, который они применяли для оптимизации параметров, чтобы решить эту более сложную проблему. Они используют большие данные в качестве входных данных и неявного предсказания скрытых режимов. В отличие от классических методов оптимизации портфеля, которые полагаются исключительно на прошлую доходность и ковариацию доходности в качестве входных данных, их метод учитывает текущее состояние рынка, технические и фундаментальные индикаторы, а также макроэкономические индикаторы, чтобы адаптироваться к режиму и найти портфель, оптимальный в текущих условиях. состояние рынка. Команда отвечает на вопросы из вопросов и ответов, объясняя, что они используют не моделирование, а реальные рыночные данные для расчета доходности с учетом конкретного гипотетического распределения капитала.

  • 00:20:00 В этом разделе Эрнест Чен объясняет тип функций, используемых в оптимизации портфеля с помощью машинного обучения. Он подчеркивает, что используются только функции временных рядов и никакие характеристики поперечного сечения не используются. Этот метод фокусируется на характеристиках портфеля или рыночного режима в целом, таких как факторы, измеряющие финансы, волатильность, цены и процентные ставки. Хотя это может показаться странным, Чан связывает это с объяснительным качеством трехфакторной модели фермера-француза. Используя модели машинного обучения, цель состоит не в том, чтобы предсказать доходность, а в том, чтобы точно ранжировать ее для достижения оптимальной оптимизации портфеля.

  • 00:25:00 В этом разделе Эрнест Чен обсуждает важность ранжирования в финансовых приложениях и то, как его можно применять для оптимизации портфеля. Он объясняет, что традиционные методы использования моделей машинного обучения для прогнозирования перекрестной доходности могут привести к ситуации «мусор на входе и выходе», если прогнозы доходности неточны по величине и знаку. Однако с помощью метода CPO, который сочетает в себе модель фактора Фамы-Френча и представление о том, что ранжирование важнее прогнозирования, оптимальное решение гораздо более устойчиво к ошибкам на любом этапе программы. Он также отмечает, что этот метод может допускать огромные ошибки в прогнозировании машинного обучения из-за ранжирования.

  • 00:30:00 В этом разделе Эрнест Чен обсуждает, как эффект поведенческих финансов может быть измерен с использованием знакомых рыночных показателей, таких как чистая дельта действий по покупке опционов. Он объясняет, что его компания использует эту метрику как одну из характеристик своей модели CBO, которая учитывает эффект явления, а не его основную причину. Затем Чан делится конкретными результатами эффективности модели CBO, в том числе превосходит метод средней дисперсии и превосходит традиционные активы. Кроме того, он приводит пример того, как метод CBO показал лучшие результаты при распределении веса между акциями роста и крупными акциями в определенные периоды времени по сравнению с другими методами.

  • 00:35:00 В этом разделе спикер объясняет, почему классические методы инвестирования и торговли являются фиксированными и не адаптивными, в отличие от метода CBO (комбинаторной байесовской оптимизации), который превосходит классические методы, поскольку может адаптироваться к рыночному режиму, в результате чего лучшая производительность. CBO предназначен для оптимизации и рекомендации транзакций, даже если существующий портфель уже связан с транзакционными издержками. CBO не несет дополнительных транзакционных издержек и только рекомендует покупать больше или меньше определенных акций. Затем спикер приводит примеры клиентов, которые приняли метод CBO и заметили улучшение показателей своего портфеля.

  • 00:40:00 В этом разделе Эрнест рассказывает о примере, в котором они смогли добиться положительной доходности портфеля акций, несмотря на ограничения от 0 до 25 процентов по каждой акции. Портфель состоял из акций технологических компаний, и в 2022 году ожидался серьезный крах, но их метод распределения 50 процентов наличными в течение этого периода помог получить прибыль. Отвечая на вопрос о воспроизводимости их методов, Эрнест объясняет, что, хотя некоторые функции, такие как чистая дельта опционов, являются важными входными характеристиками, они опубликовали их подробное описание на своем веб-сайте. Он также упоминает использование деревьев решений градиентного процесса и других алгоритмов для машинного обучения, а их подход к определению рыночного режима заключается в представлении с использованием сотен функций.

  • 00:45:00 В этом разделе Чан объясняет, как машинное обучение можно использовать для оптимизации путем создания переменной отклика, такой как коэффициент Шарпа, и подбора функции F для различных сценариев управляющей переменной для каждого состояния рынка. Меткой алгоритма обучения с учителем является максимизируемая переменная, такая как коэффициент Шарпа, и каждое предложение портфеля вводится в формулу прогнозирования до тех пор, пока не будет найден наиболее эффективный портфель. Чан отмечает, что сложность проблемы не зависит линейно от количества активов в портфеле, но его команда разработала алгоритм для решения этой проблемы. Самая большая портфельная вселенная, которую они использовали, — это S&P 500.

  • 00:50:00 В этом разделе Эрнест Чен приводит пример того, как модель машинного обучения реагирует на изменения режима, используя распределение денежных средств в качестве индикатора. Когда в 2022 году начался медвежий рынок, модель большую часть времени оставалась в наличных деньгах, спасая портфель от отрицательной доходности. Он также упоминает, что целевая функция может быть установлена на что угодно, а не только на традиционное максимальное резкое соотношение или доходность, из-за нелинейного характера алгоритма обучения и алгоритма оптимизации, и что такие ограничения, как веса, ESG и оборот, могут применяться. Программное обеспечение является гибким и может учитывать любые рыночные функции, которые предоставляет клиент. Кроме того, Чан упоминает, что модель может работать с акциями с короткой историей, поскольку позволяет добавлять и удалять компоненты в портфеле, а модель можно переобучать при каждой перебалансировке.

  • 00:55:00 В этом разделе Чан обсуждает расчет доходности индекса S&P 500 и его компонентов. Он объясняет, что использование алгоритма машинного обучения для расчета доходности портфеля отличается от использования метода Марковица, поскольку алгоритм машинного обучения использует в качестве входных данных функции временных рядов, а не доходность акций. Чан также отмечает, что смена режима определяется 180 переменными, а ежедневные, ежемесячные и ежеквартальные измерения используются в качестве характеристик, которые вводятся в алгоритм машинного обучения, который выбирает наиболее важные функции, полезные для прогнозирования будущего портфеля. Наконец, Чан переформулирует проблему как проблему ранжирования, а не проблему регрессии, и ее также можно переформулировать как проблему классификации.

  • 01:00:00 В этом разделе спикер обсуждает возможность использования ансамбля портфелей вместо одного оптимального портфеля, но исследовательская группа должна изучить это подробнее. Они также подтверждают, что при наличии миллиона комбинаций портфелей модель необходимо будет обучать на одном миллионе комбинаций каждый день исторических данных. Однако они упоминают свой «секретный соус», который устраняет необходимость в такой вычислительной мощности. Спикер также объясняет, что они не используют двухэтапный процесс прогнозирования режимов с последующим обусловливанием распределения доходности этого режима, а вместо этого используют визуальный фактор для прямого прогнозирования эффективности портфеля. Они заканчивают дискуссию, говоря, что ожидаемый доход будет аналогичен тому, что произошло в прошлом, если они включат в свою модель большую часть этой обучающей выборки.
 

Финансовое машинное обучение — взгляд практика доктора Эрнеста Чана



Финансовое машинное обучение — взгляд практика доктора Эрнеста Чана

В этом информативном видео д-р Эрнест Чан углубляется в область финансового машинного обучения, исследуя несколько ключевых аспектов и проливая свет на важные соображения. Он подчеркивает важность предотвращения переобучения и выступает за прозрачность моделей. Кроме того, доктор Чан подчеркивает преимущества использования нелинейных моделей для прогнозирования поведения рынка. Однако он также обсуждает ограничения машинного обучения на финансовом рынке, такие как рефлексивность и постоянно меняющаяся динамика рынка.

Один из важных моментов, на который обращает внимание д-р Чен, — это важность экспертных знаний в области финансовых данных. Он подчеркивает необходимость выбора признаков для лучшего понимания основных переменных, влияющих на выводы модели. Определив эти важные исходные данные, инвесторы и трейдеры могут получить представление о своих потерях и понять, почему были приняты те или иные решения.

Д-р Чан также затрагивает применение машинного обучения в управлении рисками и распределении капитала. Он предлагает найти нишу на рынке и избегать прямой конкуренции с хорошо финансируемыми организациями. Таким образом, практикующие могут повысить свои шансы на успех в этих областях.

На протяжении всего видео д-р Чан подчеркивает преимущества и проблемы, связанные с различными моделями и стратегиями. Он отмечает, что хотя традиционные количественные стратегии, такие как линейные модели, просты для понимания и менее подвержены переобучению, они борются с нелинейной зависимостью между предикторами. Напротив, модели машинного обучения превосходно справляются с нелинейными отношениями, но их сложность и непрозрачность могут создавать проблемы при интерпретации их результатов и оценке статистической значимости.

Доктор Чан также обсуждает ограничения использования машинного обучения для прогнозирования финансового рынка. Он подчеркивает, что рынок постоянно развивается, что затрудняет точное прогнозирование. Однако он предполагает, что машинное обучение может быть успешным в прогнозировании частной информации, такой как торговые стратегии, где конкуренция с идентичными параметрами менее вероятна.

Кроме того, д-р Чан затрагивает тему включения фундаментальных данных, включая категориальные данные, в модели машинного обучения. Он указывает, что модели машинного обучения имеют преимущество перед моделями линейной регрессии в обработке как реальных, так и категориальных данных. Однако он предостерегает от того, чтобы полагаться исключительно на машинное обучение, подчеркивая, что глубокое знание предметной области по-прежнему имеет решающее значение для создания эффективных функций и точной интерпретации данных.

Что касается распределения капитала, д-р Чен подчеркивает, как машинное обучение может обеспечить более сложную ожидаемую прибыль, бросая вызов использованию прошлых результатов в качестве единственного показателя будущего успеха. Он также обсуждает нюансы понимания рынка, которые может предложить машинное обучение, когда вероятности меняются ежедневно, в отличие от статических распределений вероятностей из классической статистики.

В заключение д-р Чен обращает внимание на ограничения глубокого обучения при создании разнообразных перекрестных функций, требующих экспертных знаний в предметной области. Он делится своими мыслями о применимости обучения с подкреплением в финансовых моделях, отмечая его потенциальную эффективность при высоких частотах, но ограничения в более длительных масштабах времени.

Тем, кто заинтересован в дальнейшем изучении финансового машинного обучения, д-р Чан рекомендует свою компанию PredictNow.ai как ценный ресурс для получения знаний в области финансового машинного обучения без кода.

  • 00:00:00 то, что они становятся все более широко используемыми. В этом разделе видео д-р Эрнест Чан рассказывает о своей долгой истории машинного обучения и о том, как он нашел ценность в применении его к финансам, что, как он признает, было трудно сделать до недавнего времени. Он выступает за простые модели и стратегии, такие как однофакторные и линейные модели, которые десятилетиями хорошо работали для количественных трейдеров. С появлением количественной торговли эти модели становятся менее прибыльными, и Чан объясняет, как ему удалось извлечь выгоду из машинного обучения так, как это не делает большинство людей.

  • 00:05:00 В этом разделе д-р Эрнест Чен обсуждает историческую проблему переобучения в финансовом машинном обучении; когда модели должны соответствовать нескольким параметрам, риск переобучения очень высок, особенно при работе с низкочастотными финансовыми данными, такими как ежедневные финансовые временные ряды. Однако с годами достижения в области машинного обучения, особенно глубокого обучения, позволили преодолеть переоснащение. Такие методы, как случайный лес, перекрестная проверка, отсев и другие, помогли уменьшить переоснащение, а другие инструменты, такие как алгоритмы, сделали машинное обучение прозрачным. Проблема с торговлей по принципу «черный ящик» и отсутствием прозрачности заключается в том, что невозможность объяснить, почему вы совершаете определенные сделки, неприемлема, даже если вы зарабатываете деньги.

  • 00:10:00 В этом разделе д-р Эрнест Чен обсуждает концепцию выбора признаков в машинном обучении, которая может помочь трейдерам и инвесторам лучше понять важные переменные, которые приводят к выводу конкретной модели машинного обучения. Выбор функций может помочь инвесторам понять, почему они потеряли деньги или почему модель приняла неправильное решение, определяя важные исходные данные, которые привели к такому результату. Доктор Чан также подчеркивает, что машинное обучение может использоваться более эффективно для управления рисками и распределения капитала, чем в качестве основного генератора сигналов, поскольку рыночные прогнозы подвержены рефлексии, что создает трудности с обнаружением моделей в прошлом.

  • 00:15:00 В этом разделе д-р Эрнест Чен обсуждает ограничения использования машинного обучения для прогнозирования финансового рынка, который постоянно развивается и не может сравниться с прогнозированием таких заболеваний, как рак. Однако он объясняет, что использование машинного обучения для прогнозирования частной информации, такой как торговые стратегии, может быть успешным подходом, поскольку другие хедж-фонды не конкурируют с такими же точными параметрами. Он также сравнивает традиционные количественные стратегии со стратегиями, основанными на машинном обучении, отмечая, что машинное обучение может помочь в моделировании альтернативных и больших наборов данных с помощью нелинейных моделей.

  • 00:20:00 В этом разделе д-р Эрнест Чен обсуждает преимущества использования нелинейных моделей для прогнозирования поведения рынка. Традиционные количественные модели просты для понимания и являются линейными, что затрудняет переоснащение, но они не могут обрабатывать нелинейную зависимость между предикторами. С другой стороны, модели машинного обучения могут легко обрабатывать нелинейные зависимости, а их сложность и непрозрачность затрудняют их воспроизведение. Кроме того, модели машинного обучения обеспечивают вероятность успеха, позволяя более обоснованно распределять капитал. Однако переобучение — это проблема моделей машинного обучения, и оценка статистической значимости может быть затруднена. Моделирование бэктестов — несовершенное решение, и симуляция не может полностью отразить нюансы рынка.

  • 00:25:00 В этом разделе д-р Эрнест Чен обсуждает разницу между традиционными количественными стратегиями и стратегиями, основанными на машинном обучении. Он объясняет, что намного сложнее моделировать рынок и создавать точные планки погрешностей для традиционных стратегий, что затрудняет оценку их эффективности. С другой стороны, модели машинного обучения легко генерировать несколько бэк-тестов, просто переключая случайное начальное число, и каждый бэк-тест потенциально дает разные результаты. Эта случайность упрощает оценку статистической значимости бэктестов, что делает ее основным преимуществом использования машинного обучения в трейдинге. Тем не менее, изучение финансовых данных является наиболее сложным и трудоемким этапом построения стратегии, поскольку обычно возникают многочисленные проблемы с финансовыми данными, даже от надежных поставщиков.

  • 00:30:00 В этом разделе д-р Эрнест Чен описывает некоторые проблемы, связанные с использованием данных о настроениях. Он отмечает, что данным о настроениях не всегда можно доверять, поскольку компании, обрабатывающие новости, могут вернуться и изменить параметры, чтобы они выглядели хорошо. Из-за невозможности узнать, были ли данные рассмотрены предвзято, необходимо преобразовать необработанные информационные бюллетени в новые настроения, что представляет собой риск. Кроме того, данные представляют серьезную проблему для автоматизации ответов. Этап науки о финансовых данных сложен, поскольку требует человеческого интеллекта через предметную область, что является парадоксальной проблемой в задачах финансового машинного обучения. Второй шаг — машинное обучение, которое технологическая индустрия уже решила. Последним шагом является построение и тестирование торговых стратегий, что требует объединения прогнозов в последовательную стратегию и оценки статистической значимости.

  • 00:35:00 В этом разделе д-р Эрнест Чен обсуждает, как преобразовать прогнозы в портфель, следуя стандартной процедуре, которую можно найти в учебниках по финансам. Однако это требует некоторого знания предметной области и не является полностью автоматическим. Он также подчеркивает трудности науки о финансовых данных, такие как создание стационарных функций и важность использования мета-маркировки для прогнозирования прибыльности стратегии вместо прогнозирования рынка. Доктор Чан рекомендует прочитать его сообщение в блоге о мета-маркировке, применяемой в финансах, для получения дополнительной информации. Он также упоминает, что Random Forest является наиболее популярной моделью для финансового машинного обучения, поскольку она хорошо отражает нелинейность и имеет правильную сложность.

  • 00:40:00 В этом разделе доктор Эрнест Чан рассказывает о важности машинного обучения для прогнозирования рыночных тенденций и предотвращения потерь. Он делится своим личным опытом использования модели машинного обучения для выявления наличия террористической активности в мировой экономике и предостерегает от рисков несоблюдения ее рекомендаций, как это было в случае с анонсом вакцины Pfizer. Он также подчеркивает важность выбора признаков для объяснения убытков для инвесторов и рекомендует свою собственную книгу по машинному обучению для начинающих. Кроме того, д-р Чан подчеркивает важность чистоты и стационарности данных для получения правильных прогнозов, для чего приводит пример того, как нестационарные временные ряды могут негативно повлиять на способность модели точно прогнозировать.

  • 00:45:00 В этом разделе д-р Эрнест Чен обсуждает включение фундаментальных данных, особенно категориальных данных, в модели машинного обучения. В то время как модели линейной регрессии не могут обрабатывать категориальные данные, модели машинного обучения могут обрабатывать как реальные значения, так и категориальные данные. Однако д-р Чан подчеркивает, что машинное обучение не может полностью заменить людей-трейдеров, поскольку финансовое машинное обучение требует глубоких знаний в предметной области для создания функций и правильной интерпретации данных. Кроме того, он предостерегает от слепого поклонения глубокому обучению и подчеркивает, что это не универсальное решение без достаточного количества соответствующих данных. Наконец, он советует молодым практикам найти нишу на рынке и избегать прямой конкуренции с хорошо финансируемыми организациями.

  • 00:50:00 В этом разделе д-р Эрнест Чен обсуждает распределение капитала и то, как машинное обучение может обеспечить более сложную ожидаемую доходность в качестве входных данных для модели распределения капитальных активов. Он ставит под сомнение противоречие использования прошлых результатов в качестве ожидаемого дохода, что не гарантирует успеха в будущем. Машинное обучение также может обеспечить тонкое понимание рынка с различными вероятностями каждый день, в отличие от классической статистики, которая предоставляет только статическую вероятность распределения. Когда дело доходит до методов глубокого обучения, таких как рекуррентные сверточные нейронные сети, д-р Чен считает, что они могут быть бесполезны для входных данных, не относящихся к временным рядам, и выбора признаков.

  • 00:55:00 В этом разделе д-р Эрнест Чен обсуждает ограничения глубокого обучения при создании разнообразных перекрестных функций, необходимых для создания успешных прогнозов, требующих знаний в предметной области. Он также высказывает свое мнение о месте обучения с подкреплением в финансовых моделях в различных временных масштабах. Он считает, что обучение с подкреплением может работать с очень высокой частотой для высокочастотной торговли, поскольку оно может реагировать на людей, размещающих заказы в книге заказов, но оно не работает в более длительных масштабах времени. Наконец, он рекомендует свою компанию PredictNow.ai как отличный ресурс для машинного обучения без кода для тех, кто интересуется опытом кого-то вроде него.
 

трейдинг с глубоким обучением с подкреплением | Доктор Томас Старке


трейдинг с глубоким обучением с подкреплением | Доктор Томас Старке

Доктор Томас Старке, эксперт в области глубокого обучения с подкреплением для трейдинга, выступил с содержательной презентацией и принял участие в сессии вопросов и ответов с аудиторией. Ниже приводится расширенное изложение его выступления:

Доктор Старке начал с введения глубокого обучения с подкреплением для торговли, подчеркнув его способность позволять машинам решать задачи без непосредственного контроля. Он использовал аналогию машинного обучения, чтобы играть в компьютерную игру, где оно учится принимать решения на основе того, что видит на экране, и добивается успеха или неудачи на основе своей цепочки решений.

Затем он обсудил концепцию марковского процесса принятия решений в торговле, где состояния связаны с рыночными параметрами, а действия переводят процесс из одного состояния в другое. Цель состоит в том, чтобы максимизировать ожидаемое вознаграждение с учетом конкретной политики и состояния. Рыночные параметры имеют решающее значение, помогая машине принимать обоснованные решения о необходимых действиях.

Процесс принятия решений в трейдинге включает в себя определение того, покупать ли, продавать или удерживать на основе различных индикаторов, которые информируют о состоянии системы. Д-р Старке подчеркнул важность того, чтобы не полагаться исключительно на метки немедленных прибылей или убытков для каждого штата, поскольку это может привести к неверным прогнозам. Вместо этого машина должна понимать, когда оставаться в сделке, даже если она изначально идет против нее, ожидая, пока сделка вернется к средней линии, прежде чем выйти.

Чтобы решить проблему маркировки каждого шага прибыли и убытка по сделке, доктор Старке ввел ретроактивную маркировку. Этот подход использует уравнение Беллмана для присвоения ненулевого значения каждому действию и состоянию, даже если это не приводит к немедленной прибыли. Это допускает возможность возврата к среднему и возможной прибыли.

Глубокое обучение с подкреплением может помочь в принятии торговых решений на основе будущих результатов. Традиционные методы обучения с подкреплением строят таблицы на основе прошлого опыта, но в трейдинге количество состояний и влияний огромно. Чтобы справиться с этой сложностью, глубокое обучение с подкреплением использует нейронные сети для аппроксимации этих таблиц, что делает его возможным без создания огромной таблицы. Доктор Старке обсудил важность поиска правильной функции вознаграждения и входных данных для определения состояния, что в конечном итоге позволяет принимать более эффективные решения для торговли.

Была подчеркнута важность входных данных в торговле, подчеркнута их необходимость иметь прогностическую ценность. Доктор Старке подчеркнул важность тестирования системы на известное поведение и выбора соответствующего типа, размера и функции стоимости нейронной сети на основе выбранной функции вознаграждения. Он объяснил, как геймификация используется в трейдинге, где исторические и текущие цены, данные технической защиты и альтернативные источники данных составляют состояние, а вознаграждением являются прибыль и убытки (P&L) от сделки. Машина задним числом маркирует наблюдения, используя уравнение Беллмана, и постоянно обновляет таблицы, аппроксимированные нейронными сетями, чтобы улучшить процесс принятия решений.

Что касается обучения с подкреплением, доктор Старке обсудил различные способы структурирования ценового ряда, в том числе случайный вход и выход в различных точках. Он также обратился к проблеме разработки функции вознаграждения и привел примеры, такие как чистые процентные прибыли и убытки, прибыль за тик и коэффициент Шарпа, а также методы, позволяющие избежать длительного времени или просадок.

Что касается входных данных для торговли, доктор Старке упомянул многочисленные варианты, включая значения открытия-максимума-минимума-закрытия и объема, модели свечей, технические индикаторы, такие как индекс относительной силы, время дня/недели/года, а также ввод цен и технических данных. индикаторы для других инструментов. Также можно рассмотреть альтернативные источники данных, такие как настроения или спутниковые изображения. Ключевым моментом является преобразование этих входных данных в сложное состояние, подобное тому, как входные характеристики используются в компьютерных играх для принятия решений.

Доктор Старке объяснил этап тестирования, который должен пройти обучающийся с подкреплением, прежде чем его можно будет использовать для торговли. Он описал различные тесты, в том числе чистые синусоидальные волны, кривые трендов, рандомизированные ряды без структуры, различные типы корреляции порядка, шум в чистых тестовых кривых и повторяющиеся закономерности. Эти тесты помогают определить, постоянно ли машина приносит прибыль, и выявить любые недостатки в кодировании. Доктор Старке также обсудил различные типы используемых нейронных сетей, таких как стандартная, сверточная и долговременная кратковременная память (LSTM). Он выразил предпочтение более простым нейронным сетям, которые удовлетворяют его потребности, не требуя чрезмерных вычислительных усилий.

Затем доктор Старк углубился в изучение проблем использования обучения с подкреплением в трейдинге. Он признал сложность различения сигнала и шума, особенно в зашумленных финансовых временных рядах. Он также подчеркнул сложность обучения с подкреплением, чтобы адаптироваться к изменениям в поведении на рынке, что затрудняет изучение нового поведения. Кроме того, он упомянул, что, хотя для обучения с подкреплением требуется значительный объем обучающих данных, рыночные данные часто скудны. Еще одной проблемой является переоснащение, поскольку обучение с подкреплением, как правило, действует на основные рыночные модели и может легко переоснащаться. Создание более сложных нейронных сетей может смягчить эту проблему, но это трудоемкая задача. В целом доктор Старке подчеркнул, что обучение с подкреплением не является гарантированным решением для получения прибыльных результатов, и для достижения успеха в торговле крайне важно иметь рыночный опыт и знания в конкретной области.

Во время сеанса вопросов и ответов доктор Старке ответил на различные вопросы, связанные с торговлей с помощью глубокого обучения с подкреплением. Он пояснил, что уравнение Беллмана не вносит предвзятости, и обсудил потенциальное использование технических индикаторов в качестве исходных данных после тщательного анализа. Он также изучил возможность использования спутниковых изображений для прогнозирования цен на акции и объяснил, что торговля с подкреплением может выполняться на небольших временных интервалах в зависимости от времени расчета нейронной сети. Он предупредил, что алгоритмы торговли с подкреплением чувствительны к рыночным аномалиям, и объяснил, почему обучение деревьев случайных решений с использованием обучения с подкреплением не дает значимых результатов.

Доктор Старке рекомендовал использовать нейронные сети для торговли вместо деревьев решений или машин опорных векторов из-за их пригодности для решения проблемы. Он подчеркнул важность настройки функции потерь на основе используемой функции вознаграждения. Несмотря на то, что были предприняты некоторые попытки применить обучение с подкреплением к высокочастотной торговле, доктор Старке подчеркнул проблему медленных нейронных сетей, не реагирующих на рынки в реальном времени. Он посоветовал людям, заинтересованным в карьере трейдера в финансовой индустрии, получить знания о рынке, участвовать в реальных сделках и учиться на собственном опыте. Наконец, он обсудил проблемы объединения нейронных сетей и торговли опционами, признавая сложность задачи.

В заключение д-р Томас Старке поделился ценной информацией о торговле с помощью глубокого обучения с подкреплением. Он затронул такие темы, как процесс принятия решений в трейдинге, ретроактивная маркировка, уравнение Беллмана, важность входных данных, этапы тестирования и проблемы, связанные с обучением с подкреплением для трейдинга. В своем выступлении и сеансе вопросов и ответов д-р Старке предложил рекомендации и практические соображения по использованию глубокого обучения с подкреплением на финансовых рынках.

  • 00:00:00 Доктор Томас Старк представляет глубокое обучение с подкреплением для трейдинга, тему, которой он интересовался в течение нескольких лет. Обучение с подкреплением (RL) — это метод, который позволяет машине решать задачу без присмотра, и она сама учится, что делать, чтобы получить благоприятные результаты. Он объясняет, как машина, которая хочет научиться играть в компьютерную игру, начинает с игрового сценария и переходит от одного шага к другому, реагируя на то, что видит на экране. Наконец, игра заканчивается, и машина добивается успеха или неудачи в зависимости от цепочки принятых ею решений.

  • 00:05:00 Доктор Томас Старке обсуждает торговлю с помощью глубокого обучения с подкреплением и объясняет концепцию марковского процесса принятия решений. В этом процессе состояние связано с определенным рыночным параметром, а действие переводит процесс из одного состояния в другое. В зависимости от перехода агент получает либо положительное, либо отрицательное вознаграждение. Цель состоит в том, чтобы максимизировать ожидаемое вознаграждение при определенной политике и состоянии. В трейдинге рыночные параметры используются, чтобы определить, в каком состоянии находится агент, и помочь ему принять решение о том, какие действия предпринять.

  • 00:10:00 Д-р Томас Старке обсуждает процесс принятия решений, связанный с торговлей, который включает решение о покупке, продаже или удержании на основе различных индикаторов, которые информируют о состоянии системы. Цель состоит в том, чтобы получить наилучшее возможное вознаграждение, то есть прибыль или убыток от сделки. Однако традиционный подход машинного обучения, заключающийся в присваивании состоянию определенного ярлыка, такого как немедленная прибыль или убыток, может привести к неверным ярлыкам, если сделка в ближайшем будущем пойдет против нас. Следовательно, машина должна понимать, когда оставаться в сделке, даже если она изначально идет против нас, и иметь убеждение ждать, пока сделка не вернется обратно к средней линии, чтобы выйти из сделки.

  • 00:15:00 Доктор Томас Старке обсуждает ретроактивную маркировку и то, как она используется в обучении с подкреплением для решения проблемы маркировки каждого шага в прибыли и убытке сделки. Он объясняет, что традиционное машинное обучение маркирует каждый шаг в сделке, что затрудняет прогнозирование того, может ли сделка стать прибыльной в будущем, если она понесет убытки. Ретроактивная маркировка использует уравнение Беллмана для присвоения ненулевого значения каждому действию и состоянию, даже если они не приносят немедленной прибыли, что позволяет вернуться к среднему и конечному доходу.

  • 00:20:00 Доктор Томас Старке объясняет, как использовать обучение с подкреплением для решения проблемы отсроченного вознаграждения в трейдинге. Уравнение Беллмана используется для расчета вознаграждения за действие, где «r» представляет собой немедленное вознаграждение, а «q» представляет собой совокупное вознаграждение. Гамма — это коэффициент дисконтирования, который присваивает вес будущим результатам по сравнению с предыдущими результатами. Используя обучение с подкреплением, торговые решения основываются не только на немедленном вознаграждении, но и на удержании позиций для получения более высоких вознаграждений в будущем. Это позволяет принимать более обоснованные решения по сравнению с жадным принятием решений.

  • 00:25:00 Доктор Томас Старке обсуждает, как глубокое обучение с подкреплением может помочь в принятии решений для торговли на основе будущих результатов. Традиционное обучение с подкреплением включает в себя построение таблиц на основе прошлого опыта, но в трейдинге это усложняется из-за большого количества состояний и влияний. Поэтому решение состоит в том, чтобы использовать глубокое обучение с подкреплением и нейронные сети для аппроксимации этих таблиц без создания огромной таблицы. Он объясняет реализацию использования геймификации торговли и поиск правильной функции вознаграждения и входных данных для определения состояния. В целом, использование глубокого обучения с подкреплением может помочь в принятии решений для торговли.

  • 00:30:00 В этом разделе доктор Старке обсуждает важность входных данных в трейдинге и то, как они должны иметь какую-то прогностическую ценность, иначе система не сможет принимать правильные торговые решения. Он подчеркивает необходимость проверки системы на известное поведение и выбора соответствующего типа, размера и функции стоимости нейронной сети в зависимости от выбранной функции вознаграждения. Затем он объясняет, как геймификация работает в трейдинге, где состоянием являются исторические и текущие цены, данные технической защиты и альтернативные источники данных, а вознаграждением являются прибыли и убытки по сделке. Обучающийся с подкреплением будет использовать уравнение Беллмана для маркировки наблюдений задним числом, и благодаря постоянному обновлению таблиц, аппроксимированных нейронными сетями, машина научится принимать все более и более эффективные торговые решения.

  • 00:35:00 В этом разделе д-р Томас Старке обсуждает, как структурировать ряд цен для обучения с использованием обучения с подкреплением. Он объясняет, что вместо последовательного прохождения ряда цен вы можете случайным образом входить и выходить в разных точках, и пользователь сам решает, какой метод выбрать. Он также обсуждает сложность разработки функции вознаграждения и приводит различные примеры и методы построения функции вознаграждения, которые можно использовать для обучения, например, использование чистого процента прибылей и убытков, прибыли за тик, коэффициент Шарпа и различные виды наказаний для избегайте длительных перегонов или просадок.

  • 00:40:00 По словам доктора Томаса Старке, у нас есть много вариантов, в том числе значения закрытия и объема открытия, максимума и минимума, модели свечей, технические индикаторы, такие как индекс относительной силы, время дня/недели/года, различная степень детализации времени, ввод цены и технические индикаторы для других инструментов, а также альтернативные данные, такие как настроения или спутниковые снимки. Затем эти входные данные преобразуются в сложное состояние, подобно тому, как компьютерная игра использует входные данные для принятия решений. В конечном счете, ключ в том, чтобы найти правильную функцию вознаграждения, которая работает для вашего стиля торговли, и соответствующим образом оптимизировать вашу систему.

  • 00:45:00 Доктор Томас Старке объясняет этап тестирования, который должен пройти его обучаемый с подкреплением, прежде чем его можно будет использовать для торговли на финансовых рынках. Он применяет серию тестов, включая чистые синусоидальные волны, кривые тренда, случайные ряды без структуры, различные типы корреляции порядка, шум в чистых тестовых кривых и повторяющиеся шаблоны, чтобы определить, приносит ли машина постоянную прибыль, и найти недостатки в кодировании. . Он также обсуждает различные типы нейронных сетей, которые он использует, в том числе стандартные, сверточные и долговременную память (LSTM), и его предпочтение простым нейронным сетям, поскольку они достаточны для его нужд и не требуют чрезмерных вычислительных усилий.

  • 00:50:00 В этом разделе д-р Томас Старке обсуждает проблемы торговли с обучением с подкреплением, в том числе трудности различения сигнала и шума и проблему локальных минимумов. Он показывает, что обучение с подкреплением борется с зашумленными финансовыми временными рядами и динамическими финансовыми системами с меняющимися правилами и рыночными режимами. Однако он также показывает, что сглаживание кривой цены с помощью простой скользящей средней может значительно повысить производительность машины обучения с подкреплением, давая представление о том, как построить успешную систему машинного обучения, которая может принимать прибыльные торговые решения.

  • 00:55:00 В этом разделе доктор Томас Старке обсуждает проблемы использования обучения с подкреплением в трейдинге. Во-первых, обучение с подкреплением с трудом адаптируется к изменениям поведения на рынке, что затрудняет изучение нового поведения. Кроме того, требуется много обучающих данных, но рыночных данных часто мало. Хотя обучение с подкреплением является эффективным, оно может легко переобучиться и действительно действует только на основные рыночные модели. Создание более сложных нейронных сетей может решить эту проблему, но это трудоемкая задача. В конечном счете, обучение с подкреплением не является серебряной пулей для получения прибыльных результатов, и важно иметь хороший рыночный опыт и знания в конкретной области для достижения успешных торговых результатов. Доктор Старке предлагает лекцию по Quant NC и призывает всех, кто интересуется кодированием этих систем, обращаться к нему через LinkedIn с четко сформулированными вопросами.

  • 01:00:00 Доктор Томас Старке отвечает на различные вопросы, связанные с трейдингом с помощью глубокого обучения с подкреплением. Он объясняет, что уравнение Беллмана не вносит предвзятости, а технические индикаторы иногда можно использовать в качестве входных данных после тщательного анализа. Спутниковые снимки могут быть полезны для прогнозирования цен на акции, а торговлю подкреплением можно проводить на небольших таймфреймах в зависимости от времени расчета нейронной сети. Он также обсуждает, насколько чувствительны алгоритмы торговли подкреплением к рыночным аномалиям, и объясняет, почему нет смысла обучать деревья случайных решений с помощью обучения с подкреплением.

  • 01:05:00 В этом разделе доктор Томас Старке рекомендует использовать для торговли нейронные сети, а не деревья решений или машины опорных векторов, поскольку они подходят для решения задачи. Он объясняет, что очень важно настроить функцию потерь на основе используемой функции вознаграждения. Он упоминает, что люди пытались использовать обучение с подкреплением для высокочастотной торговли, но в итоге получили медленные нейронные сети, которым не хватало отклика на рынках в реальном времени. Он предполагает, что получение знаний о рынке значительно поможет продолжить торговую карьеру в финансовой индустрии, совершать реальные сделки и многому учиться в процессе. Наконец, он обсуждает, можно ли использовать нейронные сети для получения хороших результатов при торговле опционами, и объясняет проблемы, связанные с объединением нейронных сетей и торговли опционами.

  • 01:10:00 В этом разделе д-р Томас Старке обсуждает, как можно использовать данные опционов в качестве исходных данных для торговли базовым инструментом, а не просто полагаться на технические индикаторы. Он также отвечает на вопросы об использовании нейронных сетей для определения количества лотов для покупки или продажи и о том, как включить в алгоритм спред, комиссию и проскальзывание, создав модель проскальзывания и включив эти факторы в функцию вознаграждения. Он советует проявлять осторожность при использовании нейронных сетей для определения объемов сделок и рекомендует использовать выходные значения для соответствующего определения веса портфеля. В заключение он поблагодарил аудиторию за вопросы и за то, что пришли на его выступление.
 

Харрисон Уолдон (Юта, Остин): «Уравнения алгоритмического обучения»


Харрисон Уолдон (Юта, Остин): «Уравнения алгоритмического обучения»

Харрисон Уолдон, исследователь из UT Austin, представил свою работу по алгоритмическому сговору на финансовых рынках, сосредоточив внимание на взаимодействии и потенциальном сговоре алгоритмов обучения с подкреплением (RL). Он ответил на озабоченность регулирующих органов по поводу автономной алгоритмической торговли и ее способности взвинчивать цены в результате сговора без явного сообщения.

Исследование Уолдона было направлено на то, чтобы понять поведение алгоритмов RL в финансовых условиях и определить, могут ли они научиться вступать в сговор. Он использовал алгоритмические уравнения обучения (ALE) для получения системы обыкновенных дифференциальных уравнений (ODE), которые аппроксимируют эволюцию алгоритмов в определенных условиях. Эти ALE смогли подтвердить сговор в алгоритмах Q-обучения и обеспечили хорошее приближение к эволюции алгоритма, продемонстрировав большую область притяжения результатов сговора.

Однако при расчете стационарного распределения и различении истинного сговора от рационального самосохранительного поведения возникают проблемы. Численные трудности возникают при определении стационарного распределения, и остается проблемой отличить подлинный сговор от поведения, обусловленного личным интересом.

Уолдон подчеркнул ограничения статического игрового равновесия применительно к динамическим взаимодействиям, подчеркнув необходимость комплексного подхода к регулированию поведения. Сговорное поведение, которому способствуют алгоритмы без прямого общения между сторонами, требует тщательного рассмотрения. Разговор завершился тем, что Уолдон выразил благодарность присутствующим, отметив окончание весеннего семестра.

  • 00:00:00 В этом разделе Харрисон Уолден из UT Austin обсуждает свою недавнюю работу по алгоритмическому сговору в финансовой индустрии. Он отмечает, что большинство сделок на электронных рынках выполняются с помощью алгоритмов, многие из которых используют методы машинного обучения, такие как обучение с подкреплением (RL), для изучения торговых стратегий. В то время как RL добилась практических успехов в глубоком хеджировании и оптимальном исполнении, регулирующие органы выразили обеспокоенность по поводу фирм, полагающихся на полностью автономную алгоритмическую торговлю, поскольку это может привести к сговору задач и завышению цен на рынке без явного сообщения. Работа Уолдена направлена на предоставление инструментов для изучения алгоритмического сговора и его потенциального влияния на финансовую отрасль.

  • 00:05:00 В этом разделе Харрисон Уолдон обсуждает ограничения существующих исследований поведения алгоритмов обучения с подкреплением в финансовых условиях. Хотя некоторые экспериментальные данные показывают, что определенные алгоритмы обучения с подкреплением могут изучать сложные стратегии сговора в определенных сценариях, таким экспериментам не хватает теоретической строгости. Кроме того, отсутствие объяснимости алгоритмов RL является проблемой для таких организаций, как AFM, особенно в многоагентных и нестационарных средах, таких как финансовые рынки. Основные вопросы, лежащие в основе работы Уолдона, следующие: как мы можем понять поведение взаимодействующих алгоритмов обучения с подкреплением в финансовых условиях и могут ли эти алгоритмы доказуемо научиться вступать в сговор?

  • 00:10:00 В этом разделе Харрисон Уолдон объясняет, что в обучении с подкреплением (RL) функция F или правило обучения принимает старые значения параметров, текущее состояние, текущее действие и, возможно, последующее состояние для включения информации в новый набор параметров. Цель состоит в том, чтобы найти набор параметров, которые аппроксимируют оптимальную политику. Одним из популярных алгоритмов в RL является асинхронное табличное Q-обучение, которое связывает одно значение параметра с каждой парой состояние-действие и обновляет их асинхронным образом. Q-обучение хорошо работает в условиях одного агента, но становится более сложным в многоагентных и нестационарных условиях, распространенных на рынках. Пространство состояний в финансах определяется как вектор цен, объявленных другими агентами, где пространство действий может включать покупку, продажу или владение.

  • 00:15:00 В этом разделе мы узнаем об одном интересном открытии в работе команды: алгоритмы могут обучаться торговле солнечными пятнами, если они начинают обусловливать нерелевантные рыночные факторы. Докладчик объясняет, как Q-обучение ведет себя во взаимодействии с другими Q-обучаемыми, и определяет многоагентный аналог марковского процесса принятия решений как стохастическую игру. Они обсуждают, как агенты учатся и адаптируют свою политику во времени, делая истинную динамику процесса состояния нестационарной, даже если функция перехода может быть фиксированной. Основной пример, использованный в докладе, — дилемма заключенного, трактуемая как стилизованный рынок с двумя конкурирующими поставщиками ликвидности.

  • 00:20:00 понимание поведения алгоритмов учится играть в повторяющуюся игру «дилемма заключенного» с другими игроками, оснащенными алгоритмами. Чтобы достичь этого, процессу состояния необходимо дать понятие состояния, и система, к которой мы приходим, называется алгоритмическими уравнениями обучения. Чтобы вывести эту систему, они используют метод оды из стохастической аппроксимации для аппроксимации эволюции параметров, что позволяет проводить прямой анализ политики. Хотя в этой модели существуют ограничения, представленные инструменты являются общими и могут устранить эти ограничения.

  • 00:25:00 В этом разделе Харрисон Уолдон обсуждает алгоритмические уравнения обучения, которые аппроксимируют эволюцию параметров, используя классическую стохастическую аппроксимацию и ОДУ. Обусловливая правило обучения относительно стационарного распределения и устанавливая фиксированные параметры, они получают систему ОДУ, которые имитируют алгоритм обучения. Эти алгоритмические уравнения обучения могут аппроксимировать эволюцию алгоритма при определенных условиях, таких как невырожденная скорость обучения и компактность параметров. Стационарное распределение и политики непрерывны по Липшицу, что также имеет решающее значение. Используемое стохастическое приближение необходимо из-за нестационарности процесса с изменяющейся динамикой.

  • 00:30:00 В этом разделе Харрисон Уолдон обсуждает уравнения алгоритмического обучения и их свойства. Пример Q-обучения, обсуждаемый в видео, удовлетворяет всем свойствам этих уравнений, включая сохранение параметров в компактном множестве, эргодические цепи Маркова, непрерывность Липшица в политиках и правилах обучения. Уолдон показывает, что при соответствующем масштабировании времени алгоритм будет с высокой вероятностью близок к решениям ОДУ для любого конечного временного горизонта и почти наверняка будет сходиться к локально асимптотически устойчивым решениям, если скорость обучения убывает достаточно быстро. В заключение Уолдон проверяет эти уравнения, применяя их к повторяющейся дилемме заключенного, используя Q-обучение с выбором действия softmax.

  • 00:35:00 В этом разделе обсуждаются условия, необходимые для того, чтобы уравнение алгоритмического обучения аппроксимировало эволюцию алгоритмов. Условие процесса состояния для эргодичности для этого сценария выполняется немедленно, поскольку существует только одно состояние. Траектории алгоритма обучения моделируются как с большими, так и с малыми скоростями обучения, что показывает, что аппроксимация алгоритмическим уравнением обучения хороша при малых скоростях обучения. ALE также полезны при анализе вероятности получения результата сговора с большим бассейном притяжения, ведущим к такому результату. В следующей части видео каждому агенту предоставляется возможность обусловить свои спреды спредами своего противника из предыдущего периода.

  • 00:40:00 В этом разделе видео Харрисон Уолдон объясняет вероятность воспроизведения определенного действия и источник шума в симуляциях, которые они анализируют. Он обсуждает процесс эрготического состояния, стационарное распределение политик и то, как интерпретировать компоненты политик каждого агента с точки зрения наказания, чтобы исследовать частоту, с которой набор политик будет вызывать результат сговора. Он также предоставляет графики алгоритмических уравнений обучения для обучения Q в зависимости от состояния для диапазона начальных условий до тех пор, пока траектория не сойдется численно.

  • 00:45:00 В этом разделе видео Харрисон Уолдон обсуждает результаты использования Q-обучения с уравнениями алгоритмического обучения для изучения поведения сговора в стохастических играх. Агенты смогли научиться разыгрывать спреды по сговору почти в 100% случаев, даже если они не начинали с высокой вероятности сговора. Результаты также показали большую привлекательность результата сговора, но также и неожиданного поведения, такого как переключение между результатами взаимного сговора и взаимной конкуренцией. Методология, использованная в этом исследовании, предоставила минимально ограничительные достаточные условия, которые позволили аппроксимировать поведение широкого класса алгоритмов обучения с подкреплением, зависящих от состояния. Однако были некоторые ограничения из-за численных трудностей при расчете стационарного распределения. В целом Q-обучение оказалось успешным в изучении сговора в этих стохастических играх.

  • 00:50:00 В этом разделе Харрисон Уолдон объясняет, как гарантировать, что алгоритмические уравнения обучения аппроксимируют асимптотическое поведение алгоритма, показывая существование функции Ляпунова, что сложно из-за необходимости иметь дело со стационарным распределением. Чтобы решить эту проблему, Уолдон вводит новый алгоритм, являющийся обобщением классической фиктивной игры, который называется гладкой фиктивной игрой, зависящей от состояния. Этот алгоритм предполагает, что все агенты в системе играют в соответствии со стационарными политиками, а убеждения об этих стратегиях формируются через эмпирическую частоту игры. Алгоритм добавляет в систему некоторую случайность и выполняет действия в соответствии с распределением soft-max, чтобы обойти проблемы детерминированных правил обучения.

  • 00:55:00 В этом разделе Харрисон Уолдон объясняет, что уравнения алгоритмического обучения можно использовать для анализа системы с непрерывным временем и гарантировать, что алгоритм гладкой фиктивной игры будет сходиться к точкам покоя системы, некоторые из которых могут быть стратегиями сговора. . По мере роста коэффициента дисконтирования увеличивается вероятность изучения исходов сговора. Уолдон также обсуждает необходимость более реалистичной динамики рынка и возможность применения уравнений алгоритмического обучения к алгоритмам глубокого обучения с подкреплением для изучения равновесия и цен. Наконец, он признает сложность обнаружения сговора и проблему различения истинного сговора и рационального самосохранительного поведения.

  • 01:00:00 В этом разделе Харрисон Уолдон обсуждает, как равновесие статической игры является узким отражением реальности динамического взаимодействия между людьми. Он подчеркивает необходимость целостного подхода при рассмотрении вопроса о том, какое равновесное поведение следует регулировать, особенно с точки зрения сговора, который может рассматриваться как рациональный и достигается с помощью алгоритмов без прямого общения между сторонами. Сессия заканчивается тем, что Уолдон благодарит участников и завершает серию весеннего семестра.
 

Ирен Олдридж (AbleBlox и AbleMarkets): «Криптовалютная экосистема и дизайн AMM»



Ирен Олдридж (AbleBlox и AbleMarkets): «Криптовалютная экосистема и дизайн AMM»

Ирен Олдридж, основатель и управляющий директор AbleMarkets, изучает различные аспекты технологии блокчейна, автоматизированного создания рынка (AMM) и конвергенции традиционных рынков с миром AMM. Она подчеркивает важность этих тем в финансах и исследует потенциальные проблемы и решения, связанные с ними.

Олдридж начинает с обзора своего опыта работы в финансовой индустрии и своего опыта в области микроструктуры, который фокусируется на понимании рыночных операций. Она подчеркивает все более широкое распространение автоматизированных моделей маркетмейкинга, которые изначально были широко распространены на крипторынке, но теперь распространяются и на традиционные рынки. Она описывает структуру своей презентации, которая охватывает вводные концепции блокчейна, применение блокчейна в финансах и программировании, а также реальные примеры создания рынка и его влияния на традиционные рынки.

Изучая технологию блокчейна, Олдридж описывает ее как расширенную базу данных, в которой каждая строка содержит криптографическую сводку предыдущей строки, что обеспечивает целостность данных. Она объясняет процесс майнинга, связанный с блокчейном, когда предлагаемый контент проверяется и добавляется в цепочку, что приводит к большей прозрачности и децентрализации в документах и платежных системах.

Олдридж обсуждает переход к децентрализации в криптоэкосистеме, подчеркивая компромисс между конфиденциальностью и надежностью наличия нескольких копий базы данных на серверах. Она объясняет процесс блокчейна, от определения блоков и создания криптографических подписей до основных инноваций доказательства работы и майнинга, которые обеспечивают защиту от попыток взлома.

Тем не менее, Олдридж признает проблемы, связанные с системой майнинга с доказательством работы, включая рост стоимости майнинга, уменьшение числа майнеров и потенциальные уязвимости. Она выделяет альтернативные решения, такие как агрегация блоков Ethereum и устранение загадок для майнинга Coinbase.

Спикер переходит к изучению ставок в крипто-экосистеме, где заинтересованные стороны выделяют свои средства для поддержки операций сети. Она признает потенциальную проблему криптоолигархов, манипулирующих рынком, и объясняет, как для решения этой проблемы были реализованы проверка вне сети и автоматизированное создание рынка. Олдридж подчеркивает важность понимания этих концепций, чтобы понять значение автоматизированного создания рынка для предотвращения манипуляций на крипторынке.

Олдридж углубляется в принципы, лежащие в основе автоматизированных маркет-мейкеров (AMM), подчеркивая их революционное влияние на торговлю криптовалютой. Она объясняет, как кривые AMM, сформированные инвариантами, связанными с ликвидностью, определяют цены на основе оставшихся запасов в пуле ликвидности. Она подчеркивает преимущества AMM, в том числе круглосуточную ликвидность, формульную оценку проскальзывания и определение справедливой стоимости с помощью выпуклых кривых. Однако она также упоминает, что AMM могут понести убытки в нестабильных условиях, что приведет к введению комиссий за транзакции.

Сравнивая AMM с традиционными рынками, Олдридж обсуждает преимущества автоматического создания рынка, такие как непрерывная ликвидность, предсказуемое проскальзывание и определение справедливой стоимости. Она объясняет метод создания постоянного рынка продуктов, используемый UniSwap, иллюстрируя, как брокеры исполнения могут выбирать платформы для обеспечения ликвидности и исполнения на основе параметризованных данных.

Спикер обсуждает расчет изменения объема и различие между публичными и частными пулами ликвидности. Она представляет эмпирические примеры использования биткойнов и эфириума с разных бирж, указывая на различия в их кривых и предлагая потенциальные проблемы с определенными платформами.

Олдридж подчеркивает важность построения кривых АММ с использованием выпуклых форм для обеспечения стабильности рынка. Она объясняет роли поставщиков ликвидности и трейдеров в системе и то, как они получают выгоду от комиссий за транзакции. Она также поднимает вопрос о возможности использования систем AMM на традиционных рынках, побуждая рассмотреть возможность их применения к таким активам, как акции IBM.

Олдридж исследует конвергенцию традиционных рынков с автоматизированным созданием рынка, отмечая, что традиционные маркет-мейкеры уже внедряют аналогичные системы. Она выделяет ожидаемые изменения в рыночных взаимодействиях, торговых стратегиях, методах исполнения и прозрачности. Также обсуждается влияние автоматических маркет-мейкеров на микроструктуру рынков.

Говоря о возможности внедрения автоматизированной ликвидности в условиях круглосуточной торговли, таких как рынок криптовалют, Олдридж объясняет, что автоматизированное формирование рынка может устранить риски, связанные с традиционными методами создания рынка, и что эта технология легкодоступна. Однако она предупреждает, что не все криптовалютные биржи используют автоматизированный маркетмейкинг, подчеркивая необходимость исследований для управления рисками и внешними факторами. Олдридж отмечает, что автоматизированные технологии создания рынка появились примерно в то же время, что и криптовалюты, такие как биткойн, в 2002 году.

Отвечая на вопрос о потенциальных несправедливых преимуществах доступа к частной информации для автоматизированных маркет-мейкеров, Олдридж признает, что это создает проблему. Тем не менее, она предполагает, что поиск и количественная оценка автоматизированной кривой создания рынка на разных платформах могут помочь смягчить эту проблему. Она отмечает, что майнеры заинтересованы в продолжении своей работы, потому что именно они получают выгоду от доступа и проверки блоков ордеров. Тем не менее, если нет частного стимула, получать прибыль в этом пространстве становится все труднее, что приводит к формированию олигополий. Олдридж предполагает, что страхование может служить естественным стимулом для шахтеров работать почти бесплатно. Однако страховые компании воспринимают блокчейн как серьезную угрозу для своей отрасли, что приводит к сопротивлению таким конструкциям систем. Она также рассматривает возможность схем мошенничества, выделяя потенциальные манипуляции на кривой IBM.

В контексте централизованных книг лимитных ордеров Олдридж объясняет, как участники рынка используют автоматизированные модели маркет-мейкинга, такие как AMM, которые обеспечивают ликвидность экономически эффективным и автоматизированным способом, что может привести к прибыли. Тем не менее, различие между трейдерами, использующими AMM, и теми, кто размещает лимитные ордера вручную, остается проблемой. Олдридж предполагает, что идентификация злоумышленников с помощью анализа микроструктуры данных может предложить потенциальное решение. Она считает, что если AMM продолжат доминировать на рынке, появится более эффективная и оптимизированная модель.

Таким образом, обсуждение Айрин Олдридж охватывает различные аспекты технологии блокчейна, автоматизированного создания рынка и конвергенции традиционных рынков с миром AMM. Она исследует основы блокчейна, обсуждает проблемы и потенциальные решения, связанные с системами майнинга с доказательством работы, и подчеркивает преимущества AMM по сравнению с традиционными рынками. Олдридж также обращает внимание на проблемы, связанные с возможностью внедрения автоматизированной ликвидности, проблемой доступа дилеров к частной информации для автоматизированных маркетмейкеров и потенциальной ролью страхования в качестве стимула для майнеров. Благодаря своим знаниям она дает ценные взгляды на текущую ситуацию и будущие возможности в мире финансов и автоматизированного создания рынка.

  • 00:00:00 В этом разделе Айрин Олдридж рассказывает о своем опыте работы в финансовой индустрии и о своем интересе к микроструктуре, которая фокусируется на том, как работают рынки. Затем она представляет тему автоматизированного создания рынка и того, как он возник на рынке криптовалют, но теперь внедряется на традиционных рынках. Она составляет план презентации, которая включает в себя введение блокчейна 101, применение блокчейна в финансах, программирование и тематические исследования создания рынка на практике и его распространения на традиционные рынки. Олдридж имеет опыт работы в области электротехники и работал в различных областях финансовой индустрии, включая торговлю, управление рисками и исследования.

  • 00:05:00 В этом разделе Айрин Олдридж объясняет основы технологии блокчейн. Она описывает ее как причудливую базу данных, в которой каждая строка содержит криптографическую сводку предыдущей строки, что затрудняет изменение любых предыдущих данных с вычислительной точки зрения. Кроме того, она обсуждает процесс майнинга блокчейна и то, как он включает в себя изучение предлагаемого содержимого блока и сохранение его в памяти. Олдридж считает, что блокчейн может помочь перенести бумажную работу и платежи в блокчейн, обеспечивая большую прозрачность и децентрализацию.

  • 00:10:00 В этом разделе Айрин Олдридж обсуждает переход к децентрализованной модели в криптоэкосистеме, где транзакции являются общедоступными и хранятся на нескольких серверах, а не централизованно на сервере Oracle. Хотя это означает, что конфиденциальность приносится в жертву, повышенная надежность за счет наличия нескольких копий базы данных на серверах рассматривается как справедливый компромисс. Олдридж объясняет, что процесс блокчейна относительно прост: он начинается с определения блока и создания криптоподписи или хэша, который затем кодируется в следующем блоке. Затем обсуждаются основные нововведения в алгоритмах доказательства работы и майнинга с целью обеспечения безопасности от попыток взлома путем слишком большой вычислительной сложности пересчета цепочки.

  • 00:15:00 В этом разделе Айрин Олдридж обсуждает проблемы, мешающие системе майнинга с доказательством работы в криптовалюте. Она объясняет, что стоимость майнинга становится слишком высокой для большинства людей, что приводит к равновесию, при котором только определенная группа людей может позволить себе расходы, а остальные не могут заниматься майнингом. Кроме того, количество майнеров со временем уменьшается, что делает систему уязвимой для потенциальных взломов. Сила децентрализованной модели заключается в том, что самая длинная цепочка автоматически выбирается основным движком, не позволяя злоумышленникам догнать и внедрить взломанные блоки в систему. Тем не менее, растет озабоченность по поводу системы доказательства работы, включая вопросы, представляющие интерес между майнерами, которые торгуют и добывают, а также время, необходимое для майнинга блоков. В настоящее время разрабатываются новые решения, такие как агрегация блоков Ethereum каждые 12 секунд и решение Coinbase перестать требовать, чтобы люди разгадывали загадки для майнинга.

  • 00:20:00 В этом разделе спикер обсуждает процесс стейкинга в криптоэкосистеме, который включает в себя вложение денег в систему для майнинга. Заинтересованные стороны могут заблокировать свою долю или залог на определенный период, и в случае мошенничества они платят за нее своей долей. Однако это создает олигополию криптоолигархов, манипулирующих рынком. Для борьбы с этим использовались офчейн-валидация и автоматизированный маркетмейкинг. Последний стал более популярным в криптоэкосистеме и имеет различные продукты с открытым исходным кодом, к которым может получить доступ каждый, что упрощает понимание. Спикер подчеркивает, что понимание справочной информации, такой как стейкинг и проверка вне сети, необходимо для понимания важности автоматического создания рынка и того, как он работает для предотвращения манипуляций на крипторынке.

  • 00:25:00 В этом разделе Айрин Олдридж обсуждает принципы, лежащие в основе различных автоматических маркет-мейкеров (AMM), которые произвели революцию в мире торговли криптовалютой. Она объясняет, что кривые AMM, которые различаются по кривизне и смещению, формируются инвариантом, связанным с ликвидностью, и что цена является функцией оставшихся запасов в пуле ликвидности. Одним из преимуществ AMM является то, что они могут торговать 24 часа в сутки 7 дней в неделю без спреда, поскольку нет спредов между ценами покупки и продажи, и они могут автоматически приспосабливаться к изменяющимся рыночным условиям. Однако AMM могут потерять деньги в нестабильных условиях, поэтому они взимают комиссию за транзакции, которой нет на традиционных рынках.

  • 00:30:00 В этом разделе Айрин Олдридж обсуждает автоматизированный маркетмейкинг (AMM) и его преимущества по сравнению с традиционными рынками, такие как непрерывная круглосуточная ликвидность, шаблонное проскальзывание, которое можно оценить заранее, и справедливая стоимость за счет использования выпуклая кривая. Олдридж объясняет метод создания рынка постоянного продукта, используемый популярной системой UniSwap, которая следует выпуклой кривой между количеством один и количеством два. Собирая данные с разных бирж и параметризируя их на основе этого метода постоянного продукта, Олдридж показывает, как брокеры исполнения могут определять, какие платформы выбрать для обеспечения ликвидности и исполнения.

  • 00:35:00 В этом разделе Айрин Олдридж обсуждает расчет соответствующих изменений объема и валюты и моделирует очень простую симуляцию с использованием правила галочки девушки из микроструктуры, чтобы определить, является ли объем покупкой или продажей. Она также объясняет два типа пулов ликвидности, публичный и частный, и арбитраж, который происходит между ними, подчеркивая, что между ними не должно быть разницы на достаточно ликвидных платформах. Затем Олдридж представляет эмпирические примеры использования биткойнов и эфириума с различных бирж, таких как Bitfinex и Bitstamp, и выделяет их кривые, указывая на то, что FTX совсем не похож на то, что мы ожидаем с точки зрения автоматизированного маркетмейкинга, и предполагает, что это мог быть механизм Понци. схема на всем протяжении.

  • 00:40:00 В этом разделе Айрин Олдридж обсуждает дизайн кривых автоматического создания рынка (AMM) и сравнивает их с примерами из различных бирж криптовалют. Она подчеркивает важность использования выпуклых кривых в конструкции AMM для обеспечения стабильности рынка и предотвращения резкого роста цен при выкупе запасов. Кроме того, она объясняет роль поставщиков ликвидности и трейдеров в системе и то, как они получают выгоду от комиссий за транзакции. Олдридж также упоминает слухи об использовании систем AMM на традиционных рынках и подчеркивает необходимость рассмотрения того, как эта конструкция будет работать для таких продуктов, как акции IBM.

  • 00:45:00 В этом разделе Айрин Олдридж обсуждает конвергенцию традиционных рынков и мира автоматизированного маркет-мейкинга, где традиционные маркет-мейкеры уже внедряют аналогичные системы. Она отмечает, что ожидается много изменений в том, как люди взаимодействуют с рынками, как строятся стратегии обучения, как выполняется исполнение и насколько все становится прозрачным. Она также отмечает, что на рынках меняется микроструктура из-за влияния автоматизированных маркет-мейкеров. Айрин дает общее представление о том, как ежедневные данные IBM используются для оценки кривых АММ, и как более детализированные данные упростят получение более точных оценок.

  • 00:50:00 В этом разделе Айрин Олдридж обсуждает возможность внедрения автоматизированной ликвидности в условиях круглосуточной торговли, таких как рынок криптовалют, где традиционные методы маркетмейкинга могут быть не столь эффективными. Она объясняет, что автоматизированное создание рынка может устранить риски, связанные с традиционными методами создания рынка, и что эта технология широко доступна. Однако она предупреждает, что не все криптобиржи используют автоматизированный маркетмейкинг и что необходимы исследования для решения вопросов управления рисками и внешних факторов. Она также отмечает, что эта технология существует с 2002 года и совпала с появлением криптовалют, таких как биткойн. Отвечая на вопрос о потенциальных несправедливых преимуществах доступа к частной информации для автоматизированных маркет-мейкеров, Олдридж отмечает, что это открытая проблема, требующая дальнейшего изучения.

  • 00:55:00 В этом разделе Айрин Олдридж обсуждает, как дилеры AMM или те, кто берет монеты и использует автоматизированные системы создания рынка (AMM), видят поток ордеров раньше других, что представляет проблему. Однако, поскольку существует множество доступных платформ, поиск и количественная оценка автоматизированной кривой создания рынка могут помочь смягчить эту проблему. Айрин также отмечает, что из-за этой проблемы майнеры мотивированы продолжать работу, поскольку только они получают выгоду от изучения и проверки блоков ордеров. Однако, если нет частного стимула, зарабатывать деньги в этом пространстве становится все труднее, что приводит к формированию олигополий. Айрин предполагает, что страхование может быть естественным стимулом для шахтеров получать выгоду и работать почти бесплатно. Тем не менее, страховые компании видят в блокчейне серьезную угрозу своему существованию, поэтому такой дизайн системы встречает сопротивление. Наконец, Айрин отвечает на вопрос о возможности схемы мошенничества, заявляя, что она может быть на кривой IBM, где можно утверждать, что манипулируют дном.

  • 01:00:00 В этом разделе Айрин Олдридж обсуждает использование автоматизированных моделей маркетмейкинга в централизованных книгах лимитных ордеров. Участники рынка используют свои собственные AMM, поскольку они недороги и автоматизированы, обеспечивая ликвидность для рынка с возможностью получения прибыли. Несмотря на это, в настоящее время трудно провести различие между трейдерами, использующими АММ, и теми, кто размещает лимитные ордера вручную. Олдридж предполагает, что выявление злоумышленников с помощью данных микроструктуры может быть открытой проблемой, но если AMM продолжат доминировать на рынке, появится более упорядоченная модель.
 

Агостино Каппони (Колумбия): «Снижают ли частные пулы транзакций риск опережения?»


Агостино Каппони (Колумбия): «Снижают ли частные пулы транзакций риск опережения?»

Агостино Каппони, исследователь из Колумбийского университета, вникает в проблему опережения на децентрализованных биржах и предлагает частные пулы транзакций в качестве потенциального решения. Эти частные пулы работают вне сети и отдельно от общедоступного пула, гарантируя, что валидаторы, приверженные тому, чтобы не участвовать в опережении, обрабатывают их. Однако Каппони признает, что использование частных пулов сопряжено с риском выполнения, поскольку не все валидаторы участвуют в частном пуле, а это означает, что существует вероятность того, что транзакции могут остаться незамеченными и остаться невыполненными. Важно отметить, что принятие частных пулов может не обязательно снизить минимальную плату за приоритет, необходимую для исполнения. Кроме того, Каппони отмечает, что конкуренция между ведущими злоумышленниками приносит пользу валидаторам за счет максимальной извлекаемой стоимости (MEV). В конечном счете, в то время как частные пулы могут снизить первоначальный риск, они могут увеличить комиссию, необходимую для исполнения, что приведет к неэффективности распределения.

Каппони подчеркивает корреляцию между долей транзакций, маршрутизируемых через частные пулы, и вероятностью того, что они будут опережающими, что усложняет оптимальное распределение. Он также исследует различные типы атак с опережением, в том числе атаки подавления и смещения, и представляет данные, показывающие значительные потери, понесенные из-за этого. Чтобы устранить эти риски, Каппони предлагает информировать пользователей о сроках транзакций и сделать проверку транзакций более детерминированной, чтобы создать более справедливую систему.

Обсуждение затрагивает динамику пулов частных транзакций, проблемы внедрения и возможные компромиссы. Каппони объясняет, как частные пулы обеспечивают защиту от опережающего запуска, но предупреждает, что их эффективность зависит от количества валидаторов, участвующих в частном пуле. Кроме того, он рассматривает проблему валидаторов, не использующих частные пулы из-за потери MEV, предлагая потенциальные решения, такие как субсидии пользователям, чтобы стимулировать их внедрение.

Хотя частные пулы транзакций могут в некоторой степени снизить первоначальные риски, Каппони подчеркивает, что они не являются надежными и не могут обеспечить оптимальное распределение. Сложность возникает из-за таких факторов, как конкуренция между злоумышленниками, скорость принятия валидаторов в частных пулах и, как следствие, влияние на комиссию за выполнение. Обсуждение поднимает важные вопросы для сообщества блокчейнов по устранению передовых рисков и обеспечению справедливой и эффективной среды децентрализованного обмена.

  • 00:00:00 В этом разделе Агостино Каппони представляет тему децентрализованных бирж и рисков, с которыми они сталкиваются. Он объясняет, что архитектура блокчейна работает, когда транзакции отправляются в пул памяти, к которому затем обращаются валидаторы, которые добавляют транзакции в блоки и получают комиссию от пользователей. Каппони отмечает, что пользователи могут расставлять приоритеты в своих транзакциях, предлагая более высокие комиссии, но эта система может привести к опережению. Он представляет концепцию частных пулов как потенциальное решение этой проблемы и обсуждает, как его команда построила модель теории игр для проверки эффективности этих пулов в смягчении последствий опережения.

  • 00:05:00 В этом разделе Агостино Каппони описывает проблему опережения в общедоступных блокчейнах с открытым доступом, которые позволяют пользователям просматривать и отправлять транзакции. Фронтальные атаки происходят, когда пользователи используют полезную информацию об ожидающих или выполненных транзакциях. Каппони объясняет сэндвич-атаку, когда злоумышленник взимает более высокую плату за выполнение транзакции перед пользователем, вызывая рост цены, а затем выполняет обратную транзакцию для получения прибыли. Хотя существует риск неудачи, если гонорар злоумышленника недостаточно высок, злоумышленники обычно рассчитывают свои заказы, чтобы увеличить свои шансы на успех.

  • 00:10:00 В этом разделе Агостино Каппони обсуждает несколько типов атак с опережением, включая атаки подавления и атаки смещения, в которых злоумышленник отправляет несколько транзакций или замещает транзакцию другого пользователя, чтобы сначала выполнить желаемую транзакцию. Каппони задается вопросом, является ли опережающий запуск материальным риском, который ограничивает внедрение блокчейна, и представляет график, показывающий количество опережающих атак и доход, полученный от них с мая 2020 года по март 2021 года, что указывает на потерю примерно 10 000 эфириумов, или 125 миллионов долларов. двое впереди бегут.

  • 00:15:00 В этом разделе Агостино Каппони обсуждает проблему опережения в транзакциях Ethereum и связанных с этим затрат, как прямых, так и косвенных. Он объясняет, что одним из решений этой проблемы является использование частных пулов транзакций, которые по сути представляют собой параллельные каналы вне сети, которые отделены от общедоступного пула и могут контролироваться только некоторыми валидаторами. Транзакции, отправленные в эти частные пулы, не имеют риска опережения, если валидаторы ведут себя честно, и если будет обнаружено, что они являются опережающими транзакциями, они будут исключены из пула. В целом, частные пулы транзакций представляют собой хорошее решение для тех, кто беспокоится об опережении и хочет, чтобы их транзакции выполнялись без опережения.

  • 00:20:00 В этом разделе Агостино Каппони обсуждает использование частных пулов транзакций и то, могут ли они снизить риск опережения. Каппони объясняет, что частные пулы видны только валидаторам и находятся вне сети, то есть злоумышленники не могут получить к ним доступ. Это исключает возможность опережения и дает гарантии, поскольку валидаторы обязуются не участвовать в опережении. Каппони также решает вопрос принятия и того, будут ли пользователи отправлять свои транзакции в пул. Кроме того, он упоминает, что злоумышленники могут по-прежнему конкурировать друг с другом, но частный пул может снизить риск недостаточного инвестирования арбитражными ботами. Наконец, он представляет простую модель с тремя агентами, чтобы обсудить, будет ли наблюдаться внедрение частных пулов.

  • 00:25:00 В этом разделе Агостино Каппони обсуждает концепцию частных пулов транзакций и то, снижают ли они непосредственные риски. Он объясняет, что есть два возможных места для отправки транзакций: частный пул и публичный пул. После того, как валидаторы выбрали пул для мониторинга, пользователи превзойдут свою приоритетную комиссию и выберут, где они хотят отправить транзакцию. Затем злоумышленники сканируют возможности, отправляют транзакции и решают, куда их отправить. Каппони подчеркивает важность вероятности в обнаружении возможностей и вероятности достижения успешного аванса.

  • 00:30:00 В этом разделе спикер объясняет концепцию частных пулов транзакций и то, могут ли они снизить риски опережения. Частные пулы транзакций могут обеспечить защиту от рисков опережения, поскольку только валидатор, который добавляет блок, может видеть транзакции, не позволяя другим арбитрам определять возможности раньше пользователя. Однако отправка через частный пул связана с риском выполнения, так как не все валидаторы будут в частном пуле, и есть вероятность, что транзакция может быть невидимой и, следовательно, не выполненной. Хотя транзакции в частном пуле имеют приоритет над транзакциями в публичном пуле, количество валидаторов, контролирующих частный пул, влияет на риск выполнения, что заставляет пользователей учитывать это перед отправкой транзакции через частный пул.

  • 00:35:00 В этом разделе Агостино Каппони объясняет, что частные пулы транзакций могут в некоторой степени снизить риски, связанные с опережением, но это не является надежным. Злоумышленники будут участвовать в гонке вооружений, чтобы получить приоритет в выполнении своего заказа, и они могут использовать как частные, так и общедоступные пулы, чтобы снизить риск выполнения, но при этом получить приоритетное выполнение. Между тем, пользователи, которые могут быть опережающими, будут решать, отправлять ли свои транзакции в частный пул или общедоступный пул, в зависимости от скорости принятия валидаторов в частном пуле и предварительных затрат. Если скорость внедрения высока, они будут использовать частный пул, чтобы избежать опережения, но если она низкая, они могут выбрать общедоступный пул, чтобы избежать ожидания слишком большого количества блоков для выполнения, несмотря на риск опережения.

  • 00:40:00 В этом разделе Агостино Каппони объясняет, как частные пулы транзакций могут потенциально снизить риск опережения. Если пользователь отправляет данные в приватный пул, и все валидаторы присоединяются к этому пулу, первоначальный риск устраняется, поскольку нет возможности для арбитража. Однако в случаях, когда риск предварительного запуска низкий, не все валидаторы будут использовать частный пул, а это означает, что пользователь может вместо этого выбрать общедоступный пул, снова подвергая себя риску предварительного запуска.

  • 00:45:00 В этом разделе Агостино Каппони обсуждает, могут ли частные пулы транзакций снизить предварительный риск и снизить минимальную комиссию, необходимую для исполнения. Утверждается, что опережающий риск устраняется только в том случае, если потери велики, и даже в этом случае некоторые опережающие убытки не могут быть устранены. Кроме того, конкуренция между передовыми злоумышленниками приносит пользу валидаторам или майнерам за счет максимальной извлекаемой стоимости (MEV). Принятие частных пулов не обязательно может снизить минимальную комиссию за приоритет, необходимую для исполнения, поскольку валидаторы готовы использовать частные пулы только в том случае, если они могут заработать более высокую комиссию. Более того, наличие частного пула может привести к увеличению спроса на блочное пространство, что приведет к увеличению платы, необходимой для исполнения. В конечном счете, частные пулы не всегда могут снизить первоначальный риск, но могут увеличить комиссию, необходимую для исполнения, что приведет к неэффективности распределения.

  • 00:50:00 В этом разделе спикер обсуждает неэффективность, вызванную первоначальными рисками в блокчейнах. Первая неэффективность возникает из-за того, что пользователи могут решить не отправлять транзакции из-за риска опережения, что может привести к неоптимальному распределению транзакций. Вторая неэффективность возникает из-за атак с опережением, когда злоумышленник выполняет транзакцию раньше жертвы, что приводит к передаче ценности. Чтобы снизить эти риски, предлагаются частные пулы транзакций, которые могут увеличить ценность транзакций и помочь пользователям отправлять заявки, не опасаясь опережения. Однако принятие частных пулов всеми валидаторами не всегда достижимо из-за плохого MEV и, как следствие, потери дохода для валидаторов.

  • 00:55:00 В этом разделе Агостино Каппони обсуждает проблему валидаторов, не использующих частные пулы, хотя это было бы социально оптимальным исходом. Причина в том, что они потеряют свой MEV (максимальная извлекаемая стоимость) и без какой-либо выгоды для них они не будут переключаться. Решением для передовых пользователей было бы субсидирование валидаторов, взяв на себя обязательство платить им в денежном эквиваленте то, что они сэкономили бы, не будучи передовыми. Данные показывают, что если конкуренция за то, чтобы быть первым, кто выполнит задачу, является жесткой, соотношение затрат и доходов злоумышленников будет значительно ниже из-за внедрения частных пулов флэш-ботов.
  • 01:00:00 В этом разделе Агостино Каппони обсуждает свое исследование пулов частных транзакций и того, снижают ли они риск опережения. Он объясняет, что, хотя частные пулы могут предложить некоторое смягчение больших убытков, они не выгодны для злоумышленников, использующих арбитражных ботов, поскольку это может ухудшить их ситуацию. Вероятность опережения можно оценить, посмотрев на проскальзывание сделки по сравнению с ценой, которую необходимо заплатить за опережение. Каппони отмечает, что существует положительная корреляция между вероятностью опережения и долей транзакций, которые проходят через частные пулы. Он приходит к выводу, что частные пулы не могут обеспечить оптимальное распределение, поскольку не все валидаторы контролируют пул, что приводит к неэффективности, такой как риск опережения или выделение блочного пространства для транзакции с опережением.

  • 01:05:00 В этом разделе Агостино Каппони из Колумбийского университета обсуждает использование частных пулов транзакций, чтобы избежать первоначальных рисков в блокчейне, особенно в Ethereum и Polygon. Он также отмечает, что в настоящее время существует монополистическая организация, которая получает все вознаграждения провайдера, и Ethereum рассматривает такие решения, как сжигание или перераспределение незначительной извлекаемой стоимости (MEV), чтобы предотвратить это. Каппони также поднимает спорный вопрос об оружии математического разрушения в контексте транзакций в блокчейне и передаче ценности от тех, кто не понимает формулы, к тем, кто ее понимает.

  • 01:10:00 В этом разделе спикеры обсуждают проблему опережения в частных пулах транзакций и то, как это может повлиять на неискушенных пользователей, таких как семейные офисы. Они предполагают, что для того, чтобы сделать систему более справедливой, должен быть способ обучить этих пользователей тому, как лучше рассчитывать время своих транзакций, чтобы избежать опережения. Они также отмечают, что боты, которые участвуют в опережении, чрезвычайно сложны и используют сложные алгоритмы для определения наилучшего способа выполнения транзакций при получении наибольшей прибыли. Выступающие предполагают, что если бы время проверки транзакций было более детерминированным, пользователям было бы проще рассчитывать время своих транзакций и снизить риск опережения.
 

Д-р Кевин Вебстер: «Получение большего за меньшие деньги — лучшее A/B-тестирование с помощью причинно-следственной регуляризации»



Д-р Кевин Вебстер: «Получение большего за меньшие деньги — лучшее A/B-тестирование с помощью причинно-следственной регуляризации»

В этом видео д-р Кевин Вебстер углубляется в проблемы, связанные с торговыми экспериментами и причинно-следственным машинным обучением, раскрывая различные ключевые темы. Одной из важных проблем, которую он решает, является предвзятость прогнозов в торговле, когда наблюдаемая прибыль во время сделки представляет собой комбинацию влияния цены и прогнозируемого движения цены. Чтобы смягчить эту предвзятость, д-р Вебстер предлагает два подхода: использование рандомизированных торговых данных и применение причинно-следственной регуляризации. Включив торговый сигнал, вызвавший сделку, в регрессионную модель, можно устранить погрешности.

Д-р Вебстер вводит понятие причинно-следственного графика, который включает три переменные: альфа сделки, размер сделки и прибыль во время сделки. Он утверждает, что точная оценка воздействия на цену без наблюдения за альфой затруднена, а традиционные методы эконометрики в этом отношении не работают. Он подчеркивает ограничения рандомизированных торговых экспериментов из-за их ограниченного размера и продолжительности, подчеркивая необходимость тщательного планирования эксперимента и оценки затрат с использованием симуляторов.

Чтобы преодолеть недостатки традиционной эконометрики, доктор Вебстер выступает за причинно-следственную регуляризацию. Этот метод, полученный от Amazon, использует смещенные данные для обучения и несмещенные данные для тестирования, в результате чего получаются оценки с низким смещением и низкой дисперсией. Он использует множество доступных организационных данных и исправляет предубеждения, обеспечивая более точные прогнозы.

Оценка альфы без знания ее влияния представляет серьезную проблему, особенно когда торговые данные ненадежны. Доктор Вебстер предлагает использовать случайную подачу заявок для получения объективных данных, не полагаясь на технологию ценообразования. Однако этот подход требует отказа от значительной части сделок, чтобы установить доверительный интервал для альфы, что может оказаться нецелесообразным. В качестве альтернативы он предлагает использовать каузальное машинное обучение для достижения аналогичных результатов с меньшим объемом данных. Причинное машинное обучение оказывается особенно ценным в торговых приложениях, таких как анализ транзакционных издержек, оценка влияния цены и альфа-исследование, превосходя традиционную эконометрику из-за наличия глубоких, необъективных торговых данных.

Докладчик также углубляется в важность статистического анализа в A/B-тестировании, подчеркивая необходимость определения влияния цены и добавления статистической меры для борьбы с предвзятостью прогнозов. Без устранения этой предвзятости анализ становится субъективным и зависит от индивидуальной интерпретации. Д-р Вебстер признает проблемы, связанные с общедоступными данными наблюдений, и подчеркивает выводы, полученные на основе интервенционных данных. Хотя ответить на вопрос, какой подход выбрать, сложно, A/B-тестирование остается обычной практикой в банковской и брокерской отраслях.

Наконец, д-р Вебстер кратко обсуждает взаимосвязь между трансферным обучением и каузальной регуляризацией. В то время как оба предполагают обучение модели на одном наборе данных и применение ее к другому, трансферному обучению не хватает причинно-следственной интерпретации. Аналогия между ними заключается в их процессе проверки, при этом перекрестная проверка играет ключевую роль. Несмотря на их математическое сходство, д-р Вебстер подчеркивает новизну причинной интерпретации в подходе.

  • 00:00:00 Кевин Вебстер рассказывает об экспериментах в реальной торговле и машинном обучении. Он описывает сценарий, в котором хедж-фонд торгует через брокера, который отвечает за исполнение сделки и обеспечение наилучшего исполнения, доказывая при этом, что они действовали в интересах клиента. Брокер сталкивается с трудностями, поскольку его клиенты не торгуют случайным образом на основе альфа-сигналов, а наблюдаемая прибыль во время сделки представляет собой сочетание влияния на цену и прогнозируемого движения цены, вызванного сделкой. Вебстер стремится решить эту проблему, используя причинно-следственную регуляризацию, и предлагает модель, которая изучает, как прогнозируемое движение цены связано с потоком заказов.

  • 00:05:00 Спикер обсуждает разницу между альфа-сигналами и влиянием цены, которые являются двумя компонентами доходности. Альфа-сигналы предсказывают движение цены, которое произойдет независимо от того, торгуются акции или нет, в то время как влияние цены описывает движение цены, вызванное торговлей. Трейдеры используют ценовые обратные холмы, чтобы смоделировать, как цены будут реагировать на их сделки, и ответить на сценарии «что, если». Однако трудно определить, вызвали ли трейдеры движение цены или предсказали его, что приводит к предвзятости прогнозов. Запатентованные данные CFM и другие методы могут помочь устранить систематические ошибки и исправить систематическую ошибку прогноза путем учета торгового сигнала, вызвавшего сделку в регрессии.

  • 00:10:00 В этом разделе видео доктор Кевин Вебстер обсуждает проблему предвзятости прогнозов в трейдинге и то, как она влияет как на брокеров, так и на исследователей альфа-каналов. Он объясняет, что, хотя альфа-исследователь может иметь альфа-сигнал, у него может не быть хорошей модели влияния на цену, что приводит к завышенной оценке альфа. И наоборот, если брокеры не знают альфу, они будут торговать слишком медленно для клиента. Доктор Вебстер предлагает использовать рандомизированную торговлю, которая является дорогостоящей, или причинно-следственную регуляризацию, метод, который разумно сочетает рандомизированные торговые данные и исторические данные, чтобы получить лучшую производительность, чем традиционная эконометрика. В заключение он заявляет, что сравнит эффективность этих методов с помощью моделирования.

  • 00:15:00 Доктор Кевин Вебстер обсуждает три метода эконометрического тестирования, подчеркивает важность причинно-следственного вывода и объясняет, как он уже активно используется в технологической отрасли, особенно в сообществе машинного обучения. Он также подчеркивает, как эти компании используют каузальное машинное обучение, чтобы позволить своим командам быстро согласовывать факты, исключать повторные исследования неожиданных результатов, избегать повторного проведения ошибочных экспериментов и предотвращать переоценку важных решений. В методах доктора Вебстера используется сочетание причинно-следственной и эконометрической проверки, что позволяет делать более точные прогнозы на основе в пять раз меньшего количества данных.

  • 00:20:00 Автор предлагает причинно-следственный график для своего исследования, который включает три переменные: альфа сделки, размер сделки и доходность в ходе сделки. Он предполагает, что основные черты его альфа-моделей определяют различные фундаментальные движения цены акции, а его торговый алгоритм реагирует на альфа-сигналы, вызывая сделки. Он также предполагает, что сделки вызывают движение цен, известное как воздействие на цену. По словам доктора Вебстера, независимо от того, какую причудливую технику регрессии используют трейдеры, они не смогут оценить влияние цены, не наблюдая за Альфой. Трейдеры могут оценить влияние цены, рандомизировав его, что активно используется в финансовой индустрии и известно как рандомизированные торговые расходы. Однако его использование ограничено только существенными заказами, потому что такие рандомизации дороги.

  • 00:25:00 Спикер обсуждает ограничения рандомизированных торговых экспериментов по сравнению с наблюдательными данными из-за ограниченного размера и продолжительности экспериментов. Для разумного набора параметров набор данных наблюдений может быть больше, чем набор интервенционных данных, и трейдеры должны планировать эксперименты до их развертывания из-за риска совершения ошибок. Использование симулятора для определения стоимости и доверительного интервала эксперимента перед отправкой случайных сделок имеет решающее значение. Без учета смещения игнорирование Альфы приведет к высокому смещению и низкой дисперсии.

  • 00:30:00 Д-р Кевин Вебстер объясняет ограничения традиционной эконометрики и представляет концепцию причинной регуляризации, которая представляет собой метод, пришедший из Amazon и включающий использование данных смещения в качестве обучающих данных и объективных данных в качестве тестовых данных для настройки метапараметров. Этот метод обеспечивает оценку с низким смещением и низкой дисперсией, в отличие от традиционных методов, которые используют только небольшой объем экспериментальных данных. Алгоритм причинно-следственной регуляризации позволяет использовать большие доступные организационные данные и корректировать любые предубеждения, чтобы предоставить трейдерам точные оценки.

  • 00:35:00 В этом разделе видео д-р Кевин Вебстер обсуждает проблемы оценки Альфы, не зная последствий, когда нет доверия к торговым данным. Он предлагает решение, при котором сделки не отправляются случайным образом, чтобы получить объективные данные, которое не требует моделей и не требует технологии ценообразования. Однако недостатком является то, что для получения доверительного интервала по Альфе необходимо отказаться от значительной части сделок, что может быть нецелесообразно для трейдеров. Затем он предлагает метод машинного обучения для решения этой проблемы и получения того же результата с меньшим объемом данных. Причинное машинное обучение применимо к торговым приложениям, таким как анализ транзакционных издержек, влияние цены и альфа-исследование, и превосходит традиционную эконометрику в режимах торговых данных из-за наличия глубоких, необъективных торговых данных.

  • 00:40:00 Докладчик обсуждает фундаментальную неопределенность, связанную с A/B-тестированием, и то, как статистический анализ играет решающую роль в поиске фактов, которые являются статистически значимыми, но не на уровне отдельных сделок. Он подчеркивает, что определение воздействия на цену и добавление к этому определению статистического числа может помочь в борьбе с предвзятостью прогнозов. Однако без каких-либо средств борьбы с предвзятостью прогнозов анализ становится субъективным и зависит от взгляда наблюдателя. Д-р Вебстер также обсуждает проблемы, связанные с общедоступными данными наблюдений, и то, как интервенционные данные могут обеспечить более глубокое понимание анализа. Он признает, что, хотя на этот вопрос сложно ответить, A/B-тестирование — это обычная трансформация, которую используют многие банки и брокеры.

  • 00:45:00 Доктор Кевин Вебстер кратко обсуждает взаимосвязь между трансферным обучением и каузальной регуляризацией. Он отмечает, что между ними есть аналогия, поскольку оба предполагают обучение модели на одном наборе данных и надежду, что она будет хорошо работать на другом наборе данных. В то время как в трансферном обучении отсутствует каузальная интерпретация, доказательство трансфертного обучения работает благодаря перекрестной проверке, которая также применима к каузальной регуляризации. Несмотря на математическое сходство, д-р Вебстер утверждает, что каузальная интерпретация этого подхода совершенно нова.
 

Юю Фан (Альянс Бернштейн): «Использование анализа текста для извлечения информации»



Юю Фан (Альянс Бернштейн): «Использование анализа текста для извлечения информации»

Юю Фан, исследователь из Alliance Bernstein, дает ценную информацию о применении обработки естественного языка (NLP) и машинного обучения для анализа расшифровок телефонных разговоров и создания эффективных торговых стратегий.

Команда Фэна использовала различные методы, в том числе анализ настроений, бухгалтерский анализ и оценку удобочитаемости, чтобы просмотреть более 200 функций, извлеченных из расшифровок телефонных разговоров о доходах. Они использовали передовые модели, такие как BERT (представление двунаправленного кодировщика от трансформеров), чтобы оценить настроение выступающих, сравнив настроение руководителей с мнением аналитиков. Интересно, что они обнаружили, что настроения аналитиков, как правило, более надежны.

Анализ проводился как по отдельным разделам, так и по комбинированным разделам расшифровок, и команда обнаружила, что контекстно-ориентированный подход превосходит наивный подход, основанный на фоновых словах. Сигнал настроений, особенно для американских компаний с малой капитализацией, показал хорошие результаты и был рекомендован инвестиционными командами.

Объясняя методологию, Фан описывает, как их команда использовала квантильный скрининг и ретроспективное тестирование для оценки производительности различных функций. Они изучили оценки настроений на основе подходов на основе словаря, а также подходов на основе контекста с использованием BERT. Команда также изучила показатели удобочитаемости, которые измеряют легкость понимания текста, уделяя особое внимание комментариям генерального директора, чтобы выявить потенциальные корреляции с эффективностью компании.

Fan дает представление о работе BERT, выделяя его двунаправленное представление кодировщика, которое захватывает контекстную информацию слева и справа от заданного слова. Команда доработала модель BERT для анализа настроений, добавив метки настроений с помощью самомаркировки и внешних наборов данных. Их результаты показали, что анализ настроений на основе BERT превзошел анализ настроений на основе словаря, о чем свидетельствуют примеры из расшифровок телефонных разговоров о доходах.

Кроме того, Фан обсуждает проблемы установки пороговых значений точности для анализа тональности и подчеркивает, что практическая производительность может незначительно различаться между уровнями точности. Она подчеркивает успех их сигнала настроения в отношении американских компаний с малой капитализацией, что привело к его рекомендации инвестиционными командами. Фан также упоминает публикацию статьи с подробным описанием функций НЛП, которые могут служить количественными сигналами для создания эффективных торговых стратегий, с постоянными усилиями по улучшению модели за счет увеличения данных.

Обсуждение расширяется, чтобы охватить корреляцию между функциями НЛП и традиционными фундаментальными и количественными характеристиками, подчеркивая умеренную корреляцию, наблюдаемую для удобочитаемости и учета настроений. Фан разъясняет свою методологию возврата, включая выбор компаний на основе последней доступной информации до ребалансировки.

Ближе к концу Фан затрагивает такие темы, как арбитраж CO2, разницу между BERT и FinBERT и разработку модели финансового использования для BERT, специально предназначенной для финансовых документов, доходов и новостей. Также упоминается процесс преобразования аудиоданных в стенограммы для анализа с использованием служб транскрипции и решений поставщиков.

Таким образом, исследование Юю Фань демонстрирует возможности НЛП и методов машинного обучения при анализе расшифровок телефонных разговоров. Применение анализа настроений, бухгалтерского анализа и оценки удобочитаемости наряду с использованием передовых моделей, таких как BERT, позволяет создавать эффективные торговые стратегии. Контекстно-ориентированный подход превосходит наивные подходы, а сигнал настроений оказывается ценным, особенно для компаний с малой капитализацией в США, как это рекомендовано инвестиционными командами Alliance Bernstein.

  • 00:00:00 Юю Фан рассказывает об использовании обработки естественного языка (NLP) для анализа расшифровок телефонных разговоров в сфере финансов. Компании используют отчеты о прибылях и убытках, чтобы делиться финансовой и деловой информацией с инвестиционным сообществом, и аналитики обычно анализируют стенограммы на предмет информации, которая может повлиять на результаты деятельности компаний и цены на акции. Однако ручной анализ транскриптов для большого множества компаний является трудоемким, и именно здесь вступают в действие методы НЛП и машинного обучения. Доказано, что такие методы эффективны при анализе финансовых документов и формулировании эффективных торговых стратегий. Исследование Юю Фан выходит за рамки типичного тестирования компаний с большой капитализацией в США и включает в себя различные универсальные капитализации, в том числе компании с малой капитализацией в США и развивающиеся рынки. Кроме того, анализ проводится на отдельных разделах, а также на объединенных разделах расшифровок, и систематическое сравнение показывает, что контекстно-ориентированный подход превосходит наивный подход, основанный на фоновых словах.

  • 00:05:00 Юй Фан обсуждает данные, использованные для их анализа текстового анализа, и объясняет структуру расшифровок телефонных разговоров о доходах, которые состоят из двух разделов — презентации и раздела вопросов и ответов. Они создали функции НЛП для каждого из этих отдельных разделов, а также для объединенных разделов. Три категории сгенерированных функций НЛП — это оценки настроений, учета и удобочитаемости. Они также предоставляют простой метод обратного тестирования для их анализа. Функции тональности далее делятся на две категории, одна на основе словаря, а другая на основе контекста.

  • 00:10:00 Юй Фан из Alliance Bernstein объясняет, как они используют интеллектуальный анализ текста для просмотра более 200 функций, которые генерируются для поиска надежных и эффективных инвестиционных сигналов. Они учитывают не только интеллектуальный анализ данных, но и фундаментальный анализ и экономическую интуицию, а также предшествующие исследования. Они ранжируют компоненты по значениям характеристик и отслеживают ежемесячные доходы для каждого квантиля, чтобы оценить производительность. Первая категория — это простое количество слов, и одна из функций — это количество слов в вопросе аналитика, которое обычно имеет стабильную производительность с их предыдущим ожиданием, за исключением развивающихся рынков, которые имеют другое поведение. Они оценивают производительность, используя базовые показатели, такие как годовая доходность и стена, и обнаруживают, что этот сигнал не так уж и хорош.

  • 00:15:00 Спикер объясняет концепцию оценок удобочитаемости и то, как ее команда использует их для анализа комментариев генерального директора. Оценки удобочитаемости — это метрика, используемая для измерения сложности чтения и понимания текста с учетом количества сложных слов и длины предложения. Более высокие баллы означают, что текст труднее понять, а более низкие баллы означают, что его легче понять. Команда Фана использовала пакет Python с открытым исходным кодом под названием «текстовая статистика» для расчета показателей удобочитаемости комментариев генерального директора, исходя из гипотезы, что более простые для понимания комментарии с большей вероятностью приведут к прозрачности и хорошей работе компаний. Затем команда использовала квантильный скрининг, чтобы оценить различные функции и порекомендовать наиболее эффективные из них инвестиционным командам.

  • 00:20:00 Фанат Юю из Alliance Bernstein обсуждает, как можно использовать анализ настроений для извлечения информации из расшифровок выступлений генерального директора. Фан объясняет, что оценки тональности могут быть рассчитаны с использованием подходов на основе словарей, таких как общие или проприетарные словари, специально разработанные для финансовых исследований. Результаты показывают, что анализ настроений, основанный на словаре LM, несет больше инвестиционных сигналов, особенно для компаний с малой капитализацией США. Используется ежемесячная ребалансировка, и компании ранжируются по нейтральным для сектора квинтилям. Результаты для каждого квинтиля более различимы при использовании анализа тональности, что указывает на то, что более высокая тональность приводит к лучшей производительности.

  • 00:25:00 Юй Фан из Alliance Bernstein объясняет, как их команда использовала интеллектуальный анализ текста для извлечения информации и оценки настроений говорящего. Они проанализировали различия между настроениями генерального директора и настроениями аналитиков и обнаружили, что настроения аналитиков могут быть более надежным индикатором из-за того, что руководители потенциально искажают результаты анализа в отношении своей речи. Они также углубились в понимание естественного языка, в частности, используя модель Transformer под названием BERT. BERT использует представление двунаправленного кодировщика, что означает, что он принимает во внимание окружающую информацию слева и справа, чтобы лучше предсказывать значение конкретного слова в его контексте.

  • 00:30:00 Юй Фан объясняет, как модель BERT (представления двунаправленного кодировщика от трансформеров) работает для анализа тональности. Кодирующая часть модели используется для латерального понимания языка (понимание языка без необходимости перевода). Вложения из этой части модели могут представлять информацию из всего предложения и могут быть точно настроены для создания модели классификации настроений. Благодаря использованию предварительно обученных моделей BERT и добавлению последующей задачи классификации тональности точная настройка значительно упрощается. Метки настроений добавляются с помощью самомаркировки и присваиваются меткам через внешние наборы данных, а модель обучается прогнозировать оценки настроений в диапазоне от -1 до 1. Наконец, Фан показывает, что анализ настроений на основе BERT превосходит анализ настроений на основе словаря. анализ настроений с примерами расшифровок телефонных разговоров о доходах.

  • 00:35:00 Юй Фан из Alliance Bernstein обсуждает интеллектуальный анализ текста и то, как можно настроить предварительно обученную модель BERT с помощью конкретных предложений с метками для улучшения классификации финансового текста. Большой словарный запас английских токенов в предварительно обученной модели позволяет фиксировать комбинации и генерировать слова, но может не охватывать конкретный финансовый язык. Отвечая на вопрос об эффективности предложений с положительными и отрицательными словами, Юю Фан объясняет, что классификация может зависеть от интерпретации и ожиданий аналитика, но само предложение может быть классифицировано как положительное, если оно сообщает об увеличении дохода на 10%.

  • 00:40:00 Юй Фан из Alliance Bernstein объясняет, что трудно установить жесткий порог точности анализа настроений. Хотя это может иметь большое значение в академических кругах, в практических приложениях это может не иметь большого значения, поскольку точность 90% и точность 92% могут привести к одинаковым результатам при агрегировании на уровне раздела с использованием среднего или стандартного отклонения. Фан объясняет, что их модель имеет точность около 90% для всех предложений, а их сигнал настроений хорошо работает для компаний с малой капитализацией в США, что делает его сигналом, который их инвестиционные команды рекомендуют использовать. Фан также сообщает, что они опубликовали документ с более подробной информацией о функциях НЛП, которые можно использовать в качестве количественных сигналов для формирования эффективных торговых стратегий, и в настоящее время они работают над увеличением данных для улучшения модели.

  • 00:45:00 Юй Фан, специалист по данным в Alliance Bernstein, обсуждает, как их функции НЛП коррелируют с традиционными фундаментальными и количественными характеристиками. Они обнаружили, что корреляции, как правило, низкие, а удобочитаемость и учет настроений имеют среднюю корреляцию около 0,54 для моментума с большой капитализацией. Она также объясняет, как они измеряют удобочитаемость с помощью таких пакетов, как налоговая статистика, и настраивают их использование. Фан далее разъясняет свою методологию доходности, где они отслеживают доходность за один месяц и включают только компании с самой последней информацией, доступной до дня ребалансировки, обычно после того, как ежеквартальные отчеты требуют больших капиталовложений. Наконец, она отвечает на вопрос об арбитраже CO2 и разъясняет разницу между BERT и FinBERT, которую они используют в своем методе.

  • 00:50:00 Юй Фан обсуждает использование анализа текста для извлечения информации. Она упоминает о разработке модели финансового использования модели BERT, специально ориентированной на регистрацию, доходы и новости, связанные с финансами. Модель различает предварительно обученные версии и те, которые точно настроены, с метками для положительных, отрицательных и нейтральных выходных вероятностей. Фан отмечает, что точность модели варьируется в разных секторах, и они изучают возможности для увеличения данных, чтобы улучшить классификацию настроений по конкретным темам. Раздел заканчивается обсуждением процесса преобразования аудиоданных в стенограммы для анализа.

  • 00:55:00 Юй Фан из Alliance Bernstein обсуждает использование анализа текста для извлечения информации. Компания использует SMT для получения высококачественных данных поставщиков, а также услуги расшифровки и решения поставщиков для совместной работы. Они также экспериментируют с моделью под названием Whisper от Open AI, в которой используются крупномасштабные модели преобразователей для аудиотранскрипции, включая многоязычную транскрипцию. Однако из-за нехватки времени сессия вопросов и ответов на этом заканчивается.
 

Чиамак Моаллеми (Колумбия): «Предоставление ликвидности и автоматизированное формирование рынка»



Чиамак Моаллеми (Колумбия): «Предоставление ликвидности и автоматизированное формирование рынка»

В этом всестороннем обсуждении Чиамак Моаллеми, профессор Колумбийского университета, с разных точек зрения углубляется в тонкости предоставления ликвидности и автоматического создания рынка (AMM). Он подчеркивает актуальность AMM для решения проблем с вычислениями и хранением, с которыми сталкиваются платформы блокчейна, и их способность генерировать положительную прибыль для поставщиков ликвидности. Чтобы проиллюстрировать концепцию, Моаллеми представляет стоимость неблагоприятного отбора для волатильности в UniSwap V2, раскрывая ежегодные затраты примерно в 39 000 долларов США для пула в 125 миллионов долларов. Он подчеркивает важность волатильности и объема торгов для определения доходности поставщиков ликвидности и разъясняет, как АММ справляются с арбитражерами и информированными трейдерами.

Моаллеми подчеркивает преимущества использования AMM в блокчейне и исследует роль функций объединенной стоимости и функций связи. Он подчеркивает важность хеджирования рисков и затрат, связанных со стратегиями ребалансировки. Кроме того, Моаллеми представляет свою собственную модель предоставления ликвидности и автоматического создания рынка, сравнивая ее с фактическими данными из блокчейна Ethereum. Он обсуждает, как его модель может потенциально улучшить AMM за счет снижения затрат, выплачиваемых посредникам. Моаллеми предлагает различные подходы для снижения неэффективности, вызванной неоптимальными ценами, такие как использование оракула в качестве источника данных и продажа арбитражных прав авторизованным участникам, что позволяет им торговать против пула без комиссий.

Кроме того, Моаллеми разъясняет преимущества AMM по сравнению с традиционными книгами лимитных ордеров, особенно с точки зрения простоты и доступности. Он подчеркивает, как AMM выравнивают игровое поле для менее искушенных участников, устраняя необходимость в сложных алгоритмах и обширных ресурсах. В заключение Моаллеми выразил оптимизм по поводу потенциала более эффективных структур, которые принесут пользу более широкому кругу участников, позиционируя AMM как шаг в правильном направлении.

  • 00:00:00 В этом разделе Чиамак Моаллеми из Колумбийского университета обсуждает предоставление ликвидности и автоматизированное создание рынка, уделяя особое внимание автоматическим маркет-мейкерам в мире криптовалют. Он объясняет, что проблема торговли в значительной степени решается с помощью электронных книг лимитных ордеров в традиционных финансах, но есть несколько проблем с оптовым внедрением этой структуры в криптовалюту. Моаллеми обсуждает затраты на вычисления и хранение при использовании блокчейна для торговли и то, как автоматизированные маркет-мейкеры могут решать эти проблемы, используя алгоритмы ценообразования, чтобы указывать цены покупки и продажи актива, обеспечивая ликвидность на рынке.

  • 00:05:00 В этом разделе спикер обсуждает проблемы использования книг лимитных ордеров для торговли в среде с высокой частотой обновления и ограниченными вычислениями и хранилищем. Создание рынка требует участия активных маркет-мейкеров, и его может быть сложно освоить в мире криптовалют, особенно для новых токенов. Чтобы решить эти проблемы, люди разработали автоматических маркет-мейкеров (AMM), которые используют поставщиков ликвидности для размещения пула активов, таких как ETH и доллары США, в пул. Эти AMM эффективны в вычислительном отношении и не требуют сортировки или сравнения, что делает их идеальными для сред блокчейна. Поставщики ликвидности получают комиссию за торговлю против пула, а цена устанавливается в зависимости от того, что находится в пуле.

  • 00:10:00 В этом разделе Чамак Моаллеми обсуждает предоставление ликвидности и автоматическое создание рынка (AMM) с точки зрения поставщиков ликвидности, указывая на затраты и преимущества использования систем AMM, таких как UniSwap. Моаллеми объясняет, что, хотя поставщики пассивной ликвидности могут получать комиссионные через системы AMM, создание рынка всегда сопряжено с издержками, такими как неблагоприятный отбор. Используя конкретный пример из UniSwap V2, Моаллеми показывает, что стоимость неблагоприятного отбора для волатильности обычно составляет три базисных пункта, что приводит к годовой стоимости около 39 тысяч для пула стоимостью 125 миллионов долларов. Несмотря на стоимость, Моаллеми отмечает, что системы AMM могут приносить положительную прибыль поставщикам ликвидности, но важно точно оценить связанные с этим риски и затраты.

  • 00:15:00 В этом разделе Чиамак Моаллеми из Колумбийского университета обсуждает предоставление ликвидности и автоматизированное создание рынка. Моаллеми подчеркивает факторы, лежащие в основе доходности поставщиков ликвидности, в частности важность волатильности и объема торгов. Он также описывает приблизительный расчет декомпозиции доходности LP, который включает доходность хеджирования, торговые сборы и стоимость рычага. Моаллеми объясняет, что стоимость рычага — это стоимость неблагоприятного выбора, возникающая из-за того, что цены устанавливаются на централизованной бирже, а AMM торгуют по неточным ценам, что приводит к проскальзыванию. Это приводит к арбитражным возможностям, когда арбитражеры получают прибыль от пула, что приводит к игре с нулевой суммой. Также обсуждаются различия между информированными трейдерами и арбитражерами.

  • 00:20:00 В этом разделе Чиамак Моаллеми обсуждает трудности измерения информированной торговли и то, как возникает волатильность, используя классическую модель неблагоприятного отбора. Он также рассказывает об интерпретации ценообразования опционов и об удобстве работы в непрерывном режиме с использованием формул закрытого форума. Моаллеми упоминает и другие популярные темы в мире маркетмейкеров, такие как рынки предсказаний и автоматизированные маркет-мейкеры. Затем он объясняет, как блокчейн работает как компьютер, отслеживая переходы и платежи, а Ethereum является более сложной и дорогой версией системы. Несмотря на то, что блокчейн медленный и дорогостоящий, он по-прежнему является жизненно важной частью рынков торговли и прогнозирования.

  • 00:25:00 В этом разделе Чамак Моаллеми обсуждает важность финансов при использовании медленных компьютеров, особенно в сценариях, требующих небольших транзакций или простых вычислительных задач. Он показывает диаграмму, которая отражает процент ресурсов, потраченных в системе Ethereum на приложения, связанные с финансами, где торговля является самой большой подкатегорией, а Uniswap является наиболее важным протоколом или смарт-контрактом. Хотя большая часть торговли криптовалютой происходит на биржах, децентрализованные биржи, такие как Uniswap, также имеют большое значение, с совокупным оборотом около одного триллиона долларов. Моаллеми представляет схему Блэка-Шоулза с непрерывным временем со стохастической волатильностью в качестве модели для торговли двумя активами: рисковым активом, обозначенным «x», и безрисковым активом, называемым числом, обозначенным «y», где рыночная цена является ценой. рискового актива в числителе.

  • 00:30:00 В этом разделе видео Чиамак Моаллеми объясняет концепцию предоставления ликвидности и автоматизированного создания рынка в финансовой отрасли и то, как они работают. Он говорит о том, что отдача от этого процесса представляет собой случайное блуждание и что эта концепция является очень стандартной моделью в финансах. Затем он продолжает объяснять концепцию автоматизированного маркет-мейкера как маркет-мейкера с постоянной функцией, где функция поддерживается постоянной функцией связывания. Поставщики ликвидности вносят резервы, и трейдеры могут перемещаться только в другую точку на кривой, что сохраняет функцию постоянной. Наклон диагональной линии дает мгновенную цену. Механизм знает, какие запасы у него есть, чтобы удовлетворить инвариант и сказать «да» или «нет» сделкам.

  • 00:35:00 В этом разделе Чамак Моаллеми обсуждает преимущества использования автоматизированного маркетмейкинга (AMM) на блокчейне по сравнению с традиционными биржами, такими как Binance. Использование блокчейна позволяет использовать различные услуги, такие как залоговое кредитование или оптимизация портфеля, что невозможно на традиционных биржах. Кроме того, торговля на блокчейне может быть подпрограммой компьютерной программы, что недоступно на традиционных биржах. Хотя сборы за AMM пропорциональны количеству, уровень поставщика ликвидности может меняться со временем, что влияет на распределение комиссий. Рыночная модель включает в себя два типа трейдеров: арбитражеры, которые постоянно следят за централизованной биржей и внешним рынком, и шумовые трейдеры, которые получают пользу от присутствия на блокчейне. Анализ предполагает наличие постоянных поставщиков ликвидности, оплату комиссий наличными и игнорирует дискретное и непрерывное время в блокчейне.

  • 00:40:00 В этом разделе Чиамак Моаллеми объясняет концепцию предоставления ликвидности и автоматического создания рынка. Он использует пример обмена x на y, а самой медленной частью является скорость, по которой можно торговать. Он описывает, как лучше описать проблему, перейдя к двойным переменным, которые являются ценами, поддерживающими гиперплоскости. Он объясняет, что функция значений пула является критическим объектом, и делается предположение, что функция является гладкой и дважды непрерывно дифференцируемой. Моаллеми также обсуждает случай постоянного произведения и свойства функции связывания, которые арбитры заинтересованы в балансировке. Арбитражеры постоянно следят за рынком, оставляя в пуле наименьшее значение, чтобы заработать как можно больше денег.

  • 00:45:00 В этом разделе Чиамак Моаллеми из Колумбийского университета обсуждает ключевые компоненты, необходимые для предоставления ликвидности и автоматического создания рынка, включая стратегию ребалансировки и использование арбитража. Стратегия ребалансировки включает покупку и продажу рискованных активов так же, как это делают арбитражники, но торгуя на централизованной бирже по справедливым рыночным ценам. Теорема о потере рычага против ребалансировки характеризует процесс как неотрицательный, неубывающий и предсказуемый, показывая, что значения резерва пула систематически теряют деньги по сравнению с торговлей на бирже. Эти ключевые ингредиенты важны для эффективного предоставления ликвидности и формирования рынка.

  • 00:50:00 В этом разделе Чамак Моаллеми обсуждает риски и затраты, связанные со стратегией ребалансировки, и способы их потенциального хеджирования. Он объясняет, что мгновенное изменение стоимости портфеля состоит из двух компонентов: первый компонент представляет собой рыночный риск, что означает, что он подвергается воздействию рынка, в то время как второй компонент локально безрисков и предсказуем, но имеет систематические эксплуатационные расходы. Далее Моаллеми разбирает формулу мгновенного рычага и то, как на него влияет мгновенная дисперсия и объем ликвидности, доступной на текущем уровне цен. Он также демонстрирует, как формула может быть применена к постоянному маркет-мейкеру продукта.

  • 00:55:00 В этом разделе Моаллеми объясняет, что ценность пула никогда не будет равна нулю, но она может стать менее ценной, чем альтернатива. Стратегия ребалансировки может систематически приносить прибыль с течением времени, поскольку она продает, когда цены растут, и покупает, когда цены падают. Кроме того, Моаллеми обсуждает предположения модели, заявляя, что для наиболее ликвидных пулов разумно предположить внешний рынок, но для длинного хвоста это не очень хорошее предположение. Тем не менее, модель по-прежнему полезна в качестве прогностической модели и дает согласованные цены. Затем Моаллеми объясняет способ использования модели в качестве прогностической модели, рассматривая сборы, взимаемые с LP, и изменение стоимости пула, а также хеджируя рыночный риск с помощью отрицательной ребалансировки сделок по финансам.

  • 01:00:00 В этом разделе Чиамак Моаллеми из Колумбийского университета обсуждает эмпирические результаты своей модели предоставления ликвидности и автоматического создания рынка. Он сравнивает хеджированные прибыль и убытки (P&L) по своей формуле с фактическими данными из блокчейна Ethereum и обнаруживает, что они близки, что указывает на правильность его модели. Затем он смотрит на ежедневную волатильность и колебания прибылей и убытков примера пула Uniswap с монетами на 200 миллионов долларов. Колебания прибылей и убытков связаны с рыночным риском, и Моаллеми демонстрирует, что их можно хеджировать с помощью его формулы, что приводит к положительной доходности и высокому коэффициенту Шарпа, даже если это не обязательно является прибыльной стратегией из-за торговых и финансовых затрат. Он предполагает, что этот инструмент можно использовать для улучшения автоматических маркет-мейкеров за счет снижения затрат, выплачиваемых посредникам.

  • 01:05:00 В этом разделе Чамак Моаллеми обсуждает способы смягчения неэффективности, вызванной плохими ценами, в предоставлении ликвидности и автоматизированном создании рынка. Он предлагает использовать оракул в качестве источника данных для получения цен от таких бирж, как Binance, для включения внешних цен в смарт-контракты и предотвращения внебиржевой торговли. Кроме того, Моаллеми представляет идею продажи арбитражных прав авторизованным участникам, которые могут торговать против пула без уплаты комиссий, предоставляя им приоритет, чтобы воспользоваться меньшими расхождениями в ценах и заработать деньги. Эти участники будут возвращать часть своей прибыли LPS, чтобы помочь смягчить плохие цены и гарантировать, что как LP, так и шумовые трейдеры получат выгоду от этой стратегии. Моаллеми также отвечает на вопросы о внедрении AMM для торговли на Binance и шортах на криптовалютных рынках. Он отмечает, что короткие позиции могут быть дорогими из-за затрат на финансирование, а объем и волатильность сильно коррелированы, что может сделать рискованным использование стратегии открытия длинных позиций по объему и коротких позиций по волатильности.

  • 01:10:00 В этом разделе Моаллеми объясняет проблемы с протоколом запроса котировок (RFQ) в смарт-контрактах, поскольку он требует ожидания ответа от других, что нарушает атомарность смарт-контрактов. Тем не менее, популярная косвенная альтернатива, называемая своевременной ликвидностью, может быть использована для опережения и обеспечения ликвидности для крупных ордеров до того, как они будут обработаны. Моаллеми также объясняет, как традиционные маркет-мейкеры хеджируют свои риски и удерживают акции в течение коротких периодов времени перед продажей, в то время как поставщики ликвидности также должны хеджировать для управления рыночным риском. Модель пула ликвидности лучше всего работает с криптовалютами, потому что у них медленные компьютеры и большое количество доступных монет.

  • 01:15:00 В этом разделе спикер обсуждает преимущества автоматизированных маркет-мейкеров (AMM) по сравнению с книгами лимитных ордеров, особенно с точки зрения простоты и доступности. Они объясняют, что сложный характер книг лимитных ордеров затрудняет их использование маркет-мейкерами и даже трейдерами без алгоритмов и армии PHD, создавая более равные условия для институциональных инвесторов, которые также используют алгоритмы. Однако AMM упрощают процесс, позволяя обычным участникам получать выгоду без необходимости в обширных знаниях или ресурсах. Спикер видит потенциал для более совершенных структур, которые приносят пользу менее искушенным участникам, что делает AMM шагом в правильном направлении.
 

Андреа Минка (Cornell ORIE): Кластеризация разнородных финансовых сетей



Андреа Минка (Cornell ORIE): Кластеризация разнородных финансовых сетей

Профессор Андреа Минка, известный эксперт в области финансовых сетей в Корнельском университете ORIE, посвятила свое исследование изучению сложностей кластеризации разнородных финансовых сетей. Она вводит инновационный термин регуляризации для решения уникальных проблем, связанных с этими сетями, в частности, наличия выбросов с произвольными шаблонами соединений. Эти выбросы мешают работе алгоритмов спектральной кластеризации и превращают кластеризацию в вычислительно сложную задачу, известную как NP-сложная комбинаторная задача.

Чтобы идентифицировать эти выбросы на основе их закономерностей соединения, Минка использует стохастическую блочную модель и стохастическую блочную модель с поправкой на степень. Эти модели предлагают теоретические гарантии точного восстановления, не делая предположений об узлах-выбросах, за исключением знания их количества. Неоднородность, присущая финансовым сетям, еще больше усложняет обнаружение выбросов исключительно на основе степеней узлов.

Минка углубляется в процесс разделения сети на кластеры и выбросы, создавая матрицу разделения и перестановку узлов. Она иллюстрирует этот подход, применяя его для анализа корейской банковской системы. Кроме того, Minca использует пробоотборник Гиббса для заполнения пробелов в сети, обеспечивая эффективное распределение рисков и диверсификацию инвестиций путем группирования перекрывающихся портфелей на основе их силы и уровня перекрытия.

В своей работе Минка подчеркивает важность создания кластеров, демонстрирующих значимую взаимосвязь, а не кластеров без связи. Она предлагает подход, который предлагает пять альтернатив для диверсификации в рамках паритета кластерного риска, подчеркивая необходимость тщательного рассмотрения при использовании алгоритмов кластеризации для достижения диверсификации в финансовых сетях. Минка советует количественно оценивать эффективность алгоритмов кластеризации с использованием стандартных инвестиционных категорий и подчеркивает важность информированного принятия решений при использовании этих методов.

В целом, исследование профессора Андреа Минки дает ценную информацию о тонкостях кластеризации разнородных финансовых сетей, предлагая инновационные подходы и практические решения для решения проблем, связанных с этими сетями. Ее работа способствует развитию анализа рисков, выбора портфеля и понимания структурной динамики финансовых систем.

  • 00:00:00 Профессор Андреа Минка рассказывает о своей работе по разработке алгоритмов кластеризации финансовых сетей на двух разных примерах. Первый пример относится к сетям перекрывающихся портфелей с приложениями для выбора портфеля, а второй пример относится к сети подверженностей, что связано с анализом системного риска и пониманием уровня риска в сети. Цель состоит в том, чтобы сопоставить алгоритмы кластеризации с финансовыми сетями и создать значимые кластеры, уязвимые для неликвидности или дефолта в одном учреждении. Чем крупнее кластеры, тем больше потенциальное воздействие стресса на члена в этом кластере, что подчеркивает важность понимания структур финансовой сети.

  • 00:05:00 Андреа Минка обсуждает проблемы кластеризации финансовых сетей, которые характерны для всех реальных сетей. Проблема кластеризации существует из-за того, что узлы имеют тенденцию образовывать группы, в которых внутригрупповая связность больше, чем межгрупповая связность. Существуют различные алгоритмы кластеризации, но неоднородность финансовых сетей представляет собой проблему, поскольку финансовые сети демонстрируют неоднородность с точки зрения степеней, весов и различных связей между сообществами. Кроме того, наличие выбросов затрудняет применение готовых алгоритмов, поскольку они могут иметь те же шаблоны подключения, что и встроенные узлы, но сами по себе они не могут рассматриваться как один кластер. Несколько проблем влияют на кластеризацию финансовых сетей, что затрудняет применение существующих алгоритмов.

  • 00:10:00 Андреа Минка из Cornell ORIE обсуждает проблемы, возникающие при кластеризации разнородных финансовых сетей, и введение нового термина регуляризации для их преодоления. Одной из основных проблем является наличие выбросов, которые имеют произвольные шаблоны подключения и ведут себя как противники, снижая производительность алгоритмов кластеризации, таких как спектральная кластеризация. Сама проблема кластеризации является NP-сложной комбинаторной задачей, которую можно смягчить для полуопределенной программы с податливыми алгоритмами. Цель состоит в том, чтобы доказать, что определенные условия выполняются для восстановления истинных кластеров, а введенный член регуляризации наказывает выбросы с необычными моделями соединения.

  • 00:15:00 Андреа Минка обсуждает применение стохастической блочной модели и стохастической блочной модели с поправкой на степень для обнаружения шаблонов кластеризации в разнородных финансовых сетях. Цель состоит в том, чтобы обнаружить выбросы на основе их шаблонов соединения. Предоставленные теоретические гарантии обеспечивают точное восстановление, не делая предположений об узлах-выбросах, за исключением знания их количества. Условия разрыва плотности основаны на разнице между межкластерной и внутрикластерной краевой плотностью. Результаты более надежны, чем в предыдущей литературе, поскольку они не зависят от количества выбросов и зависят только от количества выбросов. Неоднородность финансовых сетей затрудняет обнаружение выбросов на основе степеней, поскольку узлы могут иметь высокие степени из-за структуры узлов в одном кластере.

  • 00:20:00 Андреа Минка объясняет концепцию неоднородности в финансовых сетях и то, как она влияет на алгоритмы кластеризации. Она использует пример корейской банковской системы, чтобы проиллюстрировать, как банки и страховые компании в одном и том же секторе могут проявлять неоднородность и не должны классифицироваться как выбросы. Минка отмечает, что распределение степеней с тяжелыми хвостами в финансовых сетях требует тщательного изучения моделей связности и вкладов в границы диапазона степеней каждого узла. Она также подчеркивает необходимость штрафных терминов в алгоритме, учитывающих степень, поскольку однородный штраф не может быть использован для всех узлов. Наконец, Минка описывает основы модели кластеризации, которая включает определение параметров гетерогенности и матриц связности для каждого кластера.

  • 00:25:00 Андреа Минка обсуждает проблемы кластеризации при наличии выбросов при использовании готовых методов кластеризации. Цель обнаружения выбросов состоит в том, чтобы поднять предупреждение, не препятствуя самой кластеризации или ошибочно препятствуя классификации примечаний в слое. Настраивая связность с помощью параметров неоднородности, матрицу смежности можно записать таким образом, чтобы она соответствовала матрице смежности первого выброса, чтобы найти матрицу перестановок, которая отображает наблюдаемое изображение в основную структуру кластеров и выбросов. Эти корректировки помогают приспособить множество вариантов моделирования в финансовых сетях.

  • 00:30:00 В этом разделе видео Андреа Минка объясняет процесс поиска матрицы разделов и перестановки узлов для определения структуры кластеров и выбросов в финансовых сетях. Алгоритм основан на поиске матрицы разделов, которая указывает, какие узлы принадлежат одному и тому же кластеру, а произвольные записи представляют собой выбросы. Чтобы проиллюстрировать концепцию, Минка показывает пример корейской финансовой сети, где целью алгоритма является определение правильной идентификации каждого сектора, присутствующего в сети.

  • 00:35:00 Андреа Минка, профессор Cornell ORIE, рассказывает о своей работе по созданию полусинтетических сетей и тестированию алгоритмов. Она объясняет, что создает сеть на основе опубликованных Банком Кореи данных о размерах активов и пассивов по всем финансовым учреждениям и связывает их на основе совокупного потока от любой страховой компании к любому банку. Затем она использует алгоритм максимизации модульности, чтобы определить, какие финансовые учреждения относятся к какому сектору, на основе наблюдаемой модели связности. Алгоритм также вводит параметр настройки и ограничение матрицы разбиения, чтобы минимизировать разницу в модульности.

  • 00:40:00 Андреа Минка объясняет проблему поиска матриц разделов при кластеризации разнородных финансовых сетей, что является неразрешимой проблемой из-за определенного ограничения. Чтобы преодолеть это, вводится ослабление проблемы, когда элементы матрицы находятся в диапазоне от 0 до 1, и она является положительно полуопределенной. Неоднородность проблемы решается с помощью штрафных условий, где штраф на диагональном члене наказывает потенциальные выбросы, степень которых выходит за пределы нормального отклонения. Два параметра настройки контролируют силу диагонального штрафа и определяются наблюдаемой степенью узлов, что позволяет идентифицировать выбросы и узлы с сильным членством в сообществе. Пример корейской отрасли, использованный в видео, представляет собой моментальный снимок воздействия в корейской сети, и в нем нет компонента временного ряда.

  • 00:45:00 Андреа Минка из Cornell ORIE обсуждает кластеризацию разнородных финансовых сетей и то, как воссоздать выборочные сети, которые согласуются с агрегированными значениями, используя пробоотборник Гиббса для заполнения пробелов. Производительность алгоритма можно проверить с помощью скорости ошибочной классификации и вероятности восстановления, которая стремится к единице на определенной скорости по мере увеличения размера выборки. Используя в качестве примера корейский сектор, Минка демонстрирует, как матрица связности может отображать вероятность связи между различными секторами и как результаты кластеризации получаются из матрицы.

  • 00:50:00 Андреа Минка обсуждает проблему определения правильного финансового сектора для каждого учреждения в сети на основе их моделей подключения. Она объясняет, что алгоритм должен быть устойчивым к неоднородности соединений, и что в качестве критерия производительности используются коэффициенты ошибочной классификации. Минка сравнивает показатели неправильной классификации алгоритма, который она представила, и других существующих алгоритмов, подчеркивая, что алгоритм на основе спектральной кластеризации работает хуже всего. Это подчеркивает необходимость настройки существующих алгоритмов для учета проблем, с которыми сталкиваются финансовые сети. Кроме того, Минка кратко касается применения алгоритма в управлении инвестиционным портфелем. Воссоздав сеть перекрывающихся портфелей, можно измерить силу взаимодействия учреждений на основе их активов в портфелях, и это потенциально может помочь в принятии инвестиционных решений.

  • 00:55:00 Андреа Минка обсуждает алгоритм кластеризации и то, как его можно применить к перекрывающимся финансовым портфелям для эффективного распределения рисков и диверсификации инвестиций. Путем кластеризации портфелей на основе их силы и уровня перекрытия алгоритм может восстановить пять кластеров, которые увеличились за десятилетие, что указывает на увеличение перекрытия. Это предоставляет инструмент для создания кластеров, которые более эффективны, чем другие существующие методы кластеризации. Кроме того, Минка обсуждает, как дополнительный алгоритм заполняет пробелы в корейском примере и создает отдельные сети, которые согласуются с совокупными данными правительства.

  • 01:00:00 Андреа Минка обсуждает вопрос достижения диверсификации с помощью алгоритмов кластеризации для финансовых сетей. Она показывает, что наличие одного кластера с чрезвычайно высокой межкластерной связью и другого без связи не приведет к диверсификации. Вместо этого она представляет подход, который определяет пять альтернатив для диверсификации в рамках подхода паритета кластерного риска. Она также отвечает на вопросы о препринте своей работы, наличии инструмента и чувствительности алгоритма к количеству кластеров, а также предлагает использовать стандартные инвестиционные категории для количественной оценки производительности алгоритмов кластеризации.

  • 01:05:00 Андреа Минка обсуждает тему алгоритмов кластеризации и восстановления кластеров на примере восстановления пяти кластеров из пяти инвестиционных стратегий. Она также отмечает, что может быть сложно сравнивать результаты кластеризации для разных вариантов без хорошего знания предметной области или предположений о количестве кластеров. Однако теоретических результатов по этому вопросу нет, что подчеркивает важность принятия обоснованных решений при использовании алгоритмов кластеризации.