Quantitative trading - страница 10

 

Использование R в торговле на финансовых рынках в режиме реального времени



Использование R в торговле на финансовых рынках в режиме реального времени

В этом информативном видео ведущий подробно рассматривает практическое применение языка программирования R в торговле на финансовых рынках в режиме реального времени, уделяя особое внимание торговле иностранными валютами. Они начинают с обсуждения привлекательности торговых валют, подчеркивая их управляемость и доминирование нескольких ключевых пар в мировой валютной торговле. Подчеркивается, что торговля иностранной валютой происходит на внебиржевом рынке, а не на регулируемых биржах. Докладчик признает проблемы выявления аномалий в движении валюты из-за ликвидности и случайности рынка.

Объясняется концепция внебиржевой торговли, отмечая, что она отличается от других видов торговли, поскольку в ней приоритет отдается таким факторам, как контрагент и котируемая цена, а не исполнению и задержке. Затем в видео рассматривается стандартная терминология финансового рынка, в том числе использование свечей для визуализации данных и различие между длинной торговлей (покупка по низкой цене и продажа по высокой цене) и короткой торговлей (продажа заемных акций по более высокой цене и их выкуп по более низкой цене с целью получения прибыли). ).

Чтобы продемонстрировать анализ торговли на финансовых рынках в режиме реального времени с использованием R, докладчик рассматривает два примера. Первый пример фокусируется на проверке вероятности направления следующей свечи на основе последовательных бычьих или медвежьих свечей. Эта гипотеза исследуется с использованием знаний о моделях свечей и их потенциальном влиянии на рыночные тенденции.

В видео дополнительно рассматривается методология проверки гипотез в торговле на финансовых рынках в реальном времени с использованием R. Представлен пример, в котором данные предварительно обрабатываются и создается таблица последовательных свечей для оценки вероятности изменения направления свечи. Первоначально торговые издержки устанавливаются равными нулю, а баланс прибыли устанавливается и проверяется на модельную дату. Тем не менее, подчеркивается важность тщательного тестирования входов и выходов в торговой среде, поскольку установка торговых издержек на уровне двух пунктов приводит к потере денег и достижению рыночного нейтралитета.

Рассматриваются такие соображения, как проскальзывание и торговые издержки, при этом выступающий подчеркивает необходимость учета этих факторов и предлагает включить погрешность. Вводится более сложный пример, связанный с циклическим характером евродоллара, с акцентом на измерение цикличности на основе точек разворота и ценового движения. Докладчик подчеркивает важность сохранения единой оси X в анализе финансового рынка, чтобы избежать искажения движения рынка в выходные дни.

В видео подробно рассматривается торговая стратегия возврата к среднему, которая включает в себя выявление случаев, когда рынок испытал быстрое восходящее движение и ожидание краткосрочного разворота тренда. Распределение цен и движения свечей анализируются, чтобы определить подходящие параметры для реализации этой стратегии. Сначала тестирование проводится с нулевыми торговыми издержками, а затем с небольшими торговыми издержками в 2 паба. Результаты осторожно оптимистичны, но спикер признает наличие потенциальных статистических проблем, которые требуют дальнейшего изучения и тестирования на реальном рынке.

Регрессионный анализ представлен как метод сглаживания точек данных, но отмечены проблемы прогнозирования будущих тенденций, когда линия регрессии изменяется с дополнительными данными. Обсуждаются базовое бэк-тестирование и форвард-тестирование с использованием R, подчеркиваются ограничения тестирования только с одним инструментом и необходимость более комплексного подхода.

Затем ведущий делится своими мыслями о внедрении кода R в торговые среды в реальном времени. Они подчеркивают важность частого пересчета значений регрессии для адаптации к рыночным изменениям, а не полагаться на модели переобучения для достижения долгосрочного успеха. Код включает в себя параметры принятия решения о покупке или продаже на основе разницы свечей и изменения цены, а также стратегию выхода на основе достижения определенного порога прибыли. Ведущий демонстрирует процесс тестирования на истории и выражает уверенность в получении положительных результатов.

Подчеркивается важность использования кривой рыночной стоимости капитала, а не кривой торгового капитала для оценки торговых систем. Обсуждаются ограничения кривой Trade Equity в отражении денежной позиции системы во время активных сделок. Докладчик демонстрирует два графика, на которых сравниваются два типа кривых, показывающие периоды отказа системы и значительных просадок. Подчеркивается необходимость стратегии стоп-лосс для уменьшения убытков, и распространяется код, необходимый для реализации такой стратегии. Ведущий признает, что ошибка в стратегии выхода привела к тому, что позиции удерживались слишком долго, что привело к значительным убыткам.

Затем в видео рассказывается об интеграции кода R в выполнение алгоритмов и использовании пакета Windows на стороне моделирования. Ведущий объясняет, что их торговля реальными деньгами происходит на серверах Linux, которые легко подключаются к платформе CIRA через общее пространство памяти. Эта настройка позволяет обмениваться данными, включая FIX, сделки и свечи, между их системой и платформой. Спикер рассказывает, что они управляют рисками, одновременно торгуя от четырех до восьми различных инструментов. Однако они предостерегают от того, чтобы полагаться исключительно на вероятность в реальной торговле, поскольку это может привести к тому, что трейдеры упустят ценные возможности в течение дня.

В заключение, это видео дает ценную информацию о практической реализации R в торговле на финансовых рынках в режиме реального времени, уделяя особое внимание торговле иностранной валютой. Докладчик охватывает различные аспекты, в том числе внебиржевую торговлю, стандартную терминологию финансового рынка, проверку гипотез, торговые стратегии возврата к среднему, такие соображения, как проскальзывание и торговые издержки, а также интеграцию кода R в исполняющие алгоритмы. Подчеркивая потенциальные преимущества алгоритмической торговли, видео также признает необходимость тщательного тестирования, внимательного рассмотрения статистических вопросов и важности стратегий управления рисками в реальных сценариях торговли.

  • 00:00:00 Эллен рассказывает, как она использует R в торговле иностранной валютой. Она объясняет, почему она решила торговать валютами, заявляя, что это управляемые инструменты для анализа, с примерно семью или восемью парами, на которые приходится 97-98% мировой валютной торговли. Эллен также отмечает, что, поскольку иностранные валюты являются внебиржевыми инструментами, ими нельзя торговать на бирже. Она признает, что обнаружение аномалий в движении валюты может быть чрезвычайно сложным из-за ликвидности и случайности рынка.

  • 00:05:00 Спикер объясняет концепцию внебиржевой торговли, подчеркивая, что это нерегулируемая биржа, в отличие от других видов торговли. Спикер объясняет, что в этом типе торговли меньше внимания уделяется исполнению и задержке, а больше — другим факторам, таким как контрагент и котируемая цена. Затем спикер переходит к объяснению некоторых стандартных терминов, используемых на финансовом рынке, таких как свечи и длинная и короткая торговля. Свечи используются в качестве удобного инструмента для визуализации ряда данных, в то время как длинная торговля предполагает покупку по низкой цене и продажу по высокой, а короткая торговля — это продажа заемных акций по более высокой цене, а затем покупка их обратно, когда цена падает, для получения прибыли.

  • 00:10:00 Спикер обсуждает концепцию торговли вверх или вниз на рынке форекс, где трейдеры всегда торгуют одним инструментом, чтобы получить немного xq. Он также упомянул, что не будет показывать зрителям, как прогнозировать рынок или предоставлять секретный соус, а вместо этого покажет им два примера того, что анализирует он и его команда. Первый пример — это простой вопрос о том, какова вероятность того, что следующая свеча будет вверх или вниз при наличии X последовательных бычьих или медвежьих свечей. Спикер использует знание восходящих и нисходящих свечей, чтобы проверить свою гипотезу и оценить, есть ли какая-либо динамика на рынке, чтобы предсказать рыночные тенденции.

  • 00:15:00 Спикер объясняет свой подход к проверке гипотез в торговле на финансовых рынках в реальном времени с помощью R. Они демонстрируют пример предварительной обработки данных и создания таблицы последовательных свечей, которая показывает вероятность изменения направления свечи . Затем спикер устанавливает свои торговые издержки на ноль и создает баланс прибыли, который он проверяет на модельной дате. Тем не менее, они отмечают, что установление торговых издержек на уровне двух пунктов приводит к потере денег и нейтральности к рынку, поэтому важно тщательно проверять входы и выходы в торговой среде.

  • 00:20:00 Спикер обсуждает важность учета проскальзывания на рынке при торговле и создания погрешности для его учета. Они также упоминают разницу в торговых издержках в зависимости от брокера и объема торговли. Затем спикер переходит к более сложному примеру проверки цикличности евродоллара и объясняет, как они измеряют цикличность в зависимости от времени между поворотными точками и движением цены. Они подчеркивают важность использования единой оси x в анализе финансового рынка, чтобы избежать искажения движения рынка в выходные дни. Спикер предлагает поделиться со зрителями кодом и данными для этого примера.

  • 00:25:00 Докладчик объясняет, как он нормализует ряды данных финансового рынка, добавляя номера строк по оси X вместо даты и времени. Затем он выполняет регрессию ядра, чтобы сгладить кривую, и находит пики и падения, используя некоторый код. Он проверяет цикличность пиков и группирует их в нижнем квадранте, чтобы показать, что важные поворотные точки евродоллара происходят в течение 30 часов. Спикер обсуждает различные способы торговли, в том числе прогнозирование следующего поворотного момента и усложнение этой задачи.

  • 00:30:00 Докладчик объясняет торговую стратегию возврата к среднему, которая включает в себя поиск возможностей, когда рынок зашел слишком далеко и слишком быстро, что привело к краткосрочному развороту тренда. Спикер анализирует распределение цен и движения свечей, чтобы определить, где провести линию для этой стратегии, а затем тестирует ее, устанавливая сделки с нулевой стоимостью, а затем с небольшой торговой стоимостью в 2 паба. Результаты сдержанно оптимистичны, и спикер предлагает продолжить тестирование в реальных рыночных условиях. Однако спикер отмечает, что с этой стратегией могут быть статистические проблемы, требующие дальнейшего изучения.

  • 00:35:00 Докладчик обсуждает использование регрессии для сглаживания точек данных, но предупреждает, что линия регрессии меняется в обратном направлении по мере добавления новых точек данных в ряд, что затрудняет прогнозирование будущих тенденций. Он также объясняет, что базовое бэк-тестирование и форвард-тестирование с помощью R ограничено одним инструментом за раз и не идеально подходит для нескольких инструментов или финансовых параметров, специфичных для рынка. Чтобы решить эту проблему, он использует торговую платформу, которая позволяет ему копировать и вставлять свой код R непосредственно в платформу и избегать длительных процессов кодирования и отладки.

  • 00:40:00 Докладчик обсуждает базовый код, используемый для включения R в торговые среды в реальном времени. Они упоминают, что код в значительной степени представляет собой копирование и вставку кода, который у них был в их студии R, с упором на частый пересчет значений регрессии, чтобы адаптироваться к изменениям, а не переобучать модель и ожидать, что она будет работать в долгосрочной перспективе. Код включает в себя решение о покупке или продаже на основе определенных параметров, таких как разница свечей и изменение цены, а также стратегию выхода из позиции, когда прибыль достигает определенной суммы. Затем спикер показывает, как они провели тестирование кода и ожидают хороших результатов.

  • 00:45:00 Докладчик обсуждает важность использования кривой рыночной стоимости капитала вместо кривой торгового капитала при оценке торговых систем. Он объясняет, что кривая торгового капитала не показывает денежную позицию системы во время торговли, поэтому смоделировать это в R сложно. Кривая к рыночному капиталу, которая отражает то, как система давала сбои в течение некоторых периодов, что приводило к значительным просадкам. Он приходит к выводу, что применение стратегии стоп-лосс помогло бы вовремя выйти из убытков, и показывает код, который позволил бы внести это изменение. Окончательное тестирование модели не удалось из-за неадекватной стратегии выхода, которая привела к слишком долгому удержанию, что привело к большим убыткам.

  • 00:50:00 Спикер рассказывает о том, как они встраивают свой код в исполняющие алгоритмы и используют пакет Windows на стороне моделирования. Их реальные деньги работают на серверах Linux и заключены в этот пакет. Они используют общую память между своей системой и платформой CIRA для обмена данными. Они могут брать FIX, сделки и свечи и передавать их в свою систему для анализа, разделять результаты обратно в CIRA и принимать торговые решения. Они могут использовать эту систему для управления рисками, торгуя между четырьмя и восемью различными инструментами одновременно. Они предупреждают, что, хотя вероятность важна, полагаясь на нее в реальной торговле, трейдеры могут упустить возможности в течение дня.
 

Введение в количественную торговлю - Лекция 1/8


Введение в количественную торговлю - Лекция 1/8

Этот всеобъемлющий курс служит углубленным введением в увлекательный мир количественной торговли, вооружая студентов знаниями и навыками, необходимыми для достижения успеха в этой динамичной области. Количественная торговля основана на использовании математических моделей и компьютерных программ для преобразования торговых идей в прибыльные инвестиционные стратегии. Все начинается с портфельного менеджера или трейдера, который начинает с первоначальной интуиции или смутной концепции торговли. Благодаря применению математических методов эти интуитивные представления преобразуются в точные и надежные математические торговые модели.

Процесс количественной торговли включает в себя тщательный анализ этих моделей, тестирование на исторических данных и уточнение. Статистические тесты и моделирование используются для оценки их производительности и обеспечения их надежности. Этот этап тщательного тестирования имеет решающее значение для выявления и устранения любых недостатков или слабых мест в моделях, прежде чем они будут введены в действие.

Как только количественная инвестиционная модель доказывает свою потенциальную прибыльность, она внедряется в компьютерную систему, что позволяет автоматически проводить сделки. Эта интеграция математических моделей в компьютерные программы лежит в основе количественной торговли, сочетая силу математики с эффективностью информатики. На протяжении всего курса студенты изучают различные инвестиционные стратегии, взятые из популярной академической литературы, получают представление об их основных математических принципах и учатся преобразовывать их в действенные торговые модели.

Учебная программа этого курса охватывает широкий круг тем, вооружая студентов количественными, вычислительными навыками и навыками программирования, необходимыми для успеха в области количественного трейдинга. Студенты вникают в тонкости математического моделирования, статистического анализа и алгоритмической торговли. Они также овладевают языками программирования, обычно используемыми в количественных финансах, такими как Python и R, что позволяет им эффективно внедрять и тестировать свои торговые модели.

Пройдя этот курс, студенты не только получат целостное представление о ландшафте количественной торговли, но и разовьют необходимые навыки, чтобы уверенно ориентироваться в нем. Они становятся экспертами в преобразовании торговых идей в математические модели, тщательно проверяя и уточняя эти модели и, в конечном итоге, применяя их в реальных торговых сценариях. Обладая прочной базой в области количественных и вычислительных методов, студенты хорошо подготовлены к карьере в количественной торговле, алгоритмической торговле или других смежных областях, где слияние математики и технологий приводит к успеху.

 

Введение в количественную торговлю - Лекция 2/8


Введение в количественную торговлю - Лекция 2/8

В этой лекции спикер подчеркивает важность технологий и программирования в количественном трейдинге. Они обсуждают, насколько важны технологии и навыки программирования для совместного использования количественных торговых стратегий и проведения тестирования на исторических данных. Спикер подчеркивает важность математики и компьютерного программирования в этой области. Они знакомят с базовым программированием на Java и математическим программированием с использованием Java, а также подчеркивают необходимость навыков программирования в количественной торговле из-за необходимости тестирования на истории.

Спикер обсуждает проблемы, связанные с моделированием и анализом будущей эффективности стратегии. Они отмечают, что историческая прибыль и убыток (PNL) не являются надежным индикатором для обучения или принятия решения об изменении стратегии. Вместо этого они предлагают использовать моделирование и калибровку параметров, которые требуют сложного программирования, чтобы найти оптимальные параметры и проверить чувствительность стратегии к ним. Они также подчеркивают важность использования одного и того же программного обеспечения для исследований и реальной торговли, чтобы избежать ошибок перевода.

Спикер обсуждает обязанности трейдера, занимающегося количественным анализом, и подчеркивает необходимость эффективного прототипирования торговых идей. Они предлагают проводить большую часть времени за мозговым штурмом и выдвижением идей, сводя к минимуму время, затрачиваемое на тестирование и программирование. Они упоминают о важности наличия набора строительных блоков для быстрого прототипирования новых стратегий.

Докладчик затрагивает проблемы использования популярных инструментов, таких как Excel, MATLAB и R, в количественной торговле, заявляя, что они не созданы для сложных математических стратегий. Они рекомендуют использовать другие языки программирования, такие как Java, C-sharp и C++, в которых есть библиотеки для создания и реализации торговых стратегий.

Докладчик конкретно обсуждает ограничения использования R для количественной торговли. Они упоминают, что R медленный, имеет ограниченную память и ограниченные возможности для распараллеливания. Они также подчеркивают отсутствие средств отладки и стандартных интерфейсов для связи между разными программами.

Спикер подчеркивает важность технологий и использования соответствующих инструментов в количественном трейдинге. Они отмечают, что такие инструменты, как R и MATLAB, могут значительно улучшить математическое программирование и предоставить доступ к библиотекам для более быстрых вычислений. Они подчеркивают необходимость хорошего набора инструментов для исследования торговли, который позволяет легко комбинировать модули, параллельное программирование, автоматическую очистку данных и калибровку параметров.

Спикер обсуждает преимущества использования новых технологий, таких как Java и C#, для количественной торговли. Они отмечают, что эти языки устраняют необходимость в отладке таких проблем, как утечки памяти и ошибки сегментации, что повышает производительность. Они демонстрируют программирование на Java и проводят практические лабораторные занятия для участников.

Докладчик объясняет, как исправить ввод для программы Java, исправляя импорт, и демонстрирует математическое программирование с использованием библиотеки algo quant. Они помогают участникам копировать и вставлять код с веб-сайта на свои компьютеры для запуска.

Спикер отвечает на технические вопросы аудитории, касающиеся загрузки и запуска кода, использованного в лекции. Они демонстрируют классическую версию скрытой цепи Маркова с использованием функции вебинара.

Докладчик объясняет концепцию цепи Маркова и демонстрирует простую модель с двумя состояниями и переходными вероятностями. Они объясняют, как цепи Маркова используются в качестве генераторов случайных чисел для моделирования наблюдений и оценки параметров модели. Они призывают аудиторию экспериментировать с созданием собственных моделей цепей Маркова.

Спикер обсуждает важность общения и сотрудничества в количественной торговле и призывает членов команды проверять друг друга и предоставлять обновленную информацию о своем прогрессе. Они упоминают возможность использования марковских моделей более высокого порядка и предлагают вопросы и демонстрацию экрана во время живых дискуссий.

Лектор обсуждает проблемы оценки параметров в количественных торговых моделях с ограниченными наблюдениями. Они объясняют, что для точной оценки требуется больше данных, и рекомендуют использовать более крупные модели состояния или увеличивать количество наблюдений. Они обсуждают алгоритм Баума-Уэлча для обучения скрытых марковских моделей и знакомят с концепцией тестирования на исторических данных.

Докладчик демонстрирует простую стратегию пересечения скользящих средних в AlgoQuant и объясняет процесс создания стратегий, симуляторов и запуска симуляций. Они подчеркивают важность тестирования и анализа производительности с использованием таких показателей, как прибыль и убыток, коэффициент информации, максимальная просадка и многое другое.

Спикер объясняет, исследуйте различные торговые стратегии и проверяйте их эффективность с помощью моделирования. Спикер объясняет, что моделирование позволяет трейдерам оценить потенциальную прибыльность и риски, связанные со стратегией, прежде чем применять ее в реальной торговле. Моделируя различные рыночные условия и сценарии, трейдеры могут получить представление об эффективности стратегии и принимать обоснованные решения.

Спикер также подчеркивает важность транзакционных издержек в торговых стратегиях. Транзакционные издержки, такие как брокерские сборы и проскальзывание, могут оказать существенное влияние на общую прибыльность стратегии. Поэтому крайне важно учитывать транзакционные издержки во время моделирования и тестирования на исторических данных, чтобы получить реалистичную оценку эффективности стратегии.

Кроме того, лектор знакомит с концепцией управления рисками в количественной торговле. Они объясняют, что управление рисками включает в себя реализацию стратегий контроля и смягчения потенциальных потерь. Методы управления рисками могут включать установку ордеров стоп-лосс, размер позиции и диверсификацию. Важно включить принципы управления рисками в торговые стратегии, чтобы защитить себя от значительных финансовых потерь.

В заключение спикер еще раз подчеркивает важность непрерывного обучения и совершенствования в количественной торговле. Они побуждают участников исследовать различные стратегии, анализировать свою эффективность и повторять действия на основе результатов. Используя технологии, навыки программирования и системный подход к разработке стратегии, трейдеры могут повысить свою прибыльность и успех на финансовых рынках.

В целом лекция посвящена важности технологий, программирования, моделирования и управления рисками в количественной торговле. Он подчеркивает необходимость экспериментов, непрерывного обучения и использования специализированных инструментов для разработки и совершенствования торговых стратегий.

Часть 1

  • 00:00:00 Спикер начинает с ответов на возможные вопросы из предыдущей лекции и с того, где найти материалы курса. Основное внимание в этой лекции уделяется важности технологий и программирования в количественной торговле, поскольку они необходимы для кооптации стратегий количественной торговли и проведения тестирования на исторических данных. Докладчик подчеркивает важность как математики, так и компьютерного программирования, и продолжает вводить некоторые основы программирования на Java и математическое программирование с использованием Java. Практическое занятие включает в себя совместное использование стратегий для тестирования на исторических данных, и спикер спрашивает, все ли установили bin и algo quant на свои компьютеры и прошли ли тест Maven. Традиционно для других видов торговли, таких как инвестирование в стоимость или торговля на основе интуиции, вам не потребуется много программирования, но в количественной торговле это необходимо из-за необходимости тестирования на истории.

  • 00:05:00 Докладчик обсуждает важность компьютерного программирования в количественной торговле, особенно при моделировании и анализе будущей эффективности стратегии. Они упоминают, что исторический PNL не является надежным индикатором для обучения или принятия решения о том, следует ли изменить стратегию. Вместо этого они предлагают использовать моделирование и калибровку параметров, которые требуют сложного программирования, чтобы найти оптимальные параметры и проверить чувствительность стратегии к ним. Они также подчеркивают важность использования одного и того же программного обеспечения для исследований и реальной торговли, чтобы избежать возможных ошибок перевода. В конечном счете, спикер подчеркивает, что навыки компьютерного программирования имеют решающее значение в индустрии финансового трейдинга и могут сильно повлиять на прибыль.

  • 00:10:00 Лектор обсуждает идеальные обязанности количественного трейдера, которые включают в себя придумывание торговых идей и их быстрое прототипирование, оставляя механические задачи, такие как тестирование вычислений, свойства PNL и калибровка параметров, компьютерной системе. . В идеале трейдер должен тратить только около 10% своего времени на кодирование своих стратегий и полагаться на строительные блоки или шаблоны для быстрого и эффективного прототипирования стратегий, без необходимости кодировать все с нуля. Лектор подчеркивает важность проведения мозгового штурма и выдвижения торговых идей, сводя к минимуму время, затрачиваемое на тестирование и программирование.

  • 00:15:00 Докладчик подчеркивает важность наличия набора строительных блоков, которые исследователи могут использовать для быстрого прототипирования новых стратегий. Он упоминает, что Algocron предлагает различные строительные блоки, такие как индикаторы медвежьего рынка, основанные на условных вероятностях и совместной интеграции с корзинами контроля. Он подчеркивает идею о том, что создание стратегий должно быть похоже на игру с конструктором «Лего», когда исследователи могут соединять строительные блоки для создания новой стратегии. Спикер объясняет, что, несмотря на то, что трейдеры тратят большую часть своего времени на придумывание идей, им приходится проводить тестирование и очистку данных, что может быть непросто. Им необходимо обрабатывать большие объемы данных из разных источников и извлекать полезную информацию, такую как соотношение цены и прибыли, при обработке отсутствующих или неверных данных. Этот процесс требует серьезного программирования, и если стратегии основаны на событиях, исследователям может понадобиться база данных новостей и расписаний объявлений.

  • 00:20:00 Спикер обсуждает сложности моделирования торговой стратегии со стаканом заявок. Одной из проблем является проскальзывание, что означает, что только потому, что кто-то хочет купить что-то по определенной цене, не означает, что он действительно может купить это по этой цене из-за движения рынка. Другая проблема связана с предположениями об исполнении при моделировании стакана ордеров. Процесс моделирования громоздкий и трудоемкий, особенно при использовании языков сценариев, таких как MATLAB или R. Калибровка параметров и моделирование могут занять до сотен часов, а ошибки в программном коде могут еще больше продлить процесс. Процесс отладки кода долгий и утомительный и может привести к отказу от сделки не из-за неправильного кода, а из-за нехватки времени или разочарования.

  • 00:25:00 Спикер обсуждает реалии количественного трейдинга и инструменты, которыми пользуются трейдеры. Они объясняют, что многие трейдеры монет являются количественными аналитиками, которые тратят почти 90% своего времени на программирование и отладку, а это не то, чем должна быть работа. Причина этого в том, что инструменты исследования, используемые трейдерами, примитивны, а популярные включают Excel, MATLAB, R и коммерческое программное обеспечение. Однако спикер утверждает, что эти инструменты не созданы для количественной торговли и бесполезны для построения сложных математических стратегий. Они предполагают, что другие языки программирования, такие как Java, C-sharp и C++, имеют библиотеки для объединения и создания стратегий изменений, которые трейдеры могут использовать вместо этого.

  • 00:30:00 Спикер обсуждает недостатки использования R для количественного трейдинга. Одна из основных проблем заключается в том, что R очень медленный, поскольку это интерпретируемый язык, а это означает, что интерпретатор выполняет построчно. Кроме того, имеется ограниченный объем доступной памяти, что делает невозможным загрузку в память значительного объема данных для анализа. Более того, возможность распараллеливания очень ограничена, что затрудняет запуск симуляций на тысячах процессоров. Докладчик упоминает, что использовать R для параллельных вычислений сложно, а его IDE не так продвинута, как другие языки, такие как Java и C-sharp. Также отсутствуют инструменты отладки, что затрудняет выявление проблем, и нет стандартного интерфейса для связи между различными программами.

  • 00:35:00 Спикер обсуждает преимущества и недостатки использования R в качестве инструмента количественной торговой стратегии. Он подчеркивает, что R имеет ограниченную поддержку объектно-ориентированного программирования, и большая часть кода написана с использованием процедурного языка, но он имеет значительные преимущества по сравнению с языками общего назначения. Самая большая проблема с R заключается в том, что нет способа гарантировать, что исходный код не содержит ошибок, и это может расстраивать при отладке кода. Спикер подчеркивает важность технологий, объясняя, что опора на оружие (инструменты и исследования) имеет решающее значение в торговой войне. Умный человек без технологий не может конкурировать с кем-то, кто использует такие технологии, как параллельные вычисления и машинное обучение, для поиска прибыльных торговых стратегий.

  • 00:40:00 Спикер рассуждает о важности технологий в количественном трейдинге. Использование таких инструментов, как R и MATLAB, может значительно улучшить математическое программирование и предоставить доступ к широкому спектру библиотек, позволяющих выполнять более быстрые математические вычисления. Наличие хорошего набора инструментов для исследования трейдинга необходимо для быстрого создания и тестирования стратегий с целью использования рыночных возможностей. Идеальный набор инструментов должен позволять трейдерам легко комбинировать модули, выполнять параллельное программирование и генерировать статистику производительности, не тратя много времени на программирование. Очистка данных также должна быть автоматизирована, а калибровка параметров должна выполняться автоматически. Основное внимание должно быть сосредоточено на кодировании стратегий, а не на механическом программировании.

  • 00:45:00 Обсуждается важность использования хорошего инструмента для программирования. Докладчик упоминает, что использование новых технологий, таких как Java и C#, устраняет необходимость в отладке таких проблем, как утечки памяти и ошибки сегментации, что значительно повышает производительность. Кроме того, класс начинает практическое лабораторное занятие, на котором они исследуют эксперимент с марковской моделью, а спикер направляет участников через процесс копирования и вставки кода с веб-сайта в корзину для запуска. В класс входят участники с опытом программирования, поэтому они пропускают основы программирования на Java.

  • 00:50:00 Спикер объясняет, как исправить ввод для Java-программы, исправив импорт с помощью команды ctrl shift i. Затем он продолжает демонстрировать, как можно выполнять математическое программирование на Java с помощью библиотеки algo quant, и показывает простую модель цепи Маркова, которую можно запустить в новом пакете и классе. Спикер побуждает участников задавать вопросы и следит за тем, чтобы каждый мог следить за демонстрацией.

  • 00:55:00 Спикер отвечает на некоторые технические вопросы аудитории о том, как загрузить и запустить код, использованный в лекции. Он продолжает демонстрировать классическую версию Скрытой Цепи Маркова, используя функцию вебинара, для которой он оставляет только pi a1 и b1 и удаляет другой код.

Часть 2

  • 01:00:00 Спикер объясняет модель с двумя состояниями с переходными вероятностями, которая является простым примером цепи Маркова. Он иллюстрирует вероятности перехода на визуальной диаграмме и объясняет вероятность наблюдения определенных значений в каждом состоянии. Затем спикер продолжает объяснять, почему цепь Маркова по сути является генератором случайных чисел, и демонстрирует, как моделировать эту конкретную цепь Маркова для получения наблюдений.

  • 01:05:00 Докладчик объясняет концепцию цепи Маркова и то, как она используется в качестве генератора случайных чисел для наблюдения за ценами на акции. В качестве примера приведены вероятности начального состояния и переходные вероятности цепи Маркова с двумя состояниями, но в реальных ситуациях эти параметры необходимо оценивать на основе наблюдений. Докладчик демонстрирует, как оценить эти параметры, используя алгоритм скрытой цепи Маркова Webinar Models для оценки параметров. Затем расчетную модель можно сравнить с фактической моделью на предмет точности.

  • 01:10:00 Спикер обсуждает важность оценки параметров в количественном трейдинге. Он отмечает, что в реальности наблюдаются только цены или доходность, а истинная модель неизвестна, поэтому лучший вариант — оценить параметры модели. Он упоминает хороший алгоритм оценки параметров, алгоритм вебинара, который максимально соответствует реальным моделям и полезен для трейдинга. Докладчик призывает аудиторию поэкспериментировать с созданием собственных моделей цепи Маркова, изменяя параметры, производя различные наблюдения и выполняя различные оценки, чтобы понять, как они соответствуют истинным значениям в различных условиях.

  • 01:15:00 Спикер обсуждает предстоящую живую дискуссию по марковскому моделированию и программированию, задавая вопросы и демонстрируя экран во время обсуждения. Задача состоит в том, чтобы сгенерировать различные наблюдения с использованием персональной марковской модели и оценить различные параметры, чтобы проверить, соответствует ли предполагаемая модель реальной модели. Цель состоит в том, чтобы определить, насколько хороша модель рынка, поскольку в конечном итоге трейдеры полагаются на нее. Спикер предлагает добавить экстремальные значения и сценарии стресса, чтобы увидеть, как ведет себя цепь Маркова.

  • 01:35:00 Преподаватель и студенты курса обсуждают технические детали, связанные с лицензированием и экспериментами. Инструктор советует одному из студентов заменить свою долгосрочную лицензию новой загруженной и предлагает поэкспериментировать с различными параметрами, чтобы определить точку, в которой оценочные модели полезны для целей обучения количественному трейдингу. Другие учащиеся сообщают о проблемах с экспериментами и лицензированием, которые рассматриваются подробно.

  • 01:40:00 Спикер предлагает аудитории создать собственную цепь Маркова и поэкспериментировать с вероятностями перехода. Они предлагают использовать модель с двумя состояниями для модели с тремя состояниями и использовать творческий подход и воображение для создания необычных вероятностей перехода, таких как ноль или «состояние синхронизации», из которого нельзя выйти после входа. Спикер подчеркивает важность творчества и воображения в количественном трейдинге и предлагает использовать их, чтобы увидеть, как ведет себя процедура оценки с уникальными цепями Маркова с фазовым изменением.

  • 01:45:00 Спикер рассуждает о важности общения и сотрудничества в количественном трейдинге, особенно при проведении экспериментов и анализе данных. Они подчеркивают необходимость для членов команды постоянно проверять друг друга и предоставлять обновленную информацию о своем прогрессе, отмечая, что у людей могут быть разные подходы или идеи для одной и той же проблемы. Спикер также упоминает возможность использования марковских моделей более высокого порядка в своих экспериментах и спрашивает, исследовал ли кто-нибудь этот вариант.

  • 01:50:00 Лектор обсуждает важность генерации тестовых случаев для проверки соответствия предполагаемой модели реальной модели. Реальная модель — это та, которая используется для создания наблюдений, в то время как оценочная модель создается с использованием наблюдений. Эксперимент направлен на определение того, достаточно ли близка предполагаемая модель к реальной модели. Лектор предлагает создать различные тестовые примеры, чтобы увидеть, как работает оценка, и подчеркивает важность тестирования с меньшим количеством наблюдений.

  • 01:55:00 Спикер обсуждает проблемы с точной оценкой количественных торговых моделей при ограниченных наблюдениях. Отмечается, что в статистике алгоритмы сосредоточены на сходимости, а это означает, что оценка становится более точной по мере увеличения количества наблюдений. Однако спикер подчеркивает, что трудно определить, насколько модель близка к реальности, поскольку у вас есть только предполагаемая модель, а не истинные значения. Кроме того, вводится концепция вычисления вероятности генерации наблюдаемых значений с помощью данной модели, что является важным аспектом оценки максимального правдоподобия.

Часть 3

  • 02:00:00 Лектор обсуждает проблемы оценки вероятностей в модели с двумя состояниями с ограниченными данными. Оценка вероятностей перехода неверна, когда имеется только 100 наблюдений. Однако с 10 000 наблюдений точность возрастает, но проблема остается, потому что большинство активов не служат в течение 40 лет, а именно столько данных вам потребуется для такого количества наблюдений. Модель с двумя состояниями имеет 12 параметров, и по мере увеличения числа параметров для точной оценки требуется больше данных. Поэтому важно иметь большой объем данных для точной оценки вероятностей, что нецелесообразно в торговле, особенно при построении сложных моделей. Лектор рекомендует построить 3 или 4 модели состояния или увеличить количество наблюдений, чтобы преодолеть эту проблему.

  • 02:05:00 Спикер обсуждает сложность оценки моделей цепей Маркова в количественном трейдинге. Увеличение количества переменных делает процесс оценки еще более сложным, а использование параметрического семейства распределений вместо указания подобных операций может значительно сократить количество параметров. Однако алгоритм Баума-Уэлча, который используется для обучения непрерывной скрытой марковской модели (HMM), может быть сложным. Затем спикер переходит к обсуждению следующего эксперимента: тестирования на исторических данных.

  • 02:10:00 Показанная демонстрация имитирует простое пересечение скользящих средних на бирже XOM, и программа настроена на загрузку данных по акциям с Yahoo и моделирование торговли с 1990 по 2012 год. Структура того, как настроить источник данных объясняется, при этом подключаемый модуль источника данных Yahoo является самым простым и простым в использовании для тех, у кого нет доступа к профессиональным источникам данных. Эта демонстрация представляет собой полезный пример того, как программировать и тестировать торговые стратегии.

  • 02:15:00 Спикер объясняет процесс создания стратегий, симуляторов и всех книг, необходимых для запуска симулятора. Приведенный пример представляет собой стратегию пересечения скользящих средних, которая включает вычисление более быстрой скользящей средней с использованием данных за последние 20 дней и более медленной скользящей средней с использованием данных за последние 250 дней. Спикер отмечает, что можно изучить исходный код реализации стратегии, симулятора и торговых плоттеров в AlgoQuant, который является программным обеспечением с открытым исходным кодом. Кроме того, спикер объясняет, что открытая доступность программного обеспечения позволяет пользователям самостоятельно проверять его код и вносить изменения для настройки. Наконец, спикер объясняет, что существуют различные меры, которые можно использовать для анализа эффективности, включая прибыль и убыток, коэффициент информации, коэффициент Шарпа, максимальную просадку, массовое воздействие и омегу.

  • 02:20:00 Докладчик демонстрирует, как использовать различные анализаторы производительности в Lwan для вычисления различных показателей, таких как просадка, и создания отчета об эффективности стратегии. Код прослушивает важные для него события, такие как обновление цен, и генерирует новые заказы на основе последней информации. Спикер предлагает использовать отладчик, чтобы лучше понять поведение кода и посмотреть, как он реагирует на обновления цен и формирует ордера.

  • 02:25:00 Спикер демонстрирует, как с помощью отладчика отслеживать торговую стратегию и следить за пересечениями как сигналами. Он объясняет, как установить точку останова и остановиться при появлении реального сигнала пересечения, показывая пример, когда более быстрая скользящая средняя пересекает более медленную скользящую среднюю. Затем стратегия открывает длинную позицию, покупая одну единицу продукта XOM по рыночной цене. Позже, когда более быстрая скользящая средняя пересекает более медленную скользящую среднюю, стратегия открывает короткую позицию, продавая две единицы XOM по рыночной цене. Спикер показывает график ордера на покупку и объясняет разницу между покупкой по рыночному ордеру и размещением лимитного ордера, вызванного желаемой ценой.

  • 02:30:00 Докладчик рассказывает о моделировании простой стратегии пересечения скользящих средних в AlgoQuant. Они демонстрируют, как использовать исторические данные для генерации сигналов покупки и продажи и расчета ордеров для поддержания желаемой позиции. Стратегия слушает сигналы обновления разработчиков и подписывается на сигнал стакана для этой задачи. Докладчик отмечает, что хотя исторического тестирования недостаточно, оно является хорошей отправной точкой, а простое пересечение скользящих средних можно обобщить на другие сценарии. Они также упоминают, что стратегия — это просто функция, и показывают математику для расчета ордера.

  • 02:35:00 Спикер обсуждает важность моделирования и экспериментирования при попытке создать торговую стратегию с использованием математического анализа. Он демонстрирует использование стратегии GMA21, которая ранее была доказана математически, но дает неблагоприятные результаты при тестировании с помощью моделирования из-за транзакционных издержек. Докладчик подчеркивает важность программного обеспечения и программирования для экспериментов и тонкой настройки торговых стратегий, чтобы избежать убытков в реальных сценариях торговли, подчеркнув, что можно тестировать разные параметры для разных акций, чтобы найти наиболее эффективную стратегию.

  • 02:40:00 Лектор обсуждает важность экспериментирования для подтверждения теоретических предсказаний в количественном трейдинге. Студентам предлагается использовать предоставленное программное обеспечение для экспериментов с различными числами и создания собственных торговых стратегий. Лектор знакомит студентов с реализацией стратегии gma21, которая покупает, когда текущая цена выше последней, и продает, когда текущая цена ниже последней, показывая, как вычислять ордера и отправлять их брокерам для исполнения. Затем учащимся поручают создать свои собственные стратегии и поэкспериментировать с ними на исторических данных.

  • 02:45:00 Спикер представляет простейшую торговую стратегию, которую легко реализовать, что делает ее решением plug-and-play. Спикер задает вопросы из аудитории и призывает их обращаться, если им нужны дополнительные разъяснения.

  • 02:55:00 Спикер обсуждает частный случай геометрического скользящего среднего, когда М равно единице. Этот случай упрощает стратегию, позволяя сравнивать только текущую доходность с нулем, и, хотя эта стратегия не обязательно приносит прибыль, она служит хорошим примером для образовательных целей. Спикер призывает аудиторию завершить упражнение по этой стратегии в автономном режиме, чтобы они могли чувствовать себя комфортно при кодировании и тестировании с использованием системы алгокойн для предстоящих упражнений по математике и программированию.
 

Площадка для финансовой инженерии: обработка сигналов, надежная оценка, Калман, оптимизация



Площадка для финансовой инженерии: обработка сигналов, надежная оценка, Калман, оптимизация

В этом захватывающем видео Дэниел Паломар, профессор кафедры электротехники, электроники и вычислительной техники HKUST, проливает свет на широкий спектр применений обработки сигналов в сфере финансового инжиниринга. Паломар развеивает заблуждение, связанное с финансовым инжинирингом, и подчеркивает повсеместное распространение методов обработки сигналов в этой области. Он подчеркивает актуальность различных тем, таких как теория случайных матриц, фильтры частиц, фильтры Калмана, алгоритмы оптимизации, машинное обучение, глубокое обучение, стохастическая оптимизация и случайные ограничения.

Паломар исследует отличительные свойства финансовых данных, известные как стилизованные факты, которые остаются неизменными на разных рынках. Он объясняет, как финансовые инженеры используют доходность, а не цены для моделирования фондового рынка. Линейная и логарифмическая доходности, несмотря на их незначительные различия, широко используются из-за небольшой величины доходности. Эти доходы анализируются для определения их стационарности, при этом нестационарность является важной характеристикой финансовых данных. Спикер также обращается к другим стилизованным фактам, таким как распределения с тяжелыми хвостами, асимметрия в низкочастотных доходах и явление кластеризации волатильности.

Подчеркивается важность моделирования доходности акций в финансах с особым акцентом на волатильность. Паломар проводит параллели между обратным сигналом и речевым сигналом, исследуя потенциальное сотрудничество между финансовым моделированием и обработкой речевого сигнала. Обсуждаются различные частотные режимы моделирования, в том числе высокочастотное моделирование, и подчеркиваются проблемы, связанные с необходимостью данных в реальном времени и мощных вычислительных ресурсов.

Также рассматриваются ограничения моделей, которые сосредоточены исключительно на моделировании доходности без учета ковариации или дисперсии доходности. Докладчик подчеркивает важность сбора информации и структуры, предоставляемых моделями ковариации и дисперсии, что может обеспечить более выгодное принятие решений. Паломар вводит концепцию моделирования дисперсии и ковариации доходности с использованием остатка, состоящего из нормализованного случайного члена и огибающего члена, отражающего ковариацию остатков. Однако моделирование многомерного остатка с большой матрицей коэффициентов требует более сложных моделей.

В видео рассматриваются проблемы оценки параметров в условиях ограниченности данных и обилия параметров, которые могут привести к переоснащению. Чтобы решить эту проблему, вводится разреженность низкого ранга как средство анализа модели Vega и формулирования ограничений. Паломар обсуждает концепцию надежности и неадекватность предположения о гауссовском распределении для финансового инжиниринга из-за тяжелых хвостов и режимов небольшой выборки. Он объясняет, что традиционные выборочные оценки, основанные на распределении Гаусса, дают некачественные результаты, что требует переформулировки без таких допущений. Такие методы, как сокращение и регуляризация, представлены как эффективные средства решения проблем с «тяжелыми хвостами» при их успешном применении в финансах и коммуникациях.

Исследуется надежная оценка, инструмент, используемый в финансах для повышения точности, несмотря на выбросы. Докладчик представляет эллиптические распределения для моделирования распределений с тяжелыми хвостами и объясняет, как можно рассчитать веса для каждой выборки с помощью итеративного метода. Оценщик Тайлера, который нормализует выборки и оценивает функцию плотности вероятности (PDF) нормализованной выборки, обсуждается как средство удаления формы хвоста. Оценка Тайлера в сочетании с надежными оценками повышает точность оценки ковариационной матрицы. Включение условий регуляризации и разработка алгоритмов дополнительно способствуют улучшению наблюдений и оценок ковариационных матриц.

Паломар углубляется в финансовые концепции, такие как оценка Вульфа, оценка Тайлера и коинтеграция. Хотя оценка Вульфа представляет собой значительное улучшение, она по-прежнему основана на предположении о распределении Гаусса. Оценка Тайлера, привлекательная альтернатива, требует достаточного количества выборок для моделей с несколькими измерениями. Коинтеграция, важнейшее понятие в финансах, предполагает, что предсказать относительную цену двух акций может быть проще, чем предсказать отдельные цены, открывая возможности для парной торговли. Исследуется различие между корреляцией и коинтеграцией, причем корреляция сосредоточена на краткосрочных вариациях, а коинтеграция - на долгосрочном поведении.

Видео раскрывает концепцию общего тренда и его связь с торговлей спредами. Общий тренд описывается как случайное блуждание между двумя акциями, имеющими общий компонент. Вычитая общий тренд из спреда между ценами акций, трейдеры получают остаток с нулевым средним, который служит надежным индикатором возврата к среднему. Это свойство становится важным в стратегиях торговли спредами. Спикер объясняет, что, устанавливая пороговые значения спреда, трейдеры могут выявлять недооцененные ситуации и извлекать выгоду из восстановления цены, таким образом, получая прибыль от ценовой разницы. Оценка параметра гаммы и выявление коинтегрированных запасов являются важными шагами в этом процессе, которые можно выполнить с помощью таких методов, как метод наименьших квадратов.

Докладчик углубляется в роль фильтра Калмана в сценариях, где изменение режима приводит к потере коинтеграции из-за различной гаммы. Приспособляемость фильтра Калмана к этим вариациям подчеркивается путем сравнения с методами наименьших квадратов и скользящими методами наименьших квадратов. Показано, что фильтр Калмана превосходит другие методы, поскольку он поддерживает устойчивое отслеживание около нуля, в то время как метод наименьших квадратов демонстрирует флуктуации, которые приводят к потерям в течение определенного периода времени. Таким образом, спикер рекомендует использовать фильтр Калмана для надежной оценки в финансовой инженерии.

Представлено сравнение производительности моделей наименьших квадратов и фильтров Калмана, подтверждающее эффективность метода Калмана в финансовом инжиниринге. Затем докладчик углубляется в применение скрытых марковских моделей для обнаружения рыночных режимов, что позволяет трейдерам корректировать свои инвестиционные стратегии в зависимости от преобладающих рыночных условий. Оптимизация портфеля представлена как фундаментальная концепция, включающая разработку портфелей, которые уравновешивают ожидаемую доходность и дисперсию доходности портфеля. Докладчик проводит параллели между оптимизацией портфеля и моделями формирования луча и линейной фильтрации, поскольку они используют схожие модели сигналов.

В видео обсуждается, как методы связи и обработки сигналов могут быть применены к финансам. Понятие отношения сигнал-шум в коммуникациях сравнивают с коэффициентом Шарпа в финансах, который измеряет отношение доходности портфеля к волатильности. Докладчик представляет портфель Марковица, который стремится максимизировать ожидаемую доходность при минимизации дисперсии. Однако из-за чувствительности к ошибкам оценки и зависимости от дисперсии как меры риска портфель Марковица не получил широкого распространения на практике. Чтобы решить эту проблему, можно использовать методы разреженности обработки сигналов, особенно при отслеживании индекса, когда для отслеживания индекса используется только подмножество акций, а не инвестирование во все составляющие акции. Докладчик предлагает улучшить методы разреженности для уменьшения ошибок отслеживания.

Видео раскрывает концепцию «торговли кошельками» и подчеркивает роль портфелей в трейдинге. Используя модель стоимости под риском (VaR), спикер объясняет, как можно достичь портфельной торговли, создав портфель из двух акций с определенным весом. Матрица PI и бета-матрица представлены как инструменты, которые обеспечивают подпространство спредов, возвращающих к среднему, что позволяет проводить статистический арбитраж. Включение бета-матрицы в оптимизацию облегчает идентификацию оптимального направления в подпространстве, что приводит к лучшим результатам по сравнению с использованием только бета-версии. Спикер также упоминает свою книгу «Перспектива обработки сигналов в финансовой инженерии», которая служит отправной точкой для специалистов по обработке сигналов, интересующихся сферой финансов.

В конце видео исследуются различные подходы к торговле в финансовой инженерии. Докладчик проводит различие между стратегиями, которые извлекают выгоду из небольших изменений и тенденций, и теми, которые сосредоточены на использовании шума. Эти два семейства инвестиционных стратегий предлагают различные возможности для получения прибыли. Докладчик также коснулся проблем, связанных с отсутствием данных для применения методов глубокого обучения в финансах, поскольку глубокое обучение обычно требует значительных объемов данных, которые могут быть ограничены в финансовом контексте. Кроме того, обсуждается концепция оценки векторных измерений для более чем двух акций, а выступающий дает представление о различных подходах.

В заключительном сегменте спикер затрагивает вопрос о доминировании на рынке крупных компаний и его влиянии на финансовый рынок. Спикер подчеркивает потенциальное влияние, которое крупные компании со значительными финансовыми ресурсами могут иметь, когда они делают существенные инвестиции. Такая концентрация власти заставляет задуматься о динамике рынка и поведении других участников рынка.

Видео кратко затрагивает тему исполнения ордеров в финансах. В нем объясняется, что при работе с крупными заказами принято разбивать их на более мелкие части и выполнять постепенно, чтобы не нарушить рынок. Этот аспект финансов включает в себя сложные методы оптимизации и часто основывается на принципах теории управления. Докладчик подчеркивает математическую природу исполнения ордеров и упоминает о существовании многочисленных научных работ по этому вопросу.

По мере того, как видео подходит к концу, спикер предлагает аудитории задать любые дополнительные вопросы во время перерыва на кофе, подтверждая их присутствие и участие. Видео служит ценным ресурсом, предоставляя информацию о применении обработки сигналов в финансовом инжиниринге. Он предлагает перспективы улучшения оценок, оптимизации портфелей и выявления рыночных режимов через призму методов обработки сигналов.

В целом, видео предоставляет всесторонний обзор различных приложений обработки сигналов в финансовом инжиниринге. В нем подчеркивается важность моделирования доходности акций, дисперсии и ковариации в финансах при решении проблем оценки параметров, переобучения и ограничений традиционных финансовых моделей. Подробно обсуждаются концепции надежной оценки, коинтеграции, оптимизации портфеля и методов разреженности. Подчеркивая параллели между коммуникацией и обработкой сигналов в финансах, спикер подчеркивает актуальность и потенциал для сотрудничества между этими двумя областями. Видео завершается тем, что проливает свет на торговые стратегии, машинное обучение в финансах и значение динамики рынка, на которую влияют крупные компании.

  • 00:00:00 Дэниел Паломар, профессор кафедры электротехники, электроники и вычислительной техники в HKUST, обсуждает тему финансовой инженерии и то, как существует неправильное представление о том, что это такое. Паломар объясняет, что обработка сигналов находится повсюду в финансовом инжиниринге, и различные темы, такие как теория случайных матриц, фильтр частиц, фильтр Калмана, алгоритмы оптимизации, машинное обучение, глубокое обучение, стохастическая оптимизация и ограничения шансов, актуальны. Он также касается стилизованных фактов о финансовых данных и объясняет, что финансовые данные обладают особыми свойствами, одинаковыми для разных рынков.

  • 00:05:00 Видео объясняет, как финансовые инженеры моделируют фондовый рынок, используя доходность вместо цен. Есть два типа доходности: линейная и логарифмическая, но они почти одинаковы, так как обычно возвращаются небольшие числа. Можно построить график доходности, чтобы увидеть, являются ли они стационарными или нет, и стилизованным фактом финансов является их нестационарность. Другие стилизованные факты включают тяжелые хвосты, что означает, что хвосты исторической гистограммы доходности тяжелые, а не тонкие, как распределение Гаусса. Финансовым инженерам также необходимо моделировать асимметрию, особенно при низкой частоте доходности. Наконец, видео объясняет концепцию кластеризации волатильности и ее важность в финансовом моделировании.

  • 00:10:00 Спикер обсуждает важность моделирования доходности акций в финансах. Они объясняют, что волатильность играет решающую роль в моделировании, особенно при моделировании стандартного отклонения или огибающей сигнала доходности. Докладчик отмечает, что возвращаемый сигнал похож на речевой сигнал, и размышляет, существует ли достаточное совпадение между финансовым моделированием и обработкой речевого сигнала, чтобы стимулировать сотрудничество. В моделировании существуют различные частотные режимы, и высокочастотное моделирование, в частности, требует дорогостоящих подписок и мощных компьютеров из-за огромного количества критичных ко времени данных. Раздел завершается упоминанием различных моделей финансового моделирования, таких как модель IID и факторная модель, и затрагивает важность понимания корреляций во времени при моделировании.

  • 00:15:00 Спикер обсуждает ограничения финансовых моделей, которые фокусируются только на моделировании доходности, а не на ковариации или дисперсии доходности. Они объясняют, что, глядя только на прибыль, вы можете потерять информацию и структуру, которые другие могут захватить, чтобы заработать деньги. Затем докладчик представляет идею моделирования дисперсии и ковариации доходностей с использованием остатка, состоящего из двух факторов: нормализованного случайного члена с единичной дисперсией и огибающего члена, который фиксирует ковариацию остатков. Они отмечают, что модели скалярного остатка хорошо зарекомендовали себя, но для моделирования многомерного остатка с матричным коэффициентом 500 на 500 требуются гораздо более сложные модели.

  • 00:20:00 Докладчик объясняет проблемы оценки параметров при недостаточном количестве данных и слишком большом количестве параметров, что приводит к переоснащению. Чтобы решить эту проблему, необходимо наложить разреженность низкого ранга для анализа модели Vega и сформулировать некоторые ограничения. Докладчик вводит понятие надежности, где мы считаем, что распределение Гаусса не подходит для финансового инжиниринга из-за тяжелых хвостов и режимов с малой выборкой. Традиционные выборочные оценки, основанные на распределении Гаусса, дают плохие результаты. Чтобы решить эту проблему, нам нужно переформулировать все, не предполагая гауссово распределение, а тяжелые хвосты можно устранить с помощью методов сокращения или регуляризации, которые использовались в различных отраслях, включая финансы и коммуникации.

  • 00:25:00 Докладчик обсуждает надежную оценку, которая является инструментом, используемым в финансах для получения более точных оценок, несмотря на различные выбросы в данных. Докладчик объясняет, что эллиптические распределения можно использовать для моделирования распределений с тяжелыми хвостами, а веса каждой выборки можно рассчитать с помощью итерационного метода. Кроме того, спикер объясняет оценщик Тайлера, который нормализует выборки и оценивает PDF нормализованной выборки, чтобы удалить форму хвоста. Этот оценщик можно использовать вместе с надежными оценщиками, чтобы обеспечить более точную оценку ковариационных матриц. Затем выступающий объясняет, как можно включить условия регуляризации и разработать алгоритмы для лучшего понимания наблюдений, с графическим изображением, показывающим ошибку оценки ковариационных матриц в зависимости от количества выборок.

  • 00:30:00 Докладчик обсуждает финансовые концепции, такие как оценка Вульфа, оценка Тайлера и коинтеграция. Оценка Вульфа является большим улучшением, но все еще делает предположение о гауссовском распределении. Оценка Тайлера — хорошая альтернатива, но для 14-мерной модели требуется не менее 40 выборок. Коинтеграция, особая концепция в финансах, представляет собой идею о том, что относительную цену двух акций может быть легче предсказать, чем отдельные цены, что позволяет трейдерам зарабатывать деньги на парной торговле. Разница между корреляцией и коинтеграцией заключается в том, что корреляция связана с краткосрочными изменениями, а коинтеграция больше связана с долгосрочным поведением. Докладчик иллюстрирует эти понятия различными сюжетами и графиками.

  • 00:35:00 Спикер объясняет понятие общего тренда и его отношение к торговле спредами. Общий тренд — это случайное блуждание двух акций с общим компонентом. Вычитая общий тренд из спреда между ценами акций, трейдер получает остаток, равный нулю, что делает его хорошим индикатором возврата к среднему, свойством, которое можно использовать для торговли спредом. Трейдер устанавливает два порога спреда и покупает, когда он недооценен, и продает, когда он восстанавливается, зарабатывая на разнице. Для оценки гаммы можно использовать метод наименьших квадратов, но для этого необходимо найти два коинтегрированных запаса и значение гаммы. Спикер показывает пример реального сценария торговли спредом.

  • 00:40:00 Докладчик объясняет, как появляется Калман при изменении режима и теряется коинтеграция из-за изменения гаммы, и как он приспосабливается к этим вариациям. Докладчик использует две акции в качестве примера для сравнения отслеживания MU и гаммы с использованием метода наименьших квадратов, Калмана и скользящего метода наименьших квадратов, и приходит к выводу, что Калман работает лучше всего. Зеленая линия для отслеживания Калмана остается около нуля, в то время как черная линия для метода наименьших квадратов движется вверх и вниз, что приводит к потере денег в течение двух лет. Поэтому спикер предлагает использовать Калмана для надежной оценки в финансовой инженерии.

  • 00:45:00 Спикер сравнивает эффективность моделей обучения методом наименьших квадратов и Калмана и приходит к выводу, что метод Калмана хорошо работает в финансовой инженерии, а модель наименьших квадратов сужается после определенного момента. Он обсуждает использование скрытых марковских моделей для обнаружения рыночных режимов, что помогает менять инвестиционные стратегии в зависимости от того, в хорошем или плохом состоянии находится рынок. Кроме того, он исследует концепцию оптимизации портфеля и объясняет, что портфели — это векторы с весами, которые сообщают инвесторам, сколько денег нужно инвестировать в акции. Ожидаемая доходность и дисперсия доходности портфеля также являются ключевыми факторами, используемыми при разработке портфелей. Докладчик проводит сравнение с моделями формирования луча и линейной фильтрации, которые используют аналогичные модели сигналов для оптимизации портфеля.

  • 00:50:00 Спикер обсуждает, как можно применить методы связи и обработки сигналов в финансах. Концепция отношения сигнал-шум в коммуникациях аналогична коэффициенту Шарпа в финансах, который представляет собой отношение доходности портфеля к волатильности. Оптимизация портфеля, в частности портфеля Марковица, которая включает в себя максимизацию ожидаемой доходности и минимизацию дисперсии, представлена как простая выпуклая задача. Докладчик также отмечает, что портфель Марковица не часто используется на практике из-за его чувствительности к ошибкам оценки и зависимости от дисперсии как меры риска. Однако методы разреженности, полученные при обработке сигналов, могут быть применены к отслеживанию индекса, когда вместо покупки сотен акций для отслеживания индекса используется только подмножество акций. Наконец, выступающий предлагает улучшить методы разреженности при отслеживании ошибок.

  • 00:55:00 Спикер рассуждает о «кошельковой торговле» и использовании портфелей в трейдинге. Используя модель VaR (стоимость под риском), спикер объясняет, как можно торговать портфелем с двумя акциями и портфелем из двух компонентов с весом один и минус гамма. Затем докладчик представляет матрицу PI и бета-матрицу, которая дает подпространство спредов, возвращающих к среднему, которое можно использовать для статистического арбитража. Использование бета-матрицы в оптимизации помогает найти наилучшее направление в подпространстве и дает лучшие результаты, чем простое использование магической бета-версии. Спикер также продвигает свою книгу «Перспектива обработки сигналов в финансовой инженерии», которая является отправной точкой для людей, интересующихся обработкой сигналов в области финансов.

  • 01:00:00 Спикер рассказывает о различных подходах к торговле в финансовой инженерии, в том числе о торговле на спреде с использованием окончания ценового тренда и небольших вариаций. Он объясняет, что существует два семейства инвестиционных стратегий: те, которые зарабатывают на тренде и небольших колебаниях, и те, которые зарабатывают на шуме, игнорируя тренд при формировании спреда. Спикер также обсуждает машинное обучение в финансах и объясняет, что нехватка данных создает проблему для использования глубокого обучения в финансах, поскольку для глубокого обучения требуется большой объем данных, который часто ограничен в финансах. Наконец, он обсуждает понятие коинтеграции и объясняет различные подходы к оценке векторных измерений для более чем двух акций.

  • 01:05:00 Спикер обсуждает проблему больших компаний, имеющих слишком много денег, которые могут управлять рынком, когда они инвестируют. Они также упоминают тему исполнения ордеров в финансах, где крупные ордера разбиваются на мелкие части и отправляются медленно, чтобы не нарушить работу рынка. Эта отрасль финансов включает в себя большую оптимизацию и может стать очень математической, с большим количеством статей по теме теории управления. Спикер предлагает задать дополнительные вопросы во время кофе-брейка и благодарит аудиторию за присутствие.
 

«Фильтрация Калмана с приложениями в финансах», Шэнцзе Сю, учебное пособие 2021 г.



«Фильтрация Калмана с приложениями в финансах», Шэнцзе Сю, учебное пособие 2021 г.

В видео под названием «Фильтрация Калмана с приложениями в финансах» исследуется концепция моделей на основе состояний и их применение в финансах. Докладчик представляет фильтр Калмана как универсальный метод прогнозирования состояния системы на основе предыдущих наблюдений и корректировки прогноза с использованием текущих наблюдений. В видео также рассматриваются Common Smoother и алгоритм EM, которые используются для анализа исторических данных и изучения параметров финансовой модели на основе состояния.

Видео начинается с иллюстрации концепции моделей на основе состояний на примере автомобиля, движущегося по оси со скрытыми позициями. Докладчик объясняет, как модели на основе состояний состоят из матриц перехода и наблюдения, которые отображают состояние в наблюдаемое пространство. Эти модели могут одновременно обрабатывать несколько состояний или положений датчиков. Скрытое состояние следует марковскому свойству, что приводит к элегантной форме вероятности.

Затем спикер углубляется в алгоритм фильтра Калмана и его применение в финансах. Алгоритм включает этапы прогнозирования и коррекции, где неопределенность представлена дисперсией функции Гаусса. Общий выигрыш, который определяет вес между прогнозом и наблюдением, выделен как решающий фактор. Подчеркнуты простота и вычислительная эффективность фильтра Калмана.

Обсуждается эксперимент по сравнению надежности данных GPS и одометра при прогнозировании местоположения автомобиля, демонстрирующий эффективность фильтра Калмана даже при ненадежности некоторых источников данных. Однако отмечается, что фильтр Калмана предназначен для линейных гауссовых стабилизированных моделей, что ограничивает его применимость.

В видео также представлен общий сглаживатель, который обеспечивает более плавную работу, чем общий фильтр, и решает проблему нисходящего тренда фильтра. Обсуждается необходимость обучения параметров в финансах и концепция изменяющихся во времени параметров. Алгоритм максимизации ожидания (EM) представлен как средство для изучения параметров, когда скрытые состояния неизвестны.

Докладчик объясняет алгоритм EM, состоящий из E-шага и M-шага, для расчета апостериорных распределений скрытых состояний и оптимизации целевой функции для оценки параметров. Особое внимание уделяется применению модели на основе состояния в финансах, в частности, для декомпозиции объема внутридневной торговли.

Различные варианты фильтра Калмана, такие как расширенный фильтр Калмана и фильтр Калмана без запаха, упоминаются как решения для обработки нелинейной функциональности и шума. Фильтры частиц вводятся как вычислительный метод для сложных моделей, которые не могут быть решены аналитически.

Видео завершается обсуждением ограничений аналитических решений и необходимости вычислительных методов, таких как методы Монте-Карло. Докладчик признает сложный характер этих процессов, но подчеркивает интересные аспекты фильтрации Калмана.

В целом, видео обеспечивает углубленное изучение моделей на основе состояний, фильтра Калмана и их приложений в финансах. Он охватывает основные концепции, алгоритмические шаги и практические соображения, а также упоминает расширенные варианты и вычислительные методы. Докладчик подчеркивает актуальность и силу государственных моделей в раскрытии скрытой информации и подчеркивает непрерывный прогресс в этой области.

  • 00:00:00 Ведущий видео знакомит с концепцией моделей на основе состояний на простом примере автомобиля, движущегося вдоль оси со скрытыми позициями, обозначенными как «ось Z». Скрытые состояния, обозначенные как «jt» во времени t, неизвестны наблюдателю, как и на фондовом рынке, где состояние рынка скрыто. Докладчик описывает две модели, связанные с моделями на основе состояний, общий фильтр и обычное сглаживание, а также способы автоматического изучения параметров в модели на основе состояний. Наконец, в видео обсуждается применение государственных моделей в финансах. Вводятся уравнение состояния и уравнение наблюдения, где состояние зависит только от предыдущего узла, а каждое наблюдение зависит от соответствующих скрытых состояний.

  • 00:05:00 Докладчик объясняет модели на основе состояний и то, как они состоят из матриц перехода и наблюдения, которые отображают состояние в наблюдаемое пространство, которое может быть различным. Состояние и наблюдение могут быть векторами с несколькими состояниями или датчиками, записывающими положение одновременно, что позволяет использовать более общую форму. Скрытое состояние следует марковскому свойству, которое приводит к элегантной форме вероятности. Докладчик разъясняет концепции прогнозирования, фильтрации и сглаживания, а также то, как они объединяются для создания прямого алгоритма в фильтре Калмана. Фильтр Калмана состоит из двух компонентов: предсказания и исправления, и он был впервые разработан Калманом и использован в проекте «Аполлон» для отслеживания космических кораблей. В настоящее время он широко используется во многих областях, включая прогнозирование временных рядов в финансах.

  • 00:10:00 Представлен алгоритм фильтрации Калмана и обсуждается его применение в финансах. Алгоритм включает в себя прогнозирование состояния системы на основе предыдущих наблюдений, а затем корректировку прогноза с использованием текущих наблюдений. Неопределенность прогноза представлена дисперсией функции Гаусса, а коррекция выполняется путем умножения распределения Гаусса прогноза и наблюдения. Подчеркивается важность общего выигрыша, который определяет вес между предсказанием и наблюдением. Показано, что алгоритм довольно прост и включает всего несколько строк кода.

  • 00:15:00 Лектор обсуждает эксперимент, в котором надежность GPS и одометра сравнивались в уравнении состояния. Результаты показали, что подход с фильтром Калмана успешно предсказывал местонахождение автомобиля, даже когда GPS не был надежным на определенных участках пути. Лектор также обсудил плюсы и минусы фильтра Калмана и отметил его вычислительную эффективность и тот факт, что он широко используется в приложениях реального времени. Однако одним из его ограничений является то, что он предназначен для линейных стабилизированных по Гауссу моделей. Лектор также кратко рассказал о Common Smoother и его использовании при анализе исторических данных.

  • 00:20:00 Представлена работа обычного сглаживателя в финансах на примере автомобиля, проезжающего через туннель. Общий сглаживатель обеспечивает гораздо более плавную работу, чем обычный фильтр, и решает проблему нисходящего тренда фильтра, обеспечивая лучшее приближение. Перед запуском общего сглаживателя необходимо реализовать функцию прямого общего фильтра. В этом разделе также рассматривается концепция параметров в финансах, необходимость их обучения и то, как они могут изменяться во времени. Вводится теория обучения, включая оценку максимального правдоподобия и алгоритм максимизации ожидания для нахождения параметров, когда скрытые состояния неизвестны. Алгоритм EM состоит из двух шагов, шага ожидания и шага максимизации, для вычисления апостериорных распределений скрытых состояний и ожидаемого значения предположения.

  • 00:25:00 Спикер обсуждает алгоритм EM и то, как его можно использовать для изучения параметров финансовой модели на основе состояния. Алгоритм состоит из двух шагов: E-этапа, где вычисляется апостериорная вероятность с использованием общего фильтра и сглаживателя, и M-этапа, где целевая функция максимизируется для нахождения новых параметров оценки. Параметры непрерывно зацикливаются и оптимизируются, пока не сойдутся. Спикер также объясняет, как эта модель может быть применена к финансам, в частности, в отношении декомпозиции объема внутридневной торговли, где с помощью модели разделяются ежедневные и периодические компоненты. Спикер отмечает, что реализовать модель несложно, используя существующие пакеты, такие как метки в R.

  • 00:30:00 Спикер обсуждает модель состояния, используемую в финансах, которая состоит из скрытого состояния с ежедневными и периодическими компонентами, и модели наблюдения, которая объединяет ежедневные и периодические условия для формирования объема торгов. Модель анализируется с использованием фильтра Калмана и сглаживания, а алгоритм EM используется для эффективного изучения параметров. Модель также можно использовать для прогнозирования временных рядов, предсказывая будущий дневной срок и сохраняя сезонный срок неизменным. Модель на основе состояния полезна для поиска скрытой информации, а также может применяться к другим финансовым приложениям.

  • 00:35:00 Спикер обсуждает силу моделей на основе состояний и то, как они могут выявить скрытую информацию в наблюдениях. Фильтр Калмана — универсальный и полезный метод, который можно применять практически в любой области, включая финансы. В то время как фильтр Калмана предназначен для более простых случаев, другие варианты могут использоваться для более сложных моделей. Расширенный фильтр Калмана и фильтр Калмана без запаха — два примера вариантов, которые могут обрабатывать нелинейную функциональность и шум. Кроме того, фильтры частиц используются, когда модель слишком сложна для аналитических решений. Хотя фильтр Калмана был разработан в 1960-х годах, он остается оптимальным решением для модели на основе состояний в очень конкретном случае с линейными функциями перехода и гауссовским шумом.

  • 00:40:00 Докладчик обсуждает ограничения аналитического решения интегралов и необходимость тяжелых вычислительных методов, таких как методы Монте-Карло, для определенных задач, таких как фильтрация частиц. Он отмечает, что это было невозможно в прошлом, но теперь это возможно благодаря нынешнему состоянию технологий. Спикер также упоминает, что, хотя это сложный процесс, это увлекательная тема, имея в виду фильтрацию Калмана.
 

«Экономия альфа: использование ансамблевого обучения для оживления усталых альфа-факторов» Макса Маржено


«Экономия альфа: использование ансамблевого обучения для оживления усталых альфа-факторов» Макса Маржено

В видео под названием «Thrifting Alpha: использование ансамблевого обучения для улучшения альфа-факторов» Макс Маргенот, специалист по данным из Quantopian, делится своими мыслями об использовании ансамблевого обучения для повышения эффективности альфа-факторов. Марженот подчеркивает важность построения портфеля путем объединения независимых сигналов, что приводит к улучшенным и новым результатам. Он вводит концепцию факторного моделирования, рассматривает сложности оценки производительности модели и исследует творческое использование ансамблевого обучения для эффективного распределения активов.

Марженот начинает с введения концепции «бережливой альфы», целью которой является оживление утомленных альфа-факторов с помощью ансамблевого обучения. Альфа-факторы представляют собой уникальные и интересные доходы в финансах, отличающие их от факторов риска, таких как рыночные доходы. Цель состоит в том, чтобы создать портфель путем объединения независимых сигналов для получения новых и улучшенных результатов. Он также представляет краткий обзор модели ценообразования капитальных активов и объясняет, как Quantopian служит бесплатной платформой для количественных исследований.

Факторное моделирование является ключевым направлением презентации Маржено. Он подчеркивает, как доходность портфеля состоит из рыночной доходности и дополнительных необъяснимых факторов. Включая классические факторы, такие как малый-большой (маленькая рыночная капитализация по сравнению с фирмами с большой рыночной капитализацией) и соотношение «высокий минус низкий» для балансовой стоимости и цены, модель может оценивать рыночный риск и расширять свой анализ на другие потоки доходности. Цели факторного моделирования включают диверсификацию некоррелированных сигналов, снижение общей волатильности портфеля и увеличение доходности.

Спикер обсуждает растущую популярность факторного моделирования в процессах построения портфеля, ссылаясь на опрос Blackrock, который показывает, что 87% институциональных инвесторов включают факторы в свои инвестиционные стратегии. Марженот выделяет пять основных типов факторов, вокруг которых вращаются портфели: стоимость, импульс, качество, волатильность и рост. Он также объясняет концепцию длинного/короткого капитала, когда позиции открываются как по длинным, так и по коротким позициям на основе значений факторов. Цель состоит в том, чтобы использовать эти риски для создания хорошо сбалансированного портфеля.

Марженот углубляется во вселенную, в которой применяется алгоритм, подчеркивая важность согласования статистической модели с выполнением сделок. Если сделки не могут быть выполнены из-за ограничений, таких как ограничения коротких позиций, мандат стратегии нарушается. Марженот предпочитает стратегии, нейтральные к доллару, которые в конечном итоге становятся нейтральными для рынка. Он создает портфели, в которых важны только самые высокие и самые низкие значения, стремясь получить максимальную ожидаемую доходность. Объединение нескольких факторов предполагает составление комбинированного ранга, что обеспечивает гибкость портфеля.

Как объясняет Марженот, оценка эффективности модели и работа с необъяснимыми доходами сопряжены с трудностями. Он обсуждает важность надежной вселенной с достаточной ликвидностью и представляет вселенную Q 1500, предназначенную для фильтрации нежелательных элементов. Вместо того, чтобы предсказывать цены, Марженот подчеркивает важность понимания того, какие акции лучше других, и определения относительной стоимости. Он демонстрирует использование конвейерного API в их рамках для вычисления импульса, приводя примеры векторных вычислений.

Спикер фокусируется на создании импульсного фактора, учитывающего как долгосрочные, так и краткосрочные тренды. Margenot стандартизирует доходность и наказывает долгосрочный аспект, чтобы снизить риск краткосрочных разворотов. Он использует пакет под названием Alpha Ones для оценки сигнала в разных временных масштабах и строит портфель, используя фактор импульса. Маржено подчеркивает важность определения разумной временной шкалы и обсуждает факторы, с которыми он работает. Он освещает рабочий процесс определения вселенной, альфа-факторов и объединения альфа-каналов для построения длинного/короткого портфеля акций.

Марженот обсуждает комбинацию различных альфа-факторов и структуру их портфеля, подчеркивая, что комбинация независимых сигналов в идеале должна приводить к более сильному общему сигналу. Он представляет методы динамического и статического агрегирования для объединения факторов и построения портфеля. Статическая агрегация включает портфель различных факторов с равным весом, тогда как динамическая агрегация корректирует веса факторов в зависимости от их эффективности. Стандартизация факторов необходима для обеспечения сопоставимости каждого отдельного фактора.

Ансамблевое обучение — ключевая тема, которую обсуждает Маржено. Он объясняет, что поиск постоянно повышающегося алгоритма обучения может быть сложной задачей, поскольку он должен выходить за рамки простой бета-версии. Чтобы преодолеть это ограничение, он использует ансамблевое обучение для агрегирования нескольких отдельных сигналов. Margenot специально использует AdaBoost, хорошо известную технику ансамблевого обучения, для обучения деревьев решений на основе шести признаков. Эти деревья решений предсказывают, пойдет ли актив вверх или вниз, а окончательный прогноз определяется большинством результатов тысячи деревьев решений. Такой подход позволяет делать более точные и надежные прогнозы.

Марженот далее развивает оценку альфа-сигнала, оживляя утомленные альфа-факторы с помощью ансамблевого обучения. Он тренирует деревья решений в течение месяца и пытается предсказать доходность или то, будет ли рынок расти или падать в будущем. Агрегируя производительность классификаторов, он извлекает важность признаков из взвешенной суммы деревьев решений и оценивает альфа-линзу сигнала. Тем не менее, Марженот признает необходимость включения комиссий и проскальзывания в процесс оценки, поскольку они могут существенно повлиять на окончательные результаты.

Включение комиссий и проскальзываний в алгоритмы является важным аспектом, на который обращает внимание Маржено. Он подчеркивает, что для обеспечения жизнеспособности сигналов следует учитывать реальные торговые издержки. Он демонстрирует потенциальную отрицательную доходность и просадки в бэктестере из-за ограниченного окна обучения для классификатора машинного обучения и высокой текучести кадров. Марженот предлагает изучить альтернативные методы ансамблевого обучения или реализации платформы, чтобы потенциально повысить производительность в будущем. Он также упоминает инструменты, которые он использовал для альфа-факторного анализа и анализа портфеля.

На протяжении всего видео Марженот представляет различные инструменты и ресурсы, которые могут помочь в реализации методов ансамблевого обучения. Он рекомендует проверить механизм обратного тестирования zipline и использовать платформу Quantiopian, которая предоставляет к нему доступ. Маргенот предлагает использовать Scikit-learn и пакет Ensembles, которые полезны для машинного обучения, статистики и классификаторов. Он также упоминает, что делится лекциями, алгоритмами и шаблонными решениями на своем GitHub, предоставляя бесплатный доступ к своему опыту ученым и трейдерам.

Ближе к концу презентации Марженот обсуждает процесс обновления существующих альфа-факторов с помощью ансамблевого обучения. Он подчеркивает, что даже если альфа-фактор изначально не дает положительных результатов, его можно улучшить. Он подчеркивает важность пайплайна для определения вычислений и объясняет, как компоненты обучения на исторических данных позволяют прогнозировать движения рынка на 20 дней вперед. В то время как перекрестная проверка может быть сложной для исторических данных, Марженот предлагает обучение вперед и прогнозирование следующего набора данных в качестве обходного пути.

В заключение Марженот обсуждает практические аспекты реализации ансамблевого обучения для улучшения альфа-факторов. Он советует тренировать ансамблевый классификатор в течение более длительного периода, а также прогнозировать в течение более длительного периода. Он предлагает использовать схему взвешивания факторов и другие ограничения для распределения ресурсов между различными стратегиями. Марженот выступает за обучение единой модели на всех интерпретаторах конвейера, рассматривая каждый фактор как часть единой модели. Он также с юмором упоминает о возможности того, что факторы действуют противоположно своему назначению, добавляя отрицательный знак, подчеркивая, что это происходит редко.

Таким образом, видео Макса Марженота дает ценную информацию о области ансамблевого обучения и его применении для улучшения альфа-факторов. Комбинируя независимые сигналы и используя методы ансамблевого обучения, специалисты по данным и трейдеры могут оптимизировать свои инвестиционные стратегии с помощью передовых подходов к машинному обучению. Практические советы, демонстрации и рекомендуемые инструменты Маргенота служат руководством для тех, кто хочет использовать ансамблевое обучение для более точного и прибыльного принятия решений в торговых стратегиях.

  • 00:00:00 В этом разделе Макс Маргенот, специалист по данным из Quantopian, представляет концепцию «дрейфующего альфа», цель которой — оживить усталые альфа-факторы с помощью ансамблевого обучения. Он объясняет, что альфа-факторы относятся к новым и интересным доходам в финансах, в то время как факторы риска — это обычные доходы, с которыми все знакомы, например, рынок. Цель состоит в том, чтобы создать портфель, комбинируя независимые сигналы, чтобы получить что-то новое и лучшие результаты. Он также кратко объясняет Модель ценообразования капитальных активов и то, как Quantopian работает как бесплатная платформа для количественных исследований.

  • 00:05:00 В этом разделе спикер представляет идею факторной модели, которая пытается понять риски портфеля. Спикер объясняет, что доходность портфеля состоит из доходности рынка и чего-то еще нового и необъяснимого. Классические факторы, добавляемые к факторной модели, включают малый-большой, который относится к фирмам с небольшой рыночной капитализацией по сравнению с фирмами с большой рыночной капитализацией, а также высокий минус низкий для отношения балансовой стоимости к цене. Оценивая рыночный риск и добавляя дополнительные факторы, можно расширить модель и посмотреть на подверженность риску других потоков прибыли. В конечном счете, диверсификация некоррелированных сигналов, снижение волатильности всего портфеля и увеличение доходности являются целями факторного моделирования.

  • 00:10:00 В этом разделе спикер обсуждает, как факторное моделирование становится все более распространенным в процессах построения портфеля. Согласно опросу Blackrock, 87% институциональных инвесторов включают факторы в свой инвестиционный процесс. Пять основных типов факторов, вокруг которых вращаются портфели, — это стоимость, импульс, качество, волатильность и рост. Спикер также говорит о длинных/коротких активах, что включает в себя открытие длинных позиций по некоторым акциям и коротких позиций по другим с использованием значения фактора, чтобы определить, где они будут открывать длинные или короткие позиции. В конечном счете, цель состоит в том, чтобы использовать эти риски для создания портфеля.

  • 00:15:00 В этом разделе Макс Марженот обсуждает вселенную, в которой применяется алгоритм. Алгоритм применяет статистическую модель и совершает сделки в соответствии с моделью. Если сделки не могут быть совершены из-за ограничений, например, из-за невозможности открывать короткие позиции, то мандат стратегии нарушается. Марженот предпочитает стратегии, нейтральные к доллару, которые обычно оказываются нейтральными по отношению к рынку, и строит портфели, в которых только самые высокие и самые низкие значения имеют значение для получения самой высокой ожидаемой прибыли. Объединение нескольких факторов включает в себя состав комбинированного ранга, который включает в себя много места для маневра, и именно поэтому он определяет его именно таким образом.

  • 00:20:00 В этом разделе спикер обсуждает проблемы оценки эффективности модели и то, как необъяснимые доходы могут быть более пугающими, чем объяснимые потери или просадки. Он говорит о важности наличия надежной вселенной с достаточной ликвидностью и о том, как они создали вселенную Q 1500 для фильтрации нежелательных элементов. Спикер также объясняет, насколько сложным является расчет цен, и вместо того, чтобы прогнозировать цены, он сосредотачивается на том, чтобы понять, какие акции лучше других. Затем он объясняет понятие относительной стоимости и то, что ее получение более важно, чем пребывание на растущем или падающем рынке. Наконец, он определяет пример вектора и то, как он использует API конвейера в своей структуре для вычисления импульса.

  • 00:25:00 В этом разделе видео Макс Марженот обсуждает свой подход к созданию импульсного фактора, учитывающего как долгосрочные, так и краткосрочные тренды. Он стандартизирует доходность и наказывает долгосрочный аспект, чтобы снизить риск краткосрочного разворота. Он использует пакет под названием Alpha Ones для оценки сигнала в различных временных масштабах и в конечном итоге строит портфель, используя импульсный фактор. Марженот объясняет важность выбора разумного временного масштаба и обсуждает факторы, с которыми он работает. Он также подчеркивает рабочий процесс определения вселенной, альфа-факторов и комбинирования альфа-каналов для построения длинного/короткого портфеля акций.

  • 00:30:00 В этом разделе Макс Марженот обсуждает комбинацию различных альфа-факторов и структуру их портфеля, отмечая, что комбинация независимых сигналов в идеале приводит к более сильному общему сигналу. Он представляет методы динамического и статического агрегирования для объединения факторов и построения портфеля, при этом статическое агрегирование представляет собой портфель различных факторов с одинаковым весом, а динамическое агрегирование включает изменение весов факторов в зависимости от их эффективности. Кроме того, он подчеркивает важность стандартизации факторов для обеспечения их сопоставимости в рамках каждого отдельного фактора.

  • 00:35:00 В этом разделе видео Макс Марженот рассказывает об ансамблевом обучении и о том, как его можно использовать для творческого распределения между сконструированными активами. Он объясняет, что трудно придумать хороший алгоритм обучения, который постоянно совершенствуется по-новому, а не только в бета-версии. Чтобы преодолеть это ограничение, он использует ансамблевое обучение для объединения множества различных отдельных сигналов. Он использует AdaBoost, старый фаворит в ансамблевом обучении, для обучения деревьев решений на основе своих шести функций, предсказывая, пойдет ли что-то вверх или вниз. Затем он выбирает выигрышную комбинацию из тысячи различных деревьев решений и вычисляет синус этого результата, голосуя «за» или «против» на основе большинства результатов.

  • 00:40:00 В этом разделе Макс Марженот обсуждает, как оценить альфа-сигнал с помощью ансамблевого обучения, чтобы оживить усталые альфа-факторы. Он обучает деревья решений в течение месяца и пытается предсказать доходность или то, будет ли он выше или ниже на месяц вперед, полагаясь на совокупную производительность классификаторов. Затем он извлекает важность признаков из взвешенной суммы деревьев решений и оценивает альфа-линзу сигнала. В то время как значение adaboost с высокой вероятностью приведет к высокой доходности, он признает необходимость превратить это в что-то вроде альфа-линзы де Бо, которая включает комиссии и проскальзывание.

  • 00:45:00 В этом разделе видео ведущий обсуждает важность включения комиссии и проскальзывания в алгоритмы, чтобы гарантировать, что сигналы остаются хорошими постфактум. Затем он показывает отрицательную доходность и просадки в бэктестере из-за ограниченного окна обучения для классификатора машинного обучения и высокой текучести кадров. Докладчик предполагает, что использование другого метода ансамблевого обучения или реализации платформы может привести к повышению производительности в будущем. Наконец, он перечисляет инструменты, которые он использовал для альфа-факторного анализа и анализа портфеля.

  • 00:50:00 В этом разделе Макс Марженот рассказывает об использовании Pi-elle и Cool для расчета намерений, стоящих за сделкой алгоритма, и о том, как это может помочь выполнить это намерение к моменту закрытия позиции. Он рекомендует проверить механизм обратного тестирования zipline и использовать платформу Quantiopian для доступа к нему. Он также предлагает использовать пакет Scikit-learn и Ensembles, который отлично подходит для машинного обучения, статистики и классификаторов. Макс Маргенот является лектором в Quantopian и предоставляет бесплатный доступ к своим лекциям, алгоритмам и шаблонным решениям на своем GitHub.

  • 00:55:00 В этом разделе Макс Марженот, количественный исследователь, обсуждает свой процесс использования ансамблевого обучения для обновления существующих альфа-факторов. Он объясняет, что даже если альфа-фактор изначально не сработал, его все же можно использовать и улучшать. Он также затрагивает важность конвейера в процессе определения вычислений и то, как, обучая необходимые компоненты на исторических данных, можно предсказывать повышение или понижение на 20 дней вперед. Тем не менее, Марженот отмечает, что перекрестную проверку сложно реализовать при работе с историческими данными, но его метод заключается в обучении и прогнозировании следующего набора данных.

  • 01:00:00 В этом разделе Макс Марженот рассказывает об использовании ансамблевого обучения для улучшения альфа-факторов. Он объясняет, что каждый раз, когда он тренирует классификатор ансамбля, весовые коэффициенты, присвоенные каждому фактору, различаются в зависимости от показателей за последний месяц. Он предлагает тренироваться в течение более длительного периода и прогнозировать в течение более длительного периода. Он также предлагает использовать схему взвешивания факторов и другие ограничения для распределения между различными стратегиями. Маржено также говорит об обучении одной модели на всех интерпретаторах конвейера для всех факторов, вместо того чтобы рассматривать каждый фактор как отдельную модель. Он шутит о возможности того, что факторы делают противоположное тому, что они должны делать, когда добавляется отрицательный знак, и объясняет, что этого никогда не происходит.

  • 01:05:00 В этом разделе спикер обсуждает свой процесс ребалансировки, который происходит раз в месяц, так как он считает, что он более соответствует их исследовательскому процессу. Они также признают, что зашумленные данные могут влиять на их прогнозы, поскольку они получают преимущество только в 1% в данном обучающем наборе. Спикер также обдумывает идею добавить в свою модель функцию «вверх» или «вниз», но считает, что это требует больше усилий, чем того стоит. Они кратко обсуждают использование нейронных сетей, признавая их возможности, но также заявляя, что предпочитают более интерпретируемые методы, которые они используют в настоящее время. Наконец, спикер заканчивает обсуждением важности использования машинного обучения в качестве инструмента для классификации или регрессии, а не для обнаружения.

  • 01:10:00 В этом разделе видео спикер обсуждает полезность использования adaboost для обработки выбросов при работе с большим количеством разрозненных вещей. Спикер также упоминает использование ансамблевого обучения для прогнозирования вещей с высокой и низкой отдачей, не разбивая их на какие-либо корзины до тех пор, пока прогноз не будет сделан. Они упоминают вариант использования третьей вещи для предсказания. Тем не менее, они предлагают начать с двух вещей, чтобы избежать многого другого.
 

MIT 18.S096 Темы по математике с приложениями в финансах - 1. Введение, финансовые термины и концепции



1. Введение, финансовые термины и понятия

В этом информативном видео зрители знакомятся с различными финансовыми терминами и концепциями, чтобы заложить прочную основу в финансах. Курс предназначен как для студентов, так и для аспирантов, которые заинтересованы в карьере в этой области. Он направлен на введение в современные финансы и оснащение студентов необходимыми знаниями.

Лектор начинает с углубления в историю финансовых терминов и понятий, проливая свет на такие важные термины, как вега, каппа и волатильность. Вега объясняется как мера чувствительности к волатильности, в то время как Каппа измеряет волатильность изменений цен с течением времени. Лектор подчеркивает, что за последние три десятилетия сфера финансов претерпела заметные изменения, вызванные интеграцией количественных методов.

В видео также рассматривается эволюция профессии трейдера и изменения, произошедшие в ней за последние 30 лет. Он затрагивает различные торговые продукты, доступные на рынке, и то, как они торгуются. Затем лектор углубляется в причины финансового кризиса 2008 года, связывая его с дерегулированием банковского сектора, что позволило инвестиционным банкам предлагать инвесторам комплексные продукты.

Подчеркивается значение финансовых рынков, поскольку они играют решающую роль в установлении связей между кредиторами и заемщиками, а также предоставляют инвесторам возможности для получения более высокой прибыли от своих инвестиций. В видео рассказывается о различных игроках на финансовых рынках, включая банки, дилеров, взаимные фонды, страховые компании, пенсионные фонды и хедж-фонды.

На протяжении всего видео подробно обсуждаются различные финансовые термины и концепции. Объясняется хеджирование, создание рынка и собственная торговля, а также вводятся такие термины, как бета и альфа. Бета описывается как разница в доходности между двумя активами, а альфа представляет собой разницу в доходности между акцией и индексом S&P 500. Лектор также затрагивает управление портфелем в отношении альфа и бета.

Видео дает представление о различных типах сделок и о том, как они выполняются. Это объясняет роль хеджирования и создания рынка в защите инвесторов. Кроме того, в видео участвует г-н Уайт, который подробно описывает финансовые термины и концепции, используемые на рынках. Дельта, гамма и тета обсуждаются в контексте торговли акциями, и подчеркивается важность понимания подверженности волатильности, требований к капиталу и балансовых рисков. Г-н Уайт также исследует различные методы, используемые для анализа акций, включая фундаментальный анализ и арбитраж.

В видео упоминается изменение политики Федеральной резервной системы по сокращению количественного смягчения, что вызвало осторожность среди инвесторов и привело к распродаже на фондовом рынке. В нем подчеркивается сложный характер ценообразования финансовых инструментов и управления рисками с использованием математических моделей. Лектор подчеркивает необходимость постоянного обновления торговых стратегий в связи с динамичным характером рынка.

Концепция риска и вознаграждения тщательно изучена, и видео демонстрирует, как поведение человека иногда может привести к неожиданным результатам при принятии финансовых решений. Представлен пример, когда аудитории дается два варианта с разными вероятностями и потенциальными выигрышами или потерями, подчеркивая различные предпочтения, которые могут иметь люди.

В конце видео зрителям предлагается записаться на будущие занятия, а также предлагаются дополнительные домашние задания, связанные с составлением списка финансовых концепций. Это подробное видео служит отличным вводным руководством по финансовым терминам и понятиям, обеспечивая надежную отправную точку для тех, кто интересуется сферой финансов.

  • 00:00:00 Это видео знакомит с финансовыми понятиями, терминами и формулами, а также знакомит с современными финансами. Класс открыт для студентов бакалавриата, и аспиранты приветствуются. Цель состоит в том, чтобы обеспечить основу для студентов, которые хотят продолжить карьеру в области финансов.

  • 00:05:00 В этой лекции обсуждается история финансовых терминов и понятий, в том числе вега, каппа и волатильность. Вега — это мера чувствительности книги или портфеля к волатильности, а Каппа — это мера того, насколько волатильна цена может меняться с течением времени. В лекции также отмечается, что финансы не всегда были профессией, связанной с количественными данными, и что за последние 30 лет в этой области произошла трансформация из-за внедрения количественных методов.

  • 00:10:00 В этом видео рассказывается о финансовой индустрии, в том числе о том, как изменилась профессия трейдера за последние 30 лет. Он также охватывает различные формы торговли продуктами и то, как они торгуются.

  • 00:15:00 Финансовый кризис 2008 года во многом был вызван дерегулированием банковского сектора, что облегчило инвестиционным банкам предложение комплексных продуктов инвесторам.

  • 00:20:00 Финансовые рынки необходимы для преодоления разрыва между кредиторами и заемщиками, а также для помощи инвесторам в получении более высокой прибыли или доходов от своих инвестиций. На рынках есть разные типы игроков, включая банки, дилеров, взаимные фонды, страховые компании, пенсионные фонды и хедж-фонды.

  • 00:25:00 В этом видео обсуждаются финансовые термины и концепции, в том числе хеджирование, создание рынка и собственная торговля. Бета объясняется как разница в доходности между двумя активами, альфа — это разница в доходности между акцией и индексом S&P 500, а управление портфелем обсуждается в отношении альфы и бета.

  • 00:30:00 В этом видео объясняется, как выполняются различные типы сделок и как хеджирование и создание рынка могут помочь защитить инвесторов.

  • 00:35:00 В этом видео г-н Уайт объясняет различные финансовые термины и концепции, используемые на рынках. Дельта, гамма и тета — важные понятия, которые необходимо понимать при торговле акциями. Также обсуждаются подверженность волатильности, требования к капиталу и балансовые риски. Наконец, г-н Уайт объясняет различные методы, используемые для анализа акций, включая фундаментальный анализ и арбитраж.

  • 00:40:00 Изменение политики Федеральной резервной системы относится к плану по сокращению количественного смягчения, которое они проводят. Это привело к распродаже фондового рынка, поскольку инвесторы стали более осторожными в отношении будущего. Математические модели используются для оценки финансовых инструментов и управления рисками, что является сложной задачей. Кроме того, торговые стратегии должны постоянно обновляться из-за быстроразвивающегося характера рынка.

  • 00:45:00 Ведущий обсуждает понятия риска и вознаграждения и показывает, как поведение человека может привести к неожиданным результатам при принятии финансовых решений. Затем он представляет два варианта — один с вероятностью 80 % проиграть деньги и один со 100 % вероятностью выигрыша — и спрашивает аудиторию, что бы они выбрали. Большая часть аудитории выбирает вариант с более высоким ожидаемым значением, но меньшинство выбирает вариант б, который имеет меньшие шансы на выигрыш, но может потерять больше денег.

  • 00:50:00 В видео обсуждаются финансовые термины и концепции, а также приводится пример того, как люди могут учиться на собственном опыте. Видео также предлагает дополнительное домашнее задание по составлению списка финансовых концепций.

  • 00:55:00 В этом видео представлены финансовые термины и концепции, в том числе концепции деривативов, методов Монте-Карло и электронной торговли. Джейк приводит два примера проектов, над которыми он работал, один из которых связан с оценкой зашумленной производной функции, а другой — с более точным прогнозированием курсов валют.

  • 01:00:00 Это видео знакомит с финансовыми терминами и понятиями и предлагает зрителям записаться на следующий курс.
 

2. Линейная алгебра



2. Линейная алгебра

Видео широко охватывает линейную алгебру, уделяя особое внимание матрицам, собственным значениям и собственным векторам. Это объясняет, что собственные значения и собственные векторы — это специальные векторы, которые подвергаются масштабированию при применении линейного преобразования. Каждая матрица размера n на n имеет по крайней мере один собственный вектор, и с помощью ортонормированной матрицы становится возможным разбить матрицу на направления, упрощая понимание линейных преобразований. Видео также представляет декомпозицию по сингулярным значениям (SVD) как еще один инструмент для понимания матриц, особенно для более общего класса матриц. SVD позволяет представить матрицу как произведение ортонормированных матриц и диагональной матрицы, что экономит место для матриц более низкого ранга. Кроме того, в видео подчеркивается важность собственных векторов для измерения корреляции данных и определения новой ортогональной системы координат без изменения самих данных.

В дополнение к вышеупомянутым понятиям, видео углубляется в две важные теоремы линейной алгебры. Во-первых, это теорема Перрона-Фробениуса, которая утверждает, что несимметричная матрица обладает уникальным собственным значением с наибольшим абсолютным значением, а также соответствующим собственным вектором с положительными элементами. Эта теорема имеет практическое применение в различных областях. Вторая обсуждаемая теорема - это разложение по сингулярным значениям (SVD), которое позволяет поворачивать данные в новую ориентацию, представленную ортонормированными основаниями. SVD применим к более широкому диапазону матриц и позволяет упростить за счет исключения ненужных столбцов и строк, особенно в матрицах со значительно более низким рангом по сравнению с количеством столбцов и строк.

Видео содержит подробные объяснения, примеры и доказательства этих концепций, подчеркивая их актуальность в различных областях техники и науки. Это побуждает зрителей понимать основные принципы и взаимодействовать с материалом.

  • 00:00:00 В этом разделе профессор начинает с обзора линейной алгебры, предполагая, что зрители уже прошли курс по ней ранее. Он адаптирует конспекты лекций, чтобы они были обзором для тех, кто прошел самый базовый курс линейной алгебры. Лекция в основном посвящена матрицам и их значению. Профессор объясняет, что матрица — это набор чисел, которые можно использовать для упорядочивания данных, таких как цены на акции. Матрица также является оператором, определяющим линейное преобразование из n-мерного векторного пространства в m-мерное векторное пространство. Профессор также вводит понятие собственных значений и собственных векторов и обсуждает, как их можно применять к наборам данных для получения важных свойств и величин.

  • 00:05:00 В этом разделе видео на YouTube объясняет концепцию собственных значений и собственных векторов и их важность для линейной алгебры. Он определяется как действительное число и вектор, которые удовлетворяют условию A, умноженное на v, равно лямбда, умноженному на V, и v является собственным вектором, соответствующим лямбда. Определитель (A-лямбда I) равен 0, если A-лямбда I не имеет полного ранга, а det(A-лямбда I) является многочленом степени n для квадратных матриц. В видео также подчеркивается, что всегда существует по крайней мере одно собственное значение и собственный вектор, а геометрический смысл этого понятия объясняется с точки зрения линейного преобразования, где A берет вектор в R ^ 3 и преобразует его в другой вектор в R ^ 3.

  • 00:10:00 В этом разделе видео понятие собственных значений и собственных векторов представлено как специальные векторы, которые при применении линейного преобразования просто масштабируются на некоторую величину, известную как лямбда. Установлено, что каждая матрица размера n на n имеет по крайней мере один собственный вектор, и ортонормированную матрицу можно использовать для разбиения матрицы на направления, что упрощает понимание линейного преобразования. Наконец, объясняется, что матрицы, которые можно разбить на эти направления, являются наиболее важными в линейной алгебре, и эти направления определяются матрицей U, а D определяет, насколько она будет масштабироваться.

  • 00:15:00 В этом разделе вводится понятие диагонализируемых матриц. Хотя не все матрицы можно диагонализовать, существует особый класс матриц, который всегда диагонализируем, и большинство матриц, которые будут изучаться в курсе, попадают в эту категорию. Матрица считается диагонализируемой, если она разбивается на n направлений, и это особенно верно для симметричных матриц, которые имеют действительные собственные значения и всегда диагонализируемы. Обсуждается теорема 2, доказывающая диагонализуемость симметричных матриц.

  • 00:20:00 В этом разделе спикер объясняет, как диагонализовать симметричные матрицы, которые включают собственные значения и собственные векторы. Затем докладчик подчеркивает важность запоминания теорем 1 и 2 для вещественных симметричных матриц. Хотя диагонализация возможна для симметричных матриц, она не всегда возможна для матриц общего вида. Поэтому спикер представляет альтернативный инструмент, который можно использовать для всех матриц для извлечения важной информации с помощью простых операций, таких как масштабирование.

  • 00:25:00 В этом разделе спикер представляет разложение по сингулярным числам как второй инструмент понимания матриц, который похож на диагонализацию, но имеет немного другую форму. Теорема утверждает, что для любой матрицы m на n всегда существуют две ортонормированные матрицы, U и V, и диагональная матрица, сигма, такие, что матрица может быть разложена как преобразование U, умноженное на сигму, умноженное на V. Докладчик объясняет, что это работает для всех общих матриц размера m на n, тогда как разложение по собственным значениям работает только для диагонализируемых матриц размера n на n. Кроме того, спикер упоминает, что SVD дает фрейм векторов, для которого A действует как оператор масштабирования, а пространства для векторов отличаются друг от друга.

  • 00:30:00 В этом разделе спикер обсуждает диагонализацию и разложение по собственным значениям, а также то, как они работают в соответствующих кадрах. Они сравнивают его с разложением по сингулярным числам, которое применимо к более общему классу матриц. Они также касаются доказательства разложения по сингулярным числам, основанного на разложении по собственным значениям. Докладчик подчеркивает важность и повсеместность обеих форм декомпозиции во многих областях техники и науки и призывает зрителей попытаться представить и понять концепции, лежащие в основе теории.

  • 00:35:00 В этом разделе видео объясняется концепция собственных значений и собственных векторов. Предполагая, что все собственные значения, кроме первых r, равны нулю, собственные значения переписываются как sigma_1 ^ 2, sigma_2 ^ 2, sigma_r ^ 2 и 0. Затем собственные векторы определяются как u_1, u_2 до u_r, где u_i вычисляется как деление A, умноженное на v_i, на соответствующее собственное значение sigma_i. При этом определяется матрица U, состоящая из u_1 до u_n, а матрица V определяется как v_1 до v_r и v_r+1 до v_n. Умножение этих матриц приводит к диагональной матрице, где первые r диагональных элементов равны от sigma_1 до sigma_r, а остальные элементы равны нулю.

  • 00:40:00 В этом разделе спикер представляет учебник по линейной алгебре и объясняет, как определить матрицы U и V, применяя A, умноженное на V/сигма (где A — A, умноженное на A). Затем диагональ матрицы заполняется сигма-значениями, а столбцы определяются скалярным произведением U, транспонированного с лямбда-значениями, и V. Докладчик также обращает внимание на ошибку в вычислениях, исправляя ее и показывая простоту процесса.

  • 00:45:00 В этом разделе профессор учит, как найти сингулярное разложение матрицы, что может быть мощным инструментом. Чтобы получить разложение по сингулярным числам, вам нужно найти собственные значения и собственные векторы матрицы и правильно их расположить. Хотя это может быть немного громоздко делать вручную, это полезное упражнение. Есть также более эффективные способы вычисления этого на компьютере, если это необходимо. Профессор приводит пример нахождения сингулярного разложения матрицы 2x3 и показывает шаги для его получения.

  • 00:50:00 В этом разделе профессор объясняет процесс нахождения сингулярного разложения матрицы. Он демонстрирует, как найти собственные векторы матрицы, и продолжает показывать, как разложить матрицу в U-, сигма- и V-транспонированную формы. Он подчеркивает, что собственные векторы, соответствующие нулевому собственному значению, не важны и могут быть отброшены, что экономит вычисления. Профессор завершает этот раздел, излагая другую форму разложения по сингулярным числам.

  • 00:55:00 В этом разделе представлена упрощенная форма СВД. A становится равным U, умноженному на сигму, умноженному на V, транспонированному, где U по-прежнему является матрицей m на m, сигма также равна m на m, а V является матрицей m на n. Это работает только тогда, когда m меньше или равно n. Доказательство то же самое, и последний шаг — отбросить ненужную информацию. Эта форма упрощает матрицы, удаляя ненужные столбцы и строки, что делает ее очень эффективной для матриц с гораздо более низким рангом, чем количество столбцов и строк. Примером этого являются курсы акций пяти компаний и 365 дней в году. Уменьшенная форма экономит много места и будет использоваться большую часть времени. Собственные векторы помогают измерить корреляцию данных и определить новую ортогональную систему координат без изменения самих данных.

  • 01:00:00 В этом разделе профессор объясняет, как разложение по сингулярным числам (SVD) поворачивает данные в другую ориентацию, представленную ортонормированным базисом, к которому вы выполняете преобразование. Корреляции между различными акциями представлены тем, как эти точки ориентированы в преобразованном пространстве. Кроме того, профессор упоминает теорему Перрона-Фробениуса, которая выглядит теоретической, но Стив Росс нашел результат, использующий эту теорему, который называется теоремой Стива Росса о восстановлении. Теорема утверждает, что для симметричной матрицы размера n на n, все элементы которой положительные, существует наибольшее собственное значение lambda_0.

  • 01:05:00 В этом разделе спикер представляет известную теорему линейной алгебры, которая имеет множество теоретических приложений, включая теорию вероятностей и комбинаторику. Теорема утверждает, что для несимметричной матрицы существует единственное собственное значение с наибольшим абсолютным значением, которое является действительным числом. Кроме того, существует собственный вектор с положительными элементами, соответствующими этому собственному значению. Теорема использовалась во многих контекстах, и докладчик кратко описывает, как она работает, когда матрица симметрична. Доказательство включает в себя несколько наблюдений, в том числе тот факт, что наибольшее положительное собственное значение доминирует над наименьшим отрицательным собственным значением, если все собственные значения имеют положительные элементы.

  • 01:10:00 В этом разделе спикер объясняет, как положительные элементы матрицы влияют на собственные векторы матрицы. Если вектор имеет неположительные или отрицательные элементы, изменение знака элементов и получение нового вектора увеличит величину, чего не может произойти в матрице с положительными элементами. Собственный вектор матрицы с положительными элементами также должен иметь положительные элементы, и эта теорема верна даже в более общих условиях. Спикер рассмотрит эту концепцию позже, но позже она вступит в игру.
 

3. Теория вероятностей



3. Теория вероятностей

Эта обширная серия видеороликов по теории вероятностей охватывает широкий круг тем, обеспечивая глубокое понимание фундаментальных концепций и их практического применения. Профессор начинает с того, что освежает наши знания о распределениях вероятностей и функциях генерации моментов. Он проводит различие между дискретными и непрерывными случайными величинами и определяет важные термины, такие как функция массы вероятности и функция распределения вероятности. Профессор также иллюстрирует эти понятия примерами, включая равномерное распределение.

Далее профессор углубляется в понятия вероятности и ожидания для случайных величин. Он объясняет, как вычислить вероятность события и определяет математическое ожидание (среднее значение) случайной величины. Профессор также обсуждает понятие независимости для случайных величин и вводит нормальное распределение как универсальное распределение для непрерывных случайных величин.

Изучая моделирование цен на акции и финансовые продукты, профессор отмечает, что использование только нормального распределения может не точно отразить величину изменений цен. Вместо этого он предлагает моделировать процентное изменение как нормально распределенную переменную. Кроме того, профессор обсуждает логарифмически нормальное распределение и его функцию плотности вероятности, подчеркивая, что его параметры мю и сигма получены из нормального распределения.

В серии видеороликов представлены другие распределения в рамках экспоненциального семейства, такие как распределение Пуассона и экспоненциальное распределение. Эти распределения обладают статистическими свойствами, которые делают их полезными в реальных приложениях. Профессор объясняет, как можно параметризовать эти распределения, и подчеркивает взаимосвязь между логарифмически-нормальным распределением и экспоненциальным семейством.

Двигаясь дальше, профессор исследует статистические аспекты и долгосрочное поведение случайных величин. Он объясняет концепцию моментов, представленных k-ми моментами случайной величины, и подчеркивает использование функции, производящей момент, как единого инструмента для изучения всех моментов. Кроме того, профессор обсуждает поведение случайных величин в долгосрочной перспективе, наблюдая за несколькими независимыми случайными величинами с одинаковым распределением, что приводит к графику, очень похожему на кривую.

Затем серия видео посвящена двум важным теоремам: закону больших чисел и центральной предельной теореме. Закон больших чисел гласит, что среднее значение независимых и одинаково распределенных случайных величин сходится к среднему в слабом смысле по мере увеличения числа испытаний. Вероятность отклонения от среднего уменьшается с увеличением числа испытаний. Центральная предельная теорема показывает, что распределение среднего значения независимых случайных величин приближается к нормальному распределению независимо от начального распределения. Генерирующая момент функция играет ключевую роль в демонстрации сходимости распределения случайной величины.

Далее обсуждается сходимость случайных величин, подчеркивая, как функция, генерирующая момент, может управлять распределением. Профессор вводит понятие рейка в казино как средства получения прибыли и обсуждает влияние дисперсии на веру в свои возможности. Объясняется доказательство закона больших чисел, подчеркивая, как усреднение большего числа членов уменьшает дисперсию.

В контексте казино спикер объясняет, как можно применить закон больших чисел. Отмечается, что игрок может иметь небольшое невыгодное положение в отдельных играх, но при большом размере выборки закон больших чисел обеспечивает стремление среднего результата к ожидаемому значению. Исследуется идея о том, что казино берет рейк, и подчеркивается, как преимущество игрока и вера в математические принципы могут влиять на результаты.

Наконец, в серии видеороликов рассматриваются слабые и сильные законы больших чисел и обсуждается центральная предельная теорема. Слабый закон гласит, что среднее значение независимых и одинаково распределенных случайных величин сходится к среднему значению по мере того, как число испытаний приближается к бесконечности. Усиленный закон больших чисел обеспечивает более сильную форму сходимости. Центральная предельная теорема объясняет сходимость распределения среднего к нормальному распределению, даже если начальное распределение отличается.

В целом, эта серия видео предлагает обширное исследование концепций теории вероятностей, включая распределения вероятностей, функции, производящие моменты, законы больших чисел, центральную предельную теорему и их практическое применение.

  • 00:00:00 В этом разделе профессор представляет тему теории вероятностей, давая обзор вероятностных распределений и уделяя особое внимание функции генерации момента. Он различает дискретные и непрерывные случайные величины и определяет функцию массы вероятности и функцию распределения вероятности. Профессор поясняет, что пространством выборки обычно считаются действительные числа для непрерывных случайных величин, и приводит примеры функций массы вероятностей и функций распределения вероятностей, включая равномерное распределение. В целом, этот раздел служит напоминанием для тех, кто знаком с основами теории вероятностей.

  • 00:05:00 В этом разделе профессор обсуждает понятия вероятности и ожидания для случайных величин. Он объясняет, что вероятность события может быть вычислена либо как сумма всех точек в событии, либо как интеграл по множеству. Он также определяет математическое ожидание или среднее значение для случайных величин как сумму или интеграл по всем возможным значениям случайной величины, умноженный на это значение. Затем профессор продолжает объяснять концепцию независимости случайных величин, проводя различие между взаимно независимыми событиями и попарно независимыми событиями. Наконец, он вводит нормальное распределение как универсальное распределение для непрерывных случайных величин.

  • 00:10:00 В этом разделе видео о теории вероятностей спикер обсуждает использование нормального распределения в качестве средства моделирования цен на акции или финансовые продукты, а также то, что это не всегда хороший выбор из-за того, что не учитывается порядка самой цены. Вместо этого спикер углубляется в идею о том, что нормально распределенным должно быть процентное изменение, чтобы лучше моделировать цены акций. Выступающий отмечает, что нормально распределенные приращения цен будут давать нормально распределенную цену, а не иметь какую-либо тенденцию.

  • 00:15:00 В этом разделе профессор объясняет, как найти распределение вероятностей Pn, когда изменения цен имеют логарифмически нормальное распределение. Он определяет логарифмически нормальное распределение Y как случайную величину, такую, что log Y имеет нормальное распределение. Используя формулу замены переменной, он показывает, как найти функцию распределения вероятностей логарифмически нормального распределения, используя нормальное распределение вероятностей. Профессор также объясняет, почему использование процентного изменения в качестве модели изменения цены не является хорошим выбором в долгосрочной перспективе, поскольку оно может принимать отрицательные значения и в конечном итоге привести к тому, что цена пойдет вверх или вниз до бесконечности.

  • 00:20:00 В этом разделе профессор обсуждает логарифмически нормальное распределение и его определение. Функция плотности вероятности X равна функции плотности вероятности Y в log X, умноженном на дифференцирование log X, которое равно 1 по X. Распределение определяется параметрами mu и sigma, которые получены из нормального распределения . Однако при перекосе он больше не центрируется на мю, и получение среднего значения не дает среднего, которое не равно е по отношению к сигме.

  • 00:25:00 В этом разделе профессор представляет другие распределения помимо нормального и логарифмически нормального распределения, такие как распределение Пуассона и экспоненциальное распределение, которые принадлежат к семейству распределений, называемому экспоненциальным семейством. Это семейство обладает некоторыми хорошими статистическими свойствами, которые делают их полезными в реальных приложениях. Профессор объясняет, что все распределения в этом семействе могут быть параметризованы вектором, называемым «тета», и что функция плотности вероятности может быть записана как произведение трех функций: h(x), t_i(x) и c(тета). ). Затем профессор переходит к тому, как логарифмически нормальное распределение попадает в экспоненциальное семейство, используя формулу 1 на x квадратный корень сигма 2 pi, e на минус log x [НЕРАЗБОРЧИВО] в квадрате.

  • 00:30:00 В этом разделе спикер обсуждает два основных момента, представляющих интерес при изучении случайной величины: статистика и долгосрочное/крупномасштабное поведение. Статистика представлена k-м моментом случайной величины, где k-й момент определяется как математическое ожидание от X к k. Спикер поясняет, что единый способ изучения всех моментов вместе — через производящую момент функцию, которая содержит всю статистическую информацию о случайной величине. Второй основной темой является долгосрочное или крупномасштабное поведение случайной величины, которое можно наблюдать с помощью нескольких независимых случайных величин с точно таким же распределением. Когда числа очень большие, можно построить график, показывающий, сколько случайных величин попадает в каждую точку, что будет очень похоже на кривую.

  • 00:35:00 В этом разделе спикер обсуждает теорию вероятностей и долгосрочное поведение или крупномасштабное поведение случайных величин. Две обсуждаемые теоремы - это закон больших чисел и центральная предельная теорема. Также вводится функция генерации моментов, которая определяется как математическое ожидание от e к t, умноженному на x, где t — некоторый параметр. Функция дает k-й момент случайной величины и предназначена для всех целых чисел. Докладчик отмечает, что наличие функции, производящей момент, важно, поскольку она классифицирует случайные величины.

  • 00:40:00 В этом разделе обсуждается теорема о том, что если две случайные величины имеют одинаковую производящую функцию момента, то они имеют одинаковое распределение. Однако предупреждаем, что это не означает, что все случайные величины с одинаковыми k-ми моментами для всех k имеют одинаковое распределение, поскольку требуется существование функций, производящих моменты. Упоминается еще одно утверждение, в котором говорится, что если производящая момент функция существует для последовательности случайных величин и сходится к производящей момент функции некоторой другой случайной величины X, то распределение этой последовательности все ближе и ближе к распределению Х.

  • 00:45:00 В этом разделе профессор обсуждает концепцию сходимости случайных величин и объясняет, что распределения случайных величин сходятся к распределению одной случайной величины. Функция, производящая момент, является мощным инструментом для управления распределением, как видно из данных теорем. Затем профессор вводит закон больших чисел, где X определяется как среднее значение n случайных величин, и объясняет, что если эти переменные независимы, одинаково распределены со средним мю и сигма-квадратом дисперсии, то вероятность того, что X меньше или равная некоторому значению, стремится к вероятности этого значения.

  • 00:50:00 В этом разделе спикер обсуждает закон больших чисел и его применение в казино. При усреднении большого количества одинаковых независимых распределений их значения будут очень близки к среднему. Играя в блэкджек в казино, игрок имеет небольшой минус с вероятностью выигрыша в 48%. С точки зрения игрока, берется только небольшой размер выборки, что приводит к тому, что дисперсия проявляется за короткий период времени. Однако, с точки зрения казино, у них очень большой размер выборки, и пока есть преимущество в их пользу, они будут продолжать выигрывать деньги. Покер отличается от игр казино тем, что в него играют против других игроков, а не против казино.

  • 00:55:00 В этом разделе обсуждается идея о том, что казино взимает рейк как средство зарабатывания денег, при этом сборы, уплачиваемые игроками, накапливаются для создания прибыли для казино. Утверждается, что если игрок лучше своего противника и это преимущество превышает комиссию, взимаемую казино, игрок может выиграть, используя закон больших чисел. Несмотря на это, когда дисперсия значительна, вера в свои возможности может уменьшиться; однако вера в математику может быть всем, что нужно, чтобы не сбиться с пути. Затем объясняется доказательство закона больших чисел с примером, иллюстрирующим, как усреднение большего числа членов уменьшает дисперсию.

  • 01:00:00 В этом разделе обсуждается слабый закон больших чисел, который гласит, что если у вас есть независимые и одинаково распределенные (IID) случайные величины, среднее сходится к среднему в слабом смысле по мере того, как количество испытаний до бесконечности. Вероятность отклонения от среднего уменьшается по мере увеличения числа испытаний. Кратко затронут также усиленный закон больших чисел, который имеет более сильную сходимость, чем слабый закон. Следующая тема — центральная предельная теорема, в которой исследуется, что происходит, когда количество испытаний заменяется квадратным корнем из числа испытаний в случайной величине.

  • 01:05:00 В этом разделе профессор объясняет, как центральная предельная теорема отвечает на вопрос о распределении Yn со средним значением 0 и сигма-квадратом дисперсии. Он заявил, что при выборе множества независимых событий и нахождении их среднего значения в этом смысле их распределение сходится к нормальному распределению. Далее он сформулировал теорему о сходимости распределения Yn к нормальному распределению со средним значением 0 и сигмой дисперсии. Независимо от начального распределения происходит сходимость к нормальному распределению.

  • 01:10:00 В этом разделе цель состоит в том, чтобы доказать, что производящая момент функция Y_n сходится к производящей момент функции нормали для всех t, поточечная сходимость. Генерирующая момент функция нормали равна e в квадрате t квадрат сигма над 2. Генерирующая момент функция Y_n равна математическому ожиданию от e до t Y_n. Произведение e на t, 1 на квадратный корень n, X_i минус mu становится произведением 1 на n, математическое ожидание e на t, умноженное на квадратный корень n. N-я степень этого равна математическому ожиданию e относительно t из квадратного корня n, X_i минус mu в n-й степени. Используется разложение Тейлора, и по мере того, как n стремится к бесконечности, все эти члены будут меньше по порядку величины, чем n, 1 на n.

  • 01:15:00 В этом разделе спикер обсуждает закон больших чисел и центральную предельную теорему как способы оценки среднего значения случайной величины. Используя множество независимых испытаний случайной величины и используя их для оценки среднего значения, закон больших чисел утверждает, что оценка будет очень близка к фактическому среднему значению, если количество испытаний достаточно велико. Затем центральная предельная теорема объясняет, как распределение этой оценки находится вокруг среднего значения, при этом нормальное распределение имеет очень маленькое хвостовое распределение. Однако спикер отмечает, что для некоторых распределений лучше использовать другую оценку, а не оценку максимального правдоподобия.
 

5. Случайные процессы I.



5. Случайные процессы I.

В этом видеоролике о стохастических процессах профессор представляет всестороннее введение и обзор случайных процессов с дискретным и непрерывным временем. Эти вероятностные модели используются для анализа случайных событий, происходящих во времени. Видео демонстрирует примеры процессов простого случайного блуждания и цепи Маркова, чтобы проиллюстрировать, как они решают вопросы, связанные с зависимостью, долгосрочным поведением и граничными событиями. Кроме того, обсуждается теорема Перрона-Фробениуса, подчеркивающая важность собственных векторов и собственных значений в определении долгосрочного поведения системы. Видео завершается введением концепции мартингейл-процессов, которые служат моделями честной игры.

Видео начинается с представления концепции мартингалов в стохастических процессах, которые предназначены для поддержания неизменного математического ожидания. Примером мартингейла является случайное блуждание, которое демонстрирует флуктуации при постоянном сохранении ожидаемого значения 1. В видео также объясняется время остановки, которое представляет собой заранее определенные стратегии, зависящие только от значений стохастического процесса до определенной точки. Необязательная теорема об остановке утверждает, что если существуют мартингейл и время остановки tau, ожидаемое значение в момент остановки будет равно начальному значению мартингала. Эта теорема подчеркивает справедливый и равновесный характер мартингальных процессов.

На протяжении всего видео подробно рассматриваются различные темы. Вводятся случайные процессы с дискретным и непрерывным временем, иллюстрирующие их представление через распределения вероятностей по различным путям. Такие примеры, как простое случайное блуждание и игра с подбрасыванием монеты, помогают прояснить свойства и поведение этих процессов. Обсуждается важность цепей Маркова, подчеркивая, что будущее состояние зависит исключительно от текущего состояния, что упрощает анализ случайных процессов. Исследуется понятие стационарного распределения, демонстрируя теорему Перрона-Фробениуса, которая устанавливает существование уникального собственного вектора, соответствующего наибольшему собственному значению, представляющему долгосрочное поведение системы.

Видео завершается акцентом на связи между мартингейлом и честной игрой. Отмечается, что процесс мартингейла гарантирует, что математическое ожидание останется неизменным, что означает сбалансированную игру. И наоборот, такие игры, как рулетка в казино, не являются мартингейлами, поскольку ожидаемое значение меньше 0, что приводит к ожидаемым потерям для игроков. Наконец, упоминается теорема, предполагающая, что если игрок моделируется с помощью мартингейла, независимо от используемой стратегии баланс всегда будет равен начальному балансу. Кроме того, математическое ожидание X_tau, значение в момент остановки, всегда равно 0, что указывает на то, что при моделировании с помощью мартингейла не ожидается, что игрок выиграет.

В целом, видео дает всесторонний обзор случайных процессов, их свойств и их приложений в моделировании и анализе случайных событий.

  • 00:00:00 В этом разделе профессор представляет введение в стохастические процессы, набор случайных величин, индексированных по времени. Она различает случайные процессы с дискретным и непрерывным временем и объясняет, что они могут быть представлены набором вероятностей на разных путях. Она приводит примеры трех случайных процессов, в том числе одного, в котором f(t) равно t с вероятностью 1, другого, в котором f(t) равно t для всех t с вероятностью 1/2, или f(t) равно t -t для всех t с вероятностью 1/2, и тот, в котором для каждого t f(t) равно t или -t с вероятностью 1/2.

  • 00:05:00 В этом разделе спикер обсуждает концепцию случайных процессов и различные типы вопросов, которые изучаются в связи с ними. Стохастические процессы используются для моделирования реальных ситуаций, таких как курсы акций, и включают случайные переменные, которые зависят друг от друга. Три основных типа изучаемых вопросов включают зависимости в последовательности значений, долгосрочное поведение и граничные события. Докладчик объясняет, как каждый тип вопросов связан со случайными процессами и их распределением вероятностей.

  • 00:10:00 В этом разделе представлена тема случайных процессов, которая относится к анализу случайных событий, происходящих во времени. В частности, основное внимание уделяется стохастическим процессам с дискретным временем, одним из наиболее важных из которых является простое случайное блуждание. Это определяется как последовательность случайных переменных X sub t, которая представляет собой сумму независимых одинаково распределенных (IID) переменных Y_i, которые могут принимать значения 1 или -1 с вероятностью 1/2. Траекторию случайного блуждания можно представить как последовательность движений вверх или вниз в зависимости от значения Y_i. Эта модель послужит основой для понимания случайных процессов с непрерывным временем позже в ходе курса.

  • 00:15:00 В этом разделе профессор обсуждает поведение простого случайного блуждания в течение длительного периода времени. Согласно центральной предельной теореме, чем ближе к 0 становится значение X_t, тем меньше будет дисперсия, которая должна быть около 1 по t и стандартное отклонение около 1 по квадратному корню из t. При наблюдении X_t над квадратным корнем из t значения будут иметь нормальное распределение со средним значением 0 и дисперсией квадратного корня из t. Следовательно, в очень больших масштабах простое случайное блуждание не будет слишком сильно отклоняться от квадратного корня из t и кривых минус квадратный корень из t. Несмотря на то, что теоретическое экстремальное значение для ходьбы равно t и минус t, вы будете находиться близко к кривым, играя в основном в этой области. Профессор упоминает, что есть теорема, согласно которой вы будете бесконечно часто нажимать на две линии.

  • 00:20:00 В этом разделе обсуждаются свойства случайного блуждания. Первое свойство заключается в том, что математическое ожидание X sub k равно 0, а второе свойство называется независимым приращением. Это означает, что если вы посмотрите на то, что происходит в период с 1 по 10, это не имеет отношения к тому, что происходит в период с 20 по 30. Третье свойство называется стационарным. В нем говорится, что распределение X sub t+h минус X sub t такое же, как распределение X sub h. Пример игры с подбрасыванием монеты используется, чтобы показать, что если вы начнете с баланса в 0,00 долларов с честной монетой, ваш баланс будет точно следовать простому случайному блужданию с вероятностью 50-50.

  • 00:25:00 В этом разделе профессор обсуждает вероятности в сценарии случайного блуждания, когда он подбрасывает монету и останавливается либо после выигрыша 100 долларов, либо после проигрыша 50 долларов. Прокладывая линии в двух точках остановки, он объясняет, что вероятность попасть в верхнюю линию первой равна A больше, чем A плюс B, а вероятность попасть в нижнюю линию первой равна B больше, чем A плюс B. Используя эту формулу, он вычисляет что вероятность выиграть 100 долларов равна 2/3, а проиграть 50 долларов — 1/3. Затем профессор описывает, как доказать эту формулу, определив f of k как вероятность попасть в любую строку первой, начиная с позиции k в случайном блуждании.

  • 00:30:00 В этом разделе спикер обсуждает два важных случайных процесса: простое случайное блуждание и цепь Маркова. Простое случайное блуждание — это процесс, в котором на каждом шаге человек либо идет вверх, либо вниз с вероятностью 1/2. Стационарность этого процесса позволяет легко вычислять вероятности. С другой стороны, цепь Маркова — это набор случайных процессов, в которых влияние прошлого на будущее суммируется текущим состоянием. Важность цепи Маркова заключается в том, что будущее зависит только от настоящего, что делает ее более управляемым стохастическим процессом для анализа.

  • 00:35:00 В этом разделе спикер объясняет понятие случайных процессов с дискретным временем как цепи Маркова. Пример простого случайного блуждания используется для иллюстрации того, что процесс представляет собой цепь Маркова, потому что его вероятность достижения следующего шага зависит только от текущего значения, а не от его предыдущих значений. Вероятность процесса может быть определена математически, при этом вероятность его перехода из i в j представляет собой сумму всех вероятностей перехода из i во все другие точки множества. Для конечного множества S цепи Маркова легко описать, вычислив их переходные вероятности.

  • 00:40:00 В этом разделе спикер объясняет, что матрица переходных вероятностей является важным инструментом для понимания цепей Маркова. Эта матрица, состоящая из вероятностей перехода из одного состояния в другое, обладает всей информацией, необходимой для предсказания будущих переходов в цепи Маркова. Используя эту матрицу, можно определить вероятность совершения перехода из одного состояния в другое за любое количество шагов. Однако важно отметить, что пространство состояний должно быть конечным, чтобы существовала матрица вероятности перехода.

  • 00:45:00 В этом разделе приведен пример цепи Маркова системы, которую можно смоделировать как множество состояний с рабочими или неисправными состояниями. В примере показана матрица с вероятностями перехода между состояниями в виде вероятности ее восстановления и вероятности того, что она останется сломанной. Возникает вопрос, каким будет распределение вероятностей системы через длительный период, скажем, 10 лет, и делается предположение, что распределение вероятностей на 3650-й и 3651-й день должно быть примерно одинаковым. В этом предположении наблюдаемое через длительный промежуток времени распределение вероятностей будет собственным вектором матрицы, собственное значение которой равно 1, а собственный вектор равен [p, q].

  • 00:50:00 В этом разделе докладчик обсуждает теорему Перрона-Фробениуса, которая утверждает, что для переходной матрицы с положительными элементами в цепи Маркова существует вектор, удовлетворяющий условию Av = v. Этот вектор называется стационарным распределением и представляет долгосрочное поведение системы. Гарантировано, что наибольшее собственное значение матрицы равно 1, а соответствующий собственный вектор будет тем, который представляет стационарное распределение. Теорема является общей и применима не только к матрице, используемой в примере, но и к любой переходной матрице в цепи Маркова с положительными элементами.

  • 00:55:00 В этом разделе профессор обсуждает стационарное распределение и его уникальность, связанную с собственными векторами и собственными значениями. Теорема Перрона-Фребениуса говорит, что существует только один собственный вектор, соответствующий наибольшему собственному значению, которое оказывается равным 1. Остальные собственные значения в матрице меньше 1, что означает, что они рассеиваются, но поведение, соответствующее стационарному распределению, сохраняется. . В последней теме профессор рассказывает о мартингейле, еще одном наборе случайных процессов, используемых для моделирования честной игры. Стохастический процесс считается мартингейлом, если это честная игра.

  • 01:00:00 В этом разделе лектор объясняет, как стохастический процесс может быть мартингейлом, то есть честной игрой. В мартингейле, если вы посмотрите на то, что может произойти в момент времени t+1, ожидаемое значение должно быть точно равно значению в момент времени t, поэтому процесс сосредоточен в этой точке. Если это похоже на ваш баланс в игре, ожидается, что вы вообще не выиграете денег. Лектор приводит пример случайного блуждания, которым является мартингейл. Однако игра в рулетку в казино не является мартингейлом, так как математическое ожидание меньше 0, а значит, игрок рассчитан на проигрыш. Наконец, лектор показывает забавный пример, чтобы проиллюстрировать, что существует много способов, которыми стохастический процесс может быть мартингейлом, придумав пример X_k, равный либо 2, либо -1, в зависимости от распределения вероятностей.

  • 01:05:00 В этом разделе было введено понятие мартингейлов, которые представляют собой стохастические процессы, устроенные таким образом, что математическое ожидание всегда равно 1. Примером мартингейла является случайное блуждание, которое сильно колеблется, но в ожидании, всегда поддерживает ожидаемое значение 1. Также обсуждалась необязательная теорема об остановке, в которой говорится, что игра в мартингейл гарантирует, что вы не выиграете и не проиграете в ожидании, независимо от используемой стратегии. Также было разъяснено определение времени остановки, которое представляет собой неотрицательную целочисленную случайную величину, зависящую только от стохастического процесса до определенного момента времени.

  • 01:10:00 В этом разделе профессор объясняет концепцию времени остановки, которая представляет собой предопределенный набор стратегий, которые полагаются только на значения стохастического процесса до определенной точки, что делает его временем остановки. Он приводит пример игры с подбрасыванием монеты и показывает, что время, когда баланс становится равным 100 или отрицательным 50 долларам, является временем остановки, а время первого пика — нет, так как оно зависит от будущих значений. Необязательная теорема об остановке утверждает, что если есть мартингал и время остановки tau, которое всегда меньше или равно константе T, значение в момент остановки будет иметь ожидаемое значение, равное начальному значению мартингала.

  • 01:15:00 В этом разделе видео обсуждается теорема, показывающая, что если игрок моделируется с помощью мартингейла, независимо от того, какая стратегия используется, игрок не может выиграть, потому что баланс в начале всегда равен балансу, когда игрок останавливается. Хотя лектор не доказывает эту теорему, он приводит интересное следствие, показывающее, что математическое ожидание X_tau равно 0. Это означает, что независимо от того, какой случай используется, останавливается ли он на уровне 100, -50 или неограниченно, результат всегда будет возвращаться как 0. Лектор подчеркивает, что содержание теоремы интересно, так как подразумевает, что если что-то можно смоделировать с помощью мартингейла, то игрок не должен выиграть.