量化交易 (Quantitative trading) - 页 32

 

练习第 4 课,第 2 部分(金融市场微观结构)



练习第 4 课,第 2 部分(金融市场微观结构)

在之前的讲座中,讲师讨论了一个将 Kyle 模型与 Stoll 模型相结合的复杂问题,并介绍了具有均值-方差偏好的风险规避经销商。目标是找到一个线性均衡,其中知情交易者的订单大小是基本价值的线性函数,交易商根据线性时间表设定价格。但是,讲师提到他们不会在本视频中完成完整的解决方案,因为它已经在课程网站上提供。

讲师解决了学生在练习中可能遇到的两个具有挑战性的方面。问题的 A 部分需要根据观察到的总订单流队列找到公司 V 的条件期望和方差。这涉及在给定有关队列的信息的情况下计算 V 的预期值和可变性。另一方面,C 部分被认为是具有风险规避和经销商决策的 Stoll 模型的核心。它涉及经销商将价格视为既定价格,但实际上,他们根据订单流来确定价格表。讲师解释了这种逻辑的不一致性,以及经销商如何确定他们愿意以固定价格供应多少。

该视频深入探讨了风险规避对金融市场微观结构中交易商的影响。当交易商规避风险并具有凹效用时,与每单位交易利润无关的概念将不再适用。每个交易商只愿意购买有限数量的任何风险资产,即使每笔交易的利润是正数或负数。规避风险的交易商避免持有大量的高风险头寸,因为增加他们的购买量也会增加他们整体头寸的风险,导致他们未来财富的差异更大。因此,有必要确定交易商愿意以任何给定价格买入或卖出的最大数量。这个决定在金融市场上产生了 P 的供给曲线 Q 和 Q 的价格表 P。

讲师解释了如何利用经销商的效用函数来确定最佳供应量,从而得出 Y 的 P 等式,其中 Y 代表经销商愿意交易的数量。强调了经销商的竞争性,描述了求解最大化问题的过程。讲师还涉及问题的代数方面,然后返回到 A 部分,其中需要使用 RLS 方程找到给定 Q 的 V 的条件分布。 RLS(recursive least squares)的结论是根据关于X的信息来估计Y。

解释了以 Q 为条件的 V 分布的推导,讲师提到它是由可以使用贝叶斯规则计算的概率密度函数 (PDF) 描述的。讲师注意到幻灯片上没有显示公式,并强调了跟踪 Q 的期望值和计算 B 的期望值的重要性。他们还讨论了一种更快、更有效的方法来推导出这个表达式,以及一个更长、更长时间的公式。乏味的方式,特别是对于精确的奶牛模型。

演讲者进一步讨论了如何找到出现在公式分子中的特定 D 和 Q 的联合概率,以及出现在分母中的观察到 Q 的特定实现的概率。由于 U 和 V 是自变量,联合概率可以分解为两个独立 PDF 的乘积。解释了这个公式的推导,建议不感兴趣的同学跳过这部分。

讨论了正态分布的性质,并基于无条件期望和方差导出了 V 和 U 的累积分布函数 (CDF)。 V 和 U 的联合 PDF 也通过调用正态分布的属性和变量之间的独立性来确定。发现 beta V 减去 X0 和 U 的和服从正态分布,并且可以使用混合方法计算其数学期望和方差。然而,一种更短的计算方法是直接使用正态分布和独立性的属性。

演讲者解释了如何获得 Q 的条件概率分布,假设 Q 的形式为 beta 乘以 V 的均值减去 X0 加上 U 的均值。Q 的方差等于 beta 平方乘以 V 的方差加上方差U 的。使用这些结果,演讲者通过组合正态分布的 PDF 和联合 PDF 提供 F of Q 的表达式。虽然得到的表达式很复杂,但可以通过收集所有项并对其求和来简化它。演讲者承认这种分布的信息量还不够大,因此很难确定 Q 是否服从正态分布并确定其均值和方差。

接下来,演讲者讨论了如何通过将 X 的形式视为正常形式并将 V 重写为完整的平方来验证某个分数来找到均值和方差。他们将差异简化为一个分数,并确认这个分数确实作为条件提示的方差。

最后,讲师解释了如何通过代数运算找到条件队列的条件期望。它们将大项表示为 2V,称为 mu,将整个平方表示为 V 减去 mu 的平方除以 Sigma 的平方。这种简化有助于找到平均值。讲师最后提到,第 9 讲和第 10 讲将涵盖更多问题,重点关注市场中流动性和公共信息的价值,以及对高频交易的继续讨论。

  • 00:00:00 讲师讨论了上一课中的一个难题,该问题将 Kyle 的模型与 Stoll 模型相结合,并添加了一个具有均值方差偏好的风险规避经销商。目标是找到一个线性均衡,其中知情交易者的订单大小是基本价值的线性函数,交易商根据线性时间表设定价格。讲师解释说,由于该视频已发布在课程网站上,因此他们将不会完成该视频中的完整解决方案。

  • 00:05:00 讲师正在解决学生在练习中可能遇到的两个问题。 A 部分要求根据观察到的总订单流队列找到公司 V 的条件期望和方差。 C 部分是 Stoll 风险规避和经销商决策模型的核心部分。它涉及经销商将价格视为既定价格,但实际上,他们根据订单流来确定价格表。讲师解释了逻辑上的不一致以及经销商如何确定他们愿意以固定价格供应多少。

  • 00:10:00 视频讨论了风险规避对金融市场微观结构中交易商的影响。当交易商规避风险且具有凹效用时,对每单位交易利润漠不关心的概念将不再适用。每个交易商只愿意购买有限数量的任何风险资产,即使每笔交易的利润严格为正或负。规避风险的交易商不会持有大量的高风险头寸,因为他们购买的越多,他们的总头寸的风险就越大,从而导致他们未来财富的差异更大。因此,对于任何给定的价格,有必要确定交易商愿意买入或卖出的最大数量。这个决定产生了 P 的供给曲线 Q 和金融市场上 Q 的预定价格 P。

  • 00:15:00 演讲者解释如何使用经销商的效用函数来确定最佳供应量并获得 P 的 Y 方程,其中 Y 是经销商愿意交易的数量。突出了经销商的竞争性,阐述了求解最大化问题的过程。演讲者还谈到了问题的代数部分,然后回到 A 部分,其中需要使用 RLS 方程找到以 Q 为条件的 V 的条件分布。给定 X 的信息,RLS 的结论用于估计 Y。

  • 00:20:00 讲师解释了如何使用概率密度函数推导以 Q 为条件的 V 分布。讲师指出分布由 PDF 描述,可以使用贝叶斯规则计算。他们还强调指出,幻灯片上的任何地方都没有显示所提供的公式,并且需要跟踪 Q 的期望值以及计算 B 的期望值。此外,他们还解释了推导此表达式的快速方法以及对于确切的奶牛模型,这是一种漫长而乏味的方式。

  • 00:25:00 演讲者讨论了如何在公式的分子中找到观察到特定 D 和 Q 的联合概率以及在分母中观察到 Q 的特定实现的概率。联合概率可以分解为两个独立 PDF 的乘积,因为 U 和 V 是自变量。解释了这个公式的推导,建议没兴趣的可以离开。

  • 00:30:00 讨论了正态分布的 PDF,并基于无条件期望和方差导出了 V 和 U 的 CDF。 V 和 U 的联合 PDF 也通过调用正态分布和独立的属性来确定。发现 beta V 减去 X0 和 U 的和服从正态分布,并且可以使用混合方法计算该和的数学期望和方差。然而,一种更短的计算方法是简单地使用正态分布和独立性的属性。

  • 00:35:00 演讲者解释了如何获得 Q 的条件概率分布,假设我们知道 V 并且我们假设 Q 的形式为 beta 乘以 V 的平均值减去 x0 加上 U 的平均值。Q 的方差被导出为 beta 平方乘以 V 的方差加上 U 的方差。使用这些结果,演讲者通过组合正态分布的 PDF 和联合 PDF 提供 Q 的 F 的表达式。生成的表达式很复杂,但可以通过收集所有项并将它们相加来简化它。演讲者指出,这个分布还不是很清楚,很难看出 Q 是否正态以及它的均值和方差是多少。

  • 00:40:00 演讲者讨论了如何在给定 X 为正态形式的情况下求均值和方差,以及如何将 V 写成一个完整的正方形以确认某个分数有效。他们将差异简化为一个分数,并确认这个分数实际上作为条件提示的方差。

  • 00:45:00 讲师讲述了如何通过一些代数运算找到条件队列的条件期望,将 2 V 的巨大项表示为 mu,将整数的平方表示为 V 减去 mu 的平方除以 Sigma 的平方。这就是如何简化表达式并找到均值。讲师还提到在第 9 讲和第 10 讲中将涉及更多关于市场流动性和公共信息的价值的问题,以及继续谈论高频交易。
Exercise class 4, part 2 (Financial Markets Microstructure)
Exercise class 4, part 2 (Financial Markets Microstructure)
  • 2020.04.24
  • www.youtube.com
Exercise Class 4, part 2Financial Markets Microstructure course (Masters in Economics, UCPH, Spring 2020)***Full course playlist: https://www.youtube.com/pla...
 

练习第 5 课,第 1 部分(金融市场微观结构)



练习第 5 课,第 1 部分(金融市场微观结构)

讲师深入探讨 Contour 模型,从一个简单的例子开始,该例子说明了两组交易者(标记为 I 和 J)之间二阶信念的差异。在这个例子中,资产的基本价值有两个组成部分,theta I 和theta J. I 组的交易者拥有关于 theta I 的一些信息,而 J 组的交易者拥有关于 theta J 的信号。但是,没有公开信号,并且做出了相互独立和零均值的假设。结果,交易员 I 和交易员 J 不知道彼此的 theta,导致二阶置信度为零。

展望未来,讲座深入探讨了公共信息的影响,并假设存在提供有关总 theta 信息的公共信号 Y。交易者 I 对交易者 J 资产估值的看法不依赖于交易者 I 的私人信号,而是基于交易者对公开信号 Y 的观察。发现 XI 中的二阶期望值下降,表明交易者的私人信号越高信号是,他们对其他玩家资产的估值越低。这个结果可以直观地理解为具有高私人信号和资产估值为正的交易者,假设另一个缺乏相同私人信号的参与者对资产的估值较低。

讲师讨论了二阶信念在金融市场微观结构中的重要性,并强调了不同参与者所拥有的关于总资产价值 (theta) 各个组成部分的信息的异质性。当公共信息更加精确时,不同参与者的私人信号就会出现分歧,从而导致交易量增加。这解释了为什么围绕产生新公共信息的公告通常会有更高的交易活动。该领域的大多数模型假设所有信号都属于同一事物,但考虑到异质性可以产生更多信息的模型。

为了说明二阶信念在推动贸易中的作用,演讲者介绍了 Contour 模型的框架。该模型由两组交易者组成,I 和 J,在三个时期内运作。在第二个时期,I 组的交易员退出市场,而 J 组的交易员在第三个时期从持有资产中获得价值 theta。所有交易者都是有竞争力的,并且可以根据价格调节他们的需求,其行为类似于 Kyle 模型中的经销商。模型中的交易者具有指数效用和恒定的绝对风险规避,他们的财富由第 i 组交易者的 di 乘以 p2 减去 p1 和第 J 组交易者的价值 theta 减去 p2 决定。

该模型假设两个时期的资产总供应量正常,均值为零且存在一些方差。在第一个时期,资产供给必须等于行使需求函数的 I 类交易者的需求。在第二期,资产需求必须等于 J 组交易者的总需求,包括第一期出售其持有的 I 组交易者,加上额外的总供应 X。由于这种供应的随机性,价格将不会完美信息量大,导致信息效率不完善。 I 组交易者的最大化问题涉及在给定私人和公共信号的情况下最大化他们的财富预期效用,唯一的选择是他们的需求 DI。

演讲者解释了两个交易者的问题设置,其中交易者 I 拥有资产而交易者 J 需要它,不确定性在于他们愿意交易的价格。假设均衡在 P2 和 P1、U1 和 U2 之间具有线性关系,导致交易者 I 的财富呈正态分布。通过应用均值-方差偏好,演讲者表明最大化其利差效用的代理人与具有均值-方差偏好的代理人相同。交易员 J 的问题使用与交易员 I 相同的方法来解决。由此产生的最大化问题考虑了给定条件变量时他们财富的期望和方差。

讲师解释模型平衡的计算。价格被假定为相关因素的线性函数,包括公共信号 Y、两个时期的供求和资产价值。 P1 是 theta、公共信号 Y 和电源 U1 的线性函数,而 P2 是 theta J、公共信号 Y 和 U2 电源 Y 的线性函数。第 1 期的价格信号 q1 取决于当地的供求关系。代理人的最优需求取决于 P2 的方差以及他们关于 P2 和 theta 的信息的精度。为了计算均衡,演讲者解释了如何根据市场需求和供应获得 P2 的期望。

演讲者讨论了 J 组交易者与 I 组交易者可获得的信息,特别是交易者从先前确定的市场价格中提取的有关 theta 的信息。这种优势使 J 组交易者在市场上比 I 组交易者更具优势。演讲者解释说,价格将是具有不同系数的线性函数,尽管此时尚未确定这些系数。解释了找到 q1 的过程,它表示给定价格 p1 和 Y 的 theta I 的条件期望,以及它与市场价格的关系。确定这些期望和价格的目的是了解它们如何影响代理人的最优策略。

讲师解释了如何将 P2 和 theta 的条件期望表示为信号的线性组合,包括 X、Y、q1、q2 和其他变量。然后将这些表达式重新插入到最优策略中,以获得双方的均衡需求。市场出清条件用于将均衡价格与信号联系起来,从而产生 P1 和 P2 的线性价格。通过匹配系数,可以将最佳需求计算为信号的函数。这个过程提供了模型的一个均衡,尽管可能存在其他具有非线性价格的均衡。

演讲者讨论了交易如何由代理人之间的分歧驱动,以及参与者 1 在第 1 期的最优需求如何取决于他们对 theta 的二阶期望。代理人在第 1 期收到的较高私人信号导致代理人在第 2 期持有的二阶信念的预期较低,从而导致第 2 期的价格较低。本文还考虑了一个稍微更通用的模型,其中包括 theta K。

讲座还讨论了公共信息对交易量的影响,指出更精确的信号会导致更高的交易量。该模型考虑了短期和长期交易者对市场整合的影响,并表明高市场整合导致低交易量。参考了一篇实证论文来支持这些结果,这表明当市场一体化程度较低时,公告对交易量有很大影响。但是,讲师告诫说,标准模型可能无法准确代表公开信息对交易量的影响。

继续演讲,演讲者强调需要更准确的模型来捕捉公共信息对交易量的影响。标准模型通常会忽略信号的异质性,并且无法解释由拥有不同级别信息的不同参与者产生的复杂动态。通过将这些因素纳入模型,研究人员可以更深入地了解市场行为和结果。

接下来,讲师探讨了 Contour 模型的更广泛含义及其与金融市场的相关性。该模型提供了一个框架,用于理解二阶信念如何驱动交易活动和价格形成。它强调了不仅要考虑个体交易者的直接信念和信号,还要考虑他们对其他人的信念的重要性。这些高阶预期会对市场动态产生重大影响,影响交易决策、价格水平和交易量。

此外,Contour 模型阐明了公共信息、私人信号和市场整合之间的相互作用。公开信息的准确性会影响交易者之间私人信号的差异,进而影响交易量。当公开公告包含高度信息化的信号时,它们会导致私人信号中更大的异质性,从而导致交易活动增加。然而,市场一体化程度也发挥了作用,因为高度一体化会因信号趋同和异质性降低而抑制交易量。

为了支持这些发现,讲师引用了一篇实证论文,该论文为公告、市场整合和交易量之间的关系提供了实证证据。研究表明,当市场一体化程度较低时,公告对交易量的影响更为显着。这凸显了在实证研究中考虑公共信息、市场结构和交易行为之间相互作用的重要性。

关于 Contour 模型的讲座探讨了交易者之间二阶信念的分歧、公开信息对交易动态的影响以及市场整合的作用。通过将信号和信念的异质性纳入模型,研究人员可以更好地理解和预测市场行为。该讲座强调需要更准确的模型来捕捉金融市场的复杂动态,并提供对推动交易量和价格形成的因素的见解。

  • 00:00:00 演讲者介绍了当天的练习,包括清理之前课程中的练习,并重温第 9 讲和第 10 讲中有关金融市场微观结构的透明度和流动性的一些问题。该课程主要关注交易后透明度模型和平均价格发现的度量,将用于展示透明市场中价格发现的效率。该课程也将仅限于有足够知情交易者的情况。该视频概述了透明度模型和课程中将使用的不同符号。

  • 00:05:00 演讲者解释了一个模型,该模型用于说明市场运作的不同方式,重点是透明和不透明的市场。该模型假设交易者如何到达市场的特定分布,包括知情和不知情的交易者。在透明的市场中,第二期的所有交易商都可以看到第一笔订单,并可以根据订单流的相关性来识别知情交易者。在不透明的市场中,只有执行第一笔订单的经销商才知道那是什么,这使得定价更加复杂。透明的市场使用标准的 Milgram 损失定价,而在不透明的市场中,经销商将不得不猜测第一位交易者是否被告知相应定价。

  • 00:10:00 演讲者讨论了金融市场的市场微观结构以及交易商如何设定价格以获利。不知情经销商的价格是基于预期值,但知情经销商将他们的价格定得低于不知情经销商的报价。然后,不知情的交易商会报出尽可能大的价差,以避免亏本交易。交易商 I 通过向不知情的交易者提供没有吸引力的价格来获利。信息利润在第一阶段产生了报价战,因为交易商都想吸引订单流以在第二阶段获利。

  • 00:15:00 演讲者讨论了通知交易商在第二个交易时段获得的每笔交易利润,以及它如何导致一半点差降低到一定值。演讲者解释了该模型如何假设 pi 大于一半,以及为什么半差价为负会令人不舒服。他们还讨论了价格发现在该模型中的工作原理,包括剩余方差表达式的计算和模型中可能发生的事件。本节最后解释了不同情况下知情和不知情交易者的行为。

  • 00:20:00 演讲者讨论交易价格的计算和复制过程,以确保计算的准确性。出售和购买资产的概率被平分,这决定了交易价格是 a1t 还是 b1t。演讲者为知情交易者和不知情交易者重复计算卖单概率,概率分别为 pi 和 1-pi/2。使用模型的对称性,说话者简化了 p1t - v 的平方期望的表达式,表明上括号和下括号是相等的。此外,得到的第一个括号简化为 1 + pi/2 超过 2。

  • 00:25:00 演讲者解释了如何计算两种情况下两个时期价格的剩余方差,重点是透明度下的第二个时期。概率为 pi 时,交易者得到通知且剩余方差为零,而概率为 1 减去 pi 时,剩余方差等于 sigma,这意味着价格恢复为 mu。通过随时间取这两项的平均值,推导出透明度下残差的表达式。

  • 00:30:00 演讲者讨论了不透明下第一期的预期价格差异的计算,与透明下的预期价格差异相等。预期价格差异是通过半价差的代数运算得出的,涉及两种情况,一种是资产价值高,交易者都想购买,另一种是资产价值高,交易者都想购买。愿意卖。最终的等式包括 pi、sigma、mu 和四 pi 平方 sigma 平方等项,这些项被慢慢简化以确定预期价格方差。

  • 00:35:00 演讲者讨论不透明和透明情况下剩余价格差异的比较。使用代数计算,他们发现透明下的剩余价格方差低于不透明下的价格,表明透明下的价格发现更好。虽然这看起来像是一个直观的结果,但得出这个结论所需的计算并非完全微不足道,并且涉及复杂的数学方程式。演讲者最后说,这完成了他们对这个练习的探索,剩下的两个问题将在稍后讨论。

  • 00:40:00 讲师讨论完成接下来的两个练习需要多长时间,并提到他们可能会提前完成。他建议在继续之前休息一下,并提出在他们休息回来后回答有关上一个问题的任何问题。
Exercise class 5, part 1 (Financial Markets Microstructure)
Exercise class 5, part 1 (Financial Markets Microstructure)
  • 2020.05.01
  • www.youtube.com
Exercise class 5, part 1Financial Markets Microstructure course (Masters in Economics, UCPH, Spring 2020)***Full course playlist: https://www.youtube.com/pla...
 

练习第 5 课,第 2 部分(金融市场微观结构)



练习第 5 课,第 2 部分(金融市场微观结构)

讲座从介绍当天的练习开始,其中包括回顾和清理以前的课堂练习。重点是第九讲和第十讲的问题,特别是与金融市场微观结构的透明度和流动性有关的问题。讲师解释说,该课程将主要集中在交易后透明度模型和平均价格发现的测量上。分析将仅限于有足够知情交易者的情况。该视频概述了透明模型,并介绍了将在整个课程中使用的不同符号。

接下来,演讲者深入研究了一个模型,该模型旨在说明市场运作的各种方式,特别强调透明和不透明的市场。该模型假设交易者如何进入市场的特定分布,包括知情和不知情的交易者。在一个透明的市场中,所有第二期的交易商都可以获得一阶信息,并可以根据订单流的相关性来识别知情交易者。相反,在不透明的市场中,只有执行第一个订单的交易商才知道其内容,从而使定价更加复杂。在透明的市场中,使用标准的 Milgram 损失定价,而在不透明的市场中,经销商必须对知情的交易者进行有根据的猜测才能相应地定价。

接下来,讲师讨论了金融市场的市场微观结构以及交易商如何定价以产生利润。不知情经销商的报价是基于预期值,而知情经销商的报价低于不知情经销商的报价。不知情的交易商扩大他们的价差以避免亏本交易。拥有信息的经销商 I 旨在通过向不知情的交易者提供没有吸引力的价格来获利。信息产生的利润在第一期引发了报价战,双方在第二期竞相吸引订单流量并赚取利润。

演讲者进一步解释了知情交易商在第二阶段获得的每笔交易利润,以及它如何导致半价差减少至特定值。该模型假设利润 (pi) 大于一半,并讨论了与负半价差相关的不适。探讨了该模型中的价格发现,包括剩余方差表达式的计算和模型中的潜在事件。讲座通过检查不同情况下知情和不知情交易者的行为来结束本节。

接着,演讲者谈到了交易价格的计算和复制过程,以确保计算的准确性。卖出和买入资产的概率平分,决定成交价格是a1t还是b1t。分别考虑概率 pi 和 1-pi/2,重复计算知情和不知情交易者的卖单概率。利用模型的对称性,简化了 p1t - v 期望平方的表达式,证明上下括号相等。得到的第一个括号进一步简化为 (1 + pi)/2。

然后讲座继续解释两个时期价格的剩余方差的计算,重点是透明度下的第二个时期。在交易者被告知概率为 pi 的情况下,残差方差为零,而在交易者不知情的情况下(概率为 1 减去 pi),残差方差等于 sigma,表示价格回归 mu。通过随时间对这两项求平均,推导出透明度下残差的表达式。

此外,还讨论了在不透明的情况下第一期的预期价格方差的计算。它被确定为等于透明度下的预期价格差异。计算涉及对半价差的代数操作,并考虑两种情况:一种是资产具有高价值并且两个交易者都想购买,另一种是资产具有高价值并且交易者愿意出售。最终的等式包括 pi、sigma、mu 和四 pi 平方 sigma 平方等项,这些项逐渐简化以确定预期价格方差。

演讲者继续比较不透明和透明情况下的剩余价格差异。通过执行代数计算,他们证明了透明下的剩余价格方差低于不透明下的剩余价格方差,表明透明下更好的价格发现。虽然这个结果看起来很直观,但得出这个结论所涉及的计算并不完全简单,而且涉及复杂的数学方程式。讲座最后指出,这完成了对练习的探索,并提到剩下的两个问题将在稍后讨论。

接近尾声时,讲师说明了接下来两个练习的时间安排,建议它们可能比预期更早完成。他们建议在继续之前休息一下,并在休息结束后主动回答有关前一个问题的任何问题。

  • 00:00:00 该视频讨论了金融市场流动性的价值,并重点介绍了戈登模型及其在增加股息时的影响。该模型假设投资者来到市场购买一只股票,持有一段时间,然后以恒定的相对价差卖出。投资者有一个要求的回报率,用小 R 表示,通常由一些外部期权给出。然后,视频探讨了交易成本回报的增长是如何定义的,并试图确定股票派发股息时对流动性溢价的影响。

  • 00:05:00 讲师解释了如何将股息纳入投资者从股票中获得的名义回报率(定义为 1 加 R)。投资者收到股息和股票价格的变化,这可以看作是两种回报来源。讲师将带股息的R定义为R = (μT + 1 + D) / μT,其中μT表示股票的旧基本价值,D是在时间T + 1支付给投资者的股息。还有其他解释,包括股息与股价成比例的股息,由于股价的上涨,股息也会产生更高的股息。但是,从数据上看,这个名义回报率并不完全是投资者因买卖资产时的利差和非流动性溢价等其他因素而获得的回报率。

  • 00:10:00 演讲者通过检查利差、所需回报率和股息率之间的联系来解释均衡总回报的概念。投资者以 mu T 乘以 1 加 s 对 2 的价差购买资产,而卖出价格是 mu t 加 1 乘以 1 减 s 对 2。通过代入资产价格并进行一些代数计算,演讲者得出结论在表达式 1 加上大写 R 等于 1 加上小 R 加上传播时间 D 减去 D 除以 1 加上 s 超过 2 的分数。演讲者得出结论,重新排列这个表达式将 1 加上大写 R 放在左边,其余变量放在右侧。

  • 00:15:00 讲师解释了问题 B 部分的代数解决方案,然后回答 C 部分,该部分涉及确定流动性溢价如何响应股息收益率 (D) 的增加及其直觉。流动性溢价是名义回报率与风险调整后回报率之间的差额。 D 的流动性溢价正在下降,这意味着股息收益率的增加会降低流动性溢价,因为股息不受股票流动性的影响。因此,随着股息在投资者回报中所占份额的增加,投资者遭受的流动性影响较小,从而降低了所需的流动性溢价。

  • 00:20:00 讲师讨论问题集 #2 中的练习 #2,其中涵盖数据内核帕特森模型及其对 Phi 的反应,Phi 是遇到经销商的概率。该模型的特点是缺乏基本价值的单一资产,而是支付不同交易者不同估值的股息。交易者可以持有一个或零个单位的资产,但他们不能卖空或囤积。要求的回报率是 R,交易者可以去支付利息的银行作为外部选择。交易者在每个时期以 sigh 的概率在高价值投资者和低价值投资者之间随机切换,并且必须以 Phi 的概率寻找经销商买卖资产。经销商不持有库存,不与贸易商讨价还价。

  • 00:25:00 演示者探讨了找到经销商的概率 (Phi) 对模型中生成的点差的影响。价差主要受经销商市场力量的影响,因为模型中没有私人信息或逆向选择。 Phi 对价差的影响是非单调的,取决于价值转换的概率 (sy)。如果 sy 很高并且交易者希望频繁交易,不会长期持有资产,并且不会长期没有资产,则找到交易商的可能性越高,点差就越大。但是,如果 sy 很低,则找到经销商的概率越高,价差就越低。演示者讨论了主导不同 sy 值的潜在积极和消极影响。

  • 00:30:00 讲师讨论交易员如何随着流动性增加而提高资产估值。这是因为更高的流动性使交易者能够更频繁地找到交易商,从而使他们能够更快地进行交易,并减少因转向低估值股息而遭受的损失。因此,当流动性高时,交易者愿意为资产支付更多费用,从而导致资产价值增加。讲师进一步解释说,经销商的议价能力也会在市场效率低下方面发挥重要作用。

  • 00:35:00 该视频讨论了如何用 S 衡量交易商的利润,以及为什么价差可能会随着 Phi 的增加而增加,因为交易者更愿意购买资产并为其支付更多费用。然而,交易商占用固定份额的盈余,当 Phi 增加时,交易商的市场力量下降,导致价差随着交易商变得更具竞争力而减少。这是两种相互抵消的影响,取决于 Phi 是高还是低,这意味着它们中的一个在每种情况下都占主导地位,尽管尚不清楚原因。

  • 00:40:00 讲师总结练习课并总结讨论的要点。他们提到在转换价值时与经销商会面的重要性,以及这与处理信息和库存效应的关系。课程以金融市场泡沫的下一个主题的预览结束,讲师承诺这将是有见地和有趣的。
Exercise class 5, part 2 (Financial Markets Microstructure)
Exercise class 5, part 2 (Financial Markets Microstructure)
  • 2020.05.01
  • www.youtube.com
Exercise class 5, part 2Financial Markets Microstructure course (Masters in Economics, UCPH, Spring 2020)***Full course playlist: https://www.youtube.com/pla...
 

Two Sigma 介绍了量化金融中序列的深度学习 David Kriegman


Two Sigma 介绍了量化金融中序列的深度学习 David Kriegman

在演讲中,演讲者介绍了此次活动并提供了 Two Sigma 的背景信息,这是一家著名的金融科学公司,将科学方法应用于金融领域。他们强调,Two Sigma 在金融领域的多个业务领域开展业务,包括量化对冲基金、经纪自营商服务、私人投资、保险和投资者解决方案。演讲者强调听众背景的多样性,表明讲座将迎合各个专业水平的个人,展示深度学习如何有效应用于量化金融。值得注意的是,他们提到 Two Sigma 在全球雇用了大约 1600 名专业人员,其中 600 人拥有高级学位,200 多人拥有博士学位。

接下来,演讲者介绍了序列深度学习的概念,并说明了它在过去十年中对各种应用的影响。他们提供了情感分类、视频活动识别和机器翻译等示例。演讲者解释说,序列处理任务涉及将序列作为输入并生成序列作为输出,其长度可能会有所不同。具体来说,他们讨论了深度学习在使用历史序列预测股票市场价值方面的应用。演讲者强调了预测高点和低点以最大化盈利能力的重要性。

接下来,演讲者深入探讨了金融领域典型的量化投资渠道,其中包括做出投资决策所涉及的一系列过程。他们概述了管道的两个关键阶段:alpha 建模和特征提取。 Alpha 建模涉及使用均值回归模型或动量模型预测股票价格的方向。特征提取侧重于从市场中提取技术特征,例如价格、交易量和买卖价差。演讲者强调,这些过程最终会导致有关在市场上买卖的决策,最终目标是产生利润并最大程度地减少损失。他们强调避免情绪化决策的重要性,并强调在金融领域多元化投资组合的重要性。

随后,来自 Two Sigma 的 David Kriegman 上台讨论了在股票交易中做出明智决策的关键因素。强调的第一个因素是收集基本数据,这些数据可以通过公司的直接报告获得,也可以从公开信息中推断出来。此外,可以通过解释来自新闻、社交媒体和分析师评论等来源的非结构化数据来进行情绪分析。演讲者介绍了利用非传统来源的想法,例如停车场中的汽车数量或港口集装箱船的拥堵情况,以收集可能表明特定股票表现的信息。在使用 alpha 模型对股票表现进行预测后,管道的下一步涉及投资组合优化。此步骤通常需要解决大规模优化问题,并考虑当前股票持有量、对预测的信心、多元化要求和相关交易成本等因素。最后,执行阶段涉及在模型的帮助下做出有关订单大小、放置和类型的决策,以了解这些操作的潜在影响。

回到深度学习的话题,演讲者强调了量化金融决策管道的顺序性。然后他们将注意力转移到深度学习上,将其描述为一种以多层为特征的神经网络。演讲者讨论了神经网络自 1950 年代首次引入以来的重大发展,包括新网络架构的出现、大量训练数据集的可用性以及并行计算的进步。为了说明单个感知器背后的基本思想,演讲者解释了它如何获取输入、计算加权和并将结果传递给非线性函数。他们提到传统的激活函数,即阈值,已被称为整流线性单元 (ReLU) 的替代方法所取代,它对低于阈值的值输出零,对更高的值输出实际值。

继续神经网络的主题,演讲者介绍了多层感知器的概念。在这个架构中,每个圆圈代表一个感知器,它有自己的激活函数和一组权重。这可以由一对权重矩阵表示,允许创建更大的网络。演讲者接着讨论了神经网络在 alpha 建模中的应用,特别是在根据历史表现预测股票价格方面。该网络使用一组包括特征和价格数据的训练数据进行训练,优化目标是最小化总损失。这个训练过程涉及各种技术,例如反向传播和随机梯度下降。

为了进一步增强 alpha 模型,演讲者解释了合并多个特征的重要性,而不是依赖单一信号,例如价格或过去的历史。通过组合所有相关特征,可以创建更强大和准确的模型。然而,通过这种方法使用全连接网络可能会导致称为维数灾难的问题,因为权重的数量变得非常大,并且并非所有权重都可以得到有效训练。为了克服这一挑战,演讲者介绍了另一类称为递归神经网络 (RNN) 的序列处理网络。这些网络引入了记忆方面并向后反馈信息,在每个时刻建立一个状态。结果,减轻了具有过多权重的问题。在 RNN 中,权重在每个元素之间共享,使网络更深并提供易于处理的解决方案。

演讲者强调了训练深度网络的困难以及门控网络(例如门控循环单元 (GRU) 和长短期记忆 (LSTM) 网络)如何应对这些挑战。门控网络包含控制信息流的模拟门,并能够用潜在的新状态更新以前的状态。这些网络的组件是可区分的,允许使用反向传播对它们进行训练。与 LSTM 相比,GRU 具有更长的记忆能力。

演讲者讨论了序列深度学习中使用的各种架构,介绍了 LSTM 和 GRU 网络,以及卷积神经网络 (CNN)、注意力机制和转换器等最新发展。他们还涉及强化学习,它可以优化顺序决策过程,例如那些涉及交易和市场互动的过程。虽然强化学习在游戏中取得了成功,但将其应用于金融需要合适的模拟器、强大的软件基础设施和大量的计算资源。总的来说,演讲者强调所讨论的不同架构和模型代表了量化金融的强大工具,每种都有自己的优势和挑战。

回到 David Kriegman 的贡献,他阐明了量化金融中使用的管道,以及如何训练深度神经网络来实现它的不同部分。他重点介绍了 Two Sigma 的广泛业务,其中涉及每天交易数千种股票并做出数亿个决策。处理如此大量的数据需要强大的计算能力、强大的软件基础设施和富有创造力的团队。针对深度神经网络缺乏可解释性和可解释性及其对策略开发的影响的担忧,Kriegman 解释说,某些架构可以引入可解释的表示。他还强调,在快速变化的交易场景中,需要不同的分布。此外,Two Sigma 还包括在极端市场事件期间监控和实施系统的人工交易员。

演讲者讨论了深度学习方法如何与量化金融中有效市场的假设相互作用。虽然市场通常被认为是高效的,但深度学习可以促进对信息的更快响应,并提供吸收数据的替代方法,从而可能识别低效率和投资机会。他们还强调了计算机视觉技术在金融内顺序建模中的相关性,特别是在从非结构化数据中提取特征的初始阶段。 Two Sigma 积极寻找个人担任工程和建模角色,虽然不同的角色对应不同的团队,但深度学习的应用遍及整个组织。我们鼓励应届大学毕业生和理学硕士级别的申请者通过 Two Sigma 网站申请。

在问答环节中,演讲者解决了与将深度学习应用于量化金融相关的几个挑战。一个主要挑战是金融时间序列缺乏平稳性,因为深度学习模型在未来与过去相似时表现最佳。为了解决这个问题,演讲者强调了模拟和预测引入域转移方法的重要性,使模型能够适应不断变化的市场条件。此外,演讲者指出,与其他领域相比,量化金融的错误率普遍较高,即使略高于 50% 也能在交易中提供显着优势。

当被问及对量化金融的潜在影响时,演讲者提到深度学习和神经网络的几乎每个研究领域都具有潜在的影响。他们特别强调强化学习和域迁移是他们感兴趣的领域。此外,他们承认金融领域的数据存储挑战,并建议数据压缩技术有助于解决这些问题。

演讲者扩展了负责在量化金融中实施深度学习模型的工程团队的主题,解释说该团队从事各种任务,包括存储管理、物理系统以及构建在这些系统之上的层。他们强调,深度学习模型和统计建模都根据具体用例发挥各自的作用。然而,他们指出,如果深度模型被简化为线性回归的退化形式,它就会失去其内在的兴趣和力量。

该演讲强调了深度学习在量化金融中的应用,特别是在序列处理和决策管道的背景下。它强调了在该领域使用深度神经网络时出现的挑战和机遇,包括对可解释性、解决非平稳性和利用多样化架构的需求。在整个演示过程中,Two Sigma 被描述为一家积极将深度学习技术融入其运营并积极寻找人才加入其团队的知名公司。

  • 00:00:00 演讲者介绍了此次活动并提供了 Two Sigma 的一些背景信息,这是一家将科学方法应用于金融的金融科学公司。他们解释说,该公司在金融领域开展各种业务,包括量化对冲基金、经纪自营商、私人投资、保险和投资者解决方案。他们还谈到了听众背景的多样性,并强调他们的演讲将在各个层面提供一些关于深度学习如何应用于量化金融的想法。最后,他们提到全球有 1600 人在 Two Sigma 工作,其中 600 人拥有高级学位,200 多人拥有博士学位。

  • 00:05:00 演讲者介绍了序列深度学习的概念,以及它在过去十年中如何影响各种应用,例如情感分类、视频活动识别和机器翻译。他解释说,序列处理任务将序列作为输入并产生序列作为输出,这些序列的长度可能相同或不同。演讲者还谈到了使用过去序列预测股票市场价值,并强调了预测高点和低点以赚取更多资金的重要性。

  • 00:10:00 演讲者解释了金融领域典型的量化投资管道,涉及一系列做出投资决策的过程。这包括 alpha 建模,即通过均值回归模型或动量模型预测股票价格的方向,以及特征提取,即涉及价格、交易量和买卖价差等技术特征。管道最终导致在市场上购买或出售的决定,目标是不亏本和盈利。演讲者强调了在金融领域避免情绪化决策和多元化投资组合的重要性。

  • 00:15:00 Two Sigma 的 David Kriegman 介绍了在股票交易中做出决策时要考虑的各种因素。首先是收集基本数据,这些数据可以由公司直接报告或根据公开信息推断。此外,可以通过解释来自新闻、社交媒体和分析师评论等来源的非结构化数据来进行情绪分析。非传统来源,例如停车场中的汽车数量或港口中停靠的集装箱船数量,也可以提供有关特定股票表现的信息。在使用阿尔法模型对股票表现做出预测后,下一步就是优化投资组合。这通常通过大规模优化问题来处理,并且需要确定已持有的股票数量、对预测的信心、投资的多元化程度以及与交易相关的成本。最后,执行是决定订单大小、位置和类型的最后一步,并使用模型来了解所采取行动的影响。

  • 00:20:00 演讲者介绍了量化金融中买卖决策的流程,包括特征提取、alpha 建模和执行,并强调了流程的顺序性。然后重点转移到深度学习,这是一种以大量层为特征的神经网络。演讲者解释了自 1950 年代首次引入神经网络以来发生的关键变化,例如新的网络架构、海量训练数据和大规模并行计算。演讲者随后说明了单个感知器的基本概念,它接收输入并计算加权和,然后再将结果通过非线性函数传递。传统的激活函数是一个阈值,但已被称为整流线性单元 (ReLU) 的替代函数所取代,该函数对小于阈值的值输出零,否则输出实际值。

  • 00:25:00 演讲者介绍了多层感知器的概念,其中每个圆圈代表一个具有自己的激活函数和一组权重的感知器。这可以由一对权重矩阵表示,允许创建更大的网络。接下来,演讲者讨论了使用神经网络进行 alpha 建模以根据过去的表现预测股票的价格。该网络使用一组包括特征和价格数据的训练数据进行训练,优化目标是最小化总损失。这是通过一系列训练技术实现的,例如反向传播和随机梯度下降。

  • 00:30:00 演讲者讨论了如何使用多种特征而不是仅使用一种信号(例如价格或历史记录)来构建 alpha 模型。通过获取所有相关特征并将它们组合起来,可以创建更强大的模型。但是,通过这种方法使用完全连接的网络会产生一个问题,因为权重的数量可能非常大,并且并非所有权重都可以训练。为了解决这个问题,演讲者介绍了另一类序列处理网络,称为递归神经网络。这些网络引入了记忆方面并向后反馈信息,在每个时刻建立一个状态,从而减轻了权重过多的问题。这些网络中的权重在每个元素之间共享,使该网络更深,并提供易于处理的解决方案。

  • 00:35:00 演讲者讨论了训练深度网络的困难,以及 GRU 和 LSTM 等门控网络如何通过允许信息向后传播更远的时间来解决这些问题。门控网络使用模拟门来控制有多少信息流过并用潜在的新状态更新先前的状态。门控网络的组件是可区分的,因此可以通过反向传播进行训练。与代表长短期记忆的 LSTM 相比,GRU 具有更长的记忆力。

  • 00:40:00 演讲者讨论了序列深度学习中使用的各种架构,包括 LSTM 和 GRU 网络,以及卷积神经网络、注意力机制和转换器等最新发展。他们还引入强化学习,优化顺序决策过程,例如那些涉及交易和与市场互动的过程。虽然强化学习在游戏中取得了成功,但将其应用于金融需要良好的模拟器、软件基础设施和大量计算。总的来说,所讨论的不同架构和模型代表了量化金融的强大工具,每种都有自己的优势和挑战。

  • 00:45:00 David Kriegman 讨论了量化金融中使用的管道,以及如何训练深度神经网络来实现其中的一部分。他提到 Two Sigma 规模庞大,每天交易数千种股票并做出数亿个决策。为了处理如此庞大的数据量,他们需要大量的计算能力、良好的软件基础设施和富有创造力的人才。当被问及与深度网络相关的缺乏可解释性和解释性以及它如何影响策略开发时,Kriegman 解释说,一些架构可以引入可解释的表示,并且有一些交易决策发生得很快,需要不同的分布。此外,Two Sigma 有人工交易员在极端市场事件中监控和实施系统。

  • 00:50:00 演讲者讨论了深度学习方法如何与量化金融中有效市场的假设相互作用。虽然市场通常是有效的,但深度学习可以帮助更快地响应信息并以不同的方式吸收信息,从而潜在地识别低效率和投资机会。计算机视觉的某些方面也可能与金融中的顺序建模相关,特别是在从非结构化信息中提取特征的早期阶段。 Two Sigma 积极招聘工程和建模角色,虽然不同的角色映射到不同的团队,但整个组织都有深度学习的明确应用。鼓励最近的大学毕业生和理学硕士级别的申请者通过 Two Sigma 网站申请。

  • 00:55:00 演讲者解决了有关将深度学习应用于量化金融的挑战的问题。具体来说,金融时间序列缺乏平稳性给深度学习带来了问题,而深度学习在未来看起来很像过去时效果最好。为了解决这个问题,人们可以在多大程度上模拟和预测并引入域转移方法是至关重要的。此外,演讲者指出,该领域的错误率高于大多数领域,高于 50% 可以在交易中占据优势。当被问及对量化金融的潜在影响时,演讲者提到深度学习和神经网络的几乎每个研究领域都具有潜在的影响,特别是强化学习和领域迁移。最后,还有数据存储问题需要解决,数据压缩技术在这个过程中很有帮助。

  • 01:00:00 演讲者解释了负责执行量化金融深度学习模型的工程团队的多样性。该团队负责各种任务,包括存储、物理系统以及位于这些物理系统之上的层。此外,当谈到深度学习模型与统计建模时,两者都根据使用情况发挥作用,如果深度模型变成线性回归的退化形式,它就不再有趣了。
 

两个西格玛呈现:金融数据的机器学习模型


两个西格玛呈现:金融数据的机器学习模型

来自 Two Sigma Securities 的 Justin Ceriano 就金融领域的机器学习模型集成进行了全面的介绍。他首先强调了金融公司对利用机器学习来增强其预测能力和决策过程的兴趣日益浓厚。具体来说,机器学习算法可用于预测金融工具的未来价格并确定最佳交易策略。

Ceriano 引入了强化学习的概念,它属于一类能够直接从可用数据中学习决策策略以最大化适当目标函数的方法。强化学习在金融领域被证明特别有价值,其目标是根据历史数据优化结果。

讨论的基本方面之一是应用机器学习模型来分析电子市场中的限价订单簿。在这个系统中,买家和卖家提交订单,指定他们愿意买卖特定资产的价格。然后根据最佳可用询价或买价匹配这些订单。 Ceriano 强调,代表股票可见供求关系的订单簿数据形成了一个高维序列,可以有效地利用机器学习模型预测未来的价格变化。

此外,Ceriano 强调了在交易策略中考虑非零点差的重要性。这些价差会影响价格预测的盈利能力,因此需要仔细评估和调整。

为了演示机器学习模型的实际实施,Ceriano 解释了循环神经网络的构建,该网络旨在使用高频金融数据预测价格变化。该模型经过训练以预测下一次价格变化是正数还是负数,并将其性能与线性循环模型进行比较。使用的数据集包括大约 1,000 只股票的三年逐个事件的高频数据。目的是评估非线性机器学习模型(例如循环网络)在捕获数据中的非线性关系方面是否优于线性统计模型。模型预测的优化是通过反向传播算法实现的,最大限度地减少了预测误差。为了降低计算成本,使用了截断的时间反向传播算法。

与优化递归网络相关的挑战,特别是众所周知的消失梯度问题,在演示文稿中得到了解决。梯度消失问题是指梯度在通过网络的较低层传播时变得非常小的问题。因此,这可能会阻碍训练速度,并使网络难以保留来自序列较远部分的信息。 Ceriano 引入了长短期记忆 (LSTM) 网络,这是最流行的循环网络类型之一,它专门设计用于通过有效更新记忆状态来解决这个问题,从而使模型能够从远处保留相关信息过去。

该演示文稿继续讨论使用高频订单簿数据训练和评估机器学习模型。作者将线性模型的准确性与 LSTM 循环网络的准确性进行了比较,结果清楚地表明,在三个月的样本外期间对大约 500 只股票进行测试时,深度学习模型具有优越的性能。讨论还深入探讨了订单簿数据与价格变动之间关系的普遍性,表明存在适用于多只股票的通用价格形成模型。这一发现具有重要的实际意义,例如降低计算成本以及使用另一只股票的数据改进一只股票模型的能力。

该实验旨在通过汇集来自众多股票的数据并评估其与特定股票模型相比的准确性来训练通用模型。结果始终证明通用模型的优越性,表明不同股票的订单簿动态共享通用性。这不仅可以减少过拟合,还可以提高模型的准确性。此外,通用模型在高性能计算的帮助下表现出超过一年的稳定性和可扩展性,利用 25 个具有异步随机梯度下降的 GPU。

该演示文稿还探讨了强化学习在优化订单提交策略以实现最佳执行方面的应用。重点是制定市场订单或一股有限订单的政策,旨在在离散时间间隔内最大化预期回报和成本节约。利用历史订单簿数据,强化学习模型被训练来模拟小订单的执行价格。该模型使用限价订单簿数据作为输入,确定是立即提交市价订单还是等待最佳询价下降。该模型的性能使用一年的数据进行评估,然后在单独的六个月数据集上进行测试。

给出了 100 只股票的模拟结果,考虑了 10 秒和 60 秒的时间范围,用于仅市场订单的强化学习策略和简单的限价订单策略。结果一致表明强化学习模型在 50 只股票中实现了积极的成本节约,尽管存在一些差异。此外,随着时间跨度的延长,成本节约往往会增加。该演示文稿介绍了使用历史订单簿数据来模拟提交的限价订单是否会在特定时间间隔内执行的概念。强化学习模型经过训练可以动态选择最佳时间以最大限度地节省预期成本。虽然不同股票的成本节约有所不同,但强化学习策略始终产生积极的结果,一些股票的成本节约明显高于其他股票。

该演示文稿最后解决了开发专门为金融数据量身定制的高级优化方法和深度学习架构的需求。它强调了将强化学习与准确模拟相结合以应对更大订单规模的持续挑战,以进一步加强机器学习在金融领域的应用。为了有效地掌握所讨论的概念,Ceriano 建议通过在大规模数据集上实施机器学习技术来获得实践经验。他强调了理解基础数学理论和熟练掌握 TensorFlow 和 PyTorch 等深度学习库的重要性。此外,还强调了用于并行化模型训练的高性能计算技能。

此外,主持人还讨论了 Two Sigma 的招聘政策和远程工作机会。虽然全职远程工作政策尚未到位,但 Two Sigma 雇佣了来自全球不同国家的人员,并运营一个名为 Alpha Studio 的在线团队进行远程工作。他们强调对于那些有兴趣在金融领域追求机器学习的人来说,通过多门课程获取量化金融、概率和统计知识的重要性。该演示文稿还提到了在 Two Sigma 的代码库中使用深度学习库,例如 TensorFlow 和 PyTorch。

讨论了 Two Sigma 的招聘流程,重点是全年招聘,尤其是在夏季。秋季和春季招聘例外,公司鼓励有兴趣的人尽早开始,即使这意味着从 12 月开始。主持人建议令人印象深刻的项目涉及识别真实数据中的模式和趋势,并应用机器学习方法来解决现实世界的问题。项目的所有权和突出个人在项目中的贡献被强调为招聘人员寻求的宝贵品质。还简要提到了 Two Sigma 的基础股票研究团队,该团队与工程师和数据科学家密切合作。

阐明了 Two Sigma 的数据科学家和量化研究员之间的区别。虽然这两个职位都涉及建模和交易,但数据科学主要侧重于数据科学方面和特征工程,而量化研究人员则考虑从头到尾的完整交易过程。演示者谈到了 Two Sigma 的办公室文化和会议,将会议描述为主要是非正式的,并提供用于协作讨论的白板。特定会议有时需要准备好的演示文稿。

最后,强调了使用通用模型与特定股票模型相比的好处。通用模型利用迁移学习和减轻过度拟合问题的能力被强调为一个关键优势。演示文稿最后提到录制的会议将在 Two Sigma 的 YouTube 频道上提供,并强调公司的全球招聘实践,其中大部分员工都在美国。

  • 00:00:00 来自 Two Sigma Securities 的 Justin Ceriano 介绍了金融中机器学习模型的概念。他解释了金融公司如何对使用机器学习进行预测和决策感兴趣,例如预测金融工具的未来价格和确定最佳交易策略。 Ceriano 指出,强化学习是一类方法,可以直接从数据中学习决策策略,目标是最大化一个合适的目标函数。最后,他讨论了在数据不足的情况下过度拟合的挑战、深度学习模型的好处,以及高性能计算对于在高频金融数据集上训练大型模型的重要性。

  • 00:05:00 引入电子市场限价单簿的概念,买卖双方以各自愿意买入或卖出的价格提交订单,并根据最佳卖价或买价进行撮合。股票的可见供求通过订单簿数据表示,是一个高维序列,用于使用机器学习模型预测未来价格变化。在交易策略中考虑非零点差也很重要,这可能会降低价格预测的利润。

  • 00:10:00 实施循环神经网络来预测高频金融数据中的价格变化。该模型将预测下一次价格变化是正数还是负数,并将结果与线性循环模型进行比较。该数据集包含大约 1,000 只股票的三年逐个事件高频数据。将评估深度学习模型的性能,以确定非线性机器学习模型(如循环网络)在学习数据中的非线性关系方面是否可以优于线性统计模型。反向传播算法将用于优化目标函数以最小化预测误差。通过时间算法的截断反向传播用于降低计算成本。

  • 00:15:00 视频讨论了如何优化递归网络,这在本质上类似于优化多层前馈网络。然而,梯度消失问题是一个众所周知的挑战,其中梯度的幅度相对于网络中的较低层来说很小。这会使训练变慢,训练网络记住过去很久的数据具有挑战性,并导致随机梯度下降收敛缓慢。文字记录还介绍了 LSTM 网络作为最流行的循环网络类型之一,它旨在有效地更新记忆状态,目的是帮助模型记住序列中很久以前的数据。

  • 00:20:00 作者描述了他们如何在高频订单簿数据上训练一系列机器学习模型,并在测试数据集上评估它们的性能。作者将线性模型的准确性与 LSTM 循环网络进行了比较,发现在三个月的样本外测试期间,深度学习模型在大约 500 只股票的测试数据集中明显优于线性模型。他们研究了订单簿数据与价格变动之间的关系是否在所有股票之间具有普遍性,或者个别股票是否需要自己的模型,并找到了将订单流映射到价格变化的通用价格形成模型的有力证据。他们还讨论了这一发现的实际意义,包括降低计算成本以及使用另一只股票的数据改进一只股票模型的能力。

  • 00:25:00 该实验旨在通过汇集数百只股票的数据并将其准确性与特定股票模型的准确性进行比较来训练通用模型。结果表明,通用模型始终优于特定股票模型,表明不同股票的订单簿动态具有共同的普遍性。这允许减少过度拟合并提高模型精度。此外,通用模型能够推广到新股票,在使用 25 个具有异步随机梯度下降的 GPU 的高性能计算的帮助下,展示了超过一年的模型稳定性和模型可扩展性。本节介绍的第二个示例是优化执行,其中使用强化学习来制定订单提交策略。然而,由于未知的转移概率,马尔可夫决策过程的最优策略具有挑战性。

  • 00:30:00 该视频讨论了如何使用强化学习来学习简单订单执行示例的最佳策略。强化学习模型经过训练,可以使用历史订单簿数据准确模拟小订单的执行价格。重点是市场订单或一股有限订单的最佳执行,目的是在时间范围内的每个离散时间最大化预期回报和成本节约。强化学习模型选择是提交市场订单还是等待最佳卖价下降,输入是限价订单簿数据,模型在一年的数据上进行评估,然后在六个月的数据上进行测试。

  • 00:35:00 该视频展示了 100 只股票的模拟结果,时间范围为 10 秒和 60 秒,仅适用于市场订单强化学习策略和简单限价订单策略。结果表明,强化学习模型在 50 只股票中始终提供积极的成本节约,尽管存在显着差异。考虑到更长的时间范围,成本节省通常会增加。视频还介绍了利用历史订单簿数据来模拟提交的一股限价订单是否会在该时间区间内执行,并训练强化学习模型自适应地选择时间,以最大限度地节省预期成本。结果表明,强化学习策略始终提供积极的成本节约,尽管某些股票的成本节约有所不同,而其他股票则相对较大。

  • 00:40:00 该视频强调了开发更好的优化方法和专为金融数据设计的深度学习架构的必要性。还有一些开放的挑战有待解决,例如将强化学习与准确模拟相结合,以应对更大的订单规模,以将机器学习应用于财务数据。 Justin 建议,学习机器学习的最佳方式是在大规模数据集上亲身实践并理解其背后的数学理论。必须具有 PiTorch 或 TensorFlow 等深度学习库和高性能计算方面的经验,才能并行训练模型以将机器学习应用于金融数据。最后,会议的录音将在他们的 YouTube 频道上提供,Two Sigma 在全球范围内招聘,其中大部分员工都在美国。

  • 00:45:00 Two Sigma 的代表讨论了他们在招聘和远程工作方面的政策。虽然他们没有全职远程工作政策,但他们确实雇佣了来自全球不同国家的人,并拥有一个名为 Alpha Studio 的在线团队来进行远程工作。他们还讨论了对于那些对该领域的机器学习感兴趣的人学习定量金融、概率和统计方面的多门课程的重要性。最后,演示者透露他们的代码包含深度学习库 TensorFlow 和 PyTorch。

  • 00:50:00 演讲者讨论了 Two Sigma 的招聘流程以及他们在一年中的不同时间招聘,重点关注夏季,但秋季和春季也有例外。他们还提到他们采用滚动方式招聘,并鼓励人们尽快开始,即使这意味着要在 12 月开始。就招聘人员感兴趣的项目而言,他们建议在真实数据中寻找模式和趋势,并将机器学习方法应用于现实世界的问题,重点是项目的所有权,并强调个人在他们工作的项目中拥有什么在。演讲者还提到了 Two Sigma 的基本股票研究团队,该团队与公司的工程师、数据科学家和其他业务领域密切合作。最后,他们解决了一个关于使用强化学习来优化自动交易执行的问题。

  • 00:55:00 演讲者讨论了 Two Sigma 的数据科学家和量化研究员之间的区别。虽然这两个职位都涉及建模和交易,但数据科学侧重于数据科学方面和特征工程,而定量研究则考虑交易从头到尾的全貌。演讲者还回答了有关 Two Sigma 的办公室文化和会议的问题,解释说虽然偶尔会有会议需要准备好的演示文稿,但会议通常是随意的,可以使用白板进行讨论。最后,演讲者讨论了通用模型与特定股票模型的优势,将迁移学习和过度拟合问题的可能性作为在组合数据集上训练的单一通用模型可能优于专用模型的原因。
 

算法交易成功的关键 |播客 |陈奕迅博士


算法交易成功的关键 |播客 |陈奕迅博士

量化交易,或一般的交易,被认为是最具挑战性的职业之一,需要进入并取得成功。DE Shaw 博士是量化交易的先驱,也是纽约一家价值数十亿美元的对冲基金的创始人,他承认,随着时间的推移,这个领域变得越来越具有挑战性。这种情绪得到了业内许多经验丰富的交易员的响应。

尽管困难重重,但对于热爱量化交易的人来说,量化交易仍然值得追求。就像成为一名成功的演员、歌手、模特或小说作家一样,在算法交易中取得成功需要奉献和毅力。虽然不是每个人都能达到像 DE Shaw 或 Renaissance Technologies 这样的知名交易员的水平,但有抱负的交易员不应该气馁。为失败做好准备很重要,因为在这个领域的成功是一个例外。

对于尚未从事金融行业的个人,建议不要在毕业并开始他们的第一个交易策略后立即辞掉他们的日常工作。在考虑全职交易之前,建议至少有两种盈利的交易策略运行两年。该建议基于个人经验和其他成功交易者的经验。

交易者经常犯错误,对策略过去的表现过于乐观,导致他们的杠杆率过高。避免过度杠杆是至关重要的,因为它可以迅速消灭账户的资产。此外,策略性能通常不会以相同的方式继续趋势。仅根据过去的表现来分配资本是一个常见的错误。相反,风险平价分配通常是更好的方法,其中资本分配与策略的波动性成反比。

另一个常见的错误是未能在繁荣时期将利润投资于数据设备和人员。必须将部分利润再投资以改善数据基础设施和雇用技术人员,因为这有助于防止未来缩编。

积极的一面是,建议从具有直觉理由的简单策略开始。在深入研究递归神经网络或深度学习等更复杂的方法之前,理解和改进现有策略是明智的。通过从简单的策略开始,交易者可以更好地理解成功或失败背后的原因,并将其归因于特定因素。

总而言之,量化交易是一项具有挑战性但潜在回报丰厚的职业。它需要毅力、不断学习和谨慎的决策。虽然有一些陷阱需要避免,但也可以从有经验的交易者那里学到宝贵的经验教训。通过从简单的策略开始,管理风险,投资基础设施和人员,有抱负的交易者可以增加他们在量化交易领域的成功机会。

Keys to Success in Algorithmic Trading | Podcast | Dr. E.P. Chan
Keys to Success in Algorithmic Trading | Podcast | Dr. E.P. Chan
  • 2020.07.02
  • www.youtube.com
Dr. Ernest P. Chan is the Managing Member of QTS Capital Management, LLC. He has worked for various investment banks (Morgan Stanley, Credit Suisse, Maple) a...
 

“基本统计套利:了解配对交易背后的数学”,作者:Max Margenot


“基本统计套利:了解配对交易背后的数学”,作者:Max Margenot

欢迎来到 Quanto Peon 算法交易聚会,这是一个致力于探索量化金融世界的活动。我是 Quanto Peon 的数据科学家 Max Margit,今天我将深入探讨统计套利这一引人入胜的话题以及与之相关的基本统计概念。

在深入探讨理论方面之前,让我向您简要介绍一下 Quanto Peon。我们的主要目标是通过提供免费的开源工具使每个人都能获得量化金融,这些工具使个人能够研究和开发自己的算法交易策略。算法交易涉及使用指令在金融市场中自动执行交易,范围从简单的规则(例如每天上午 10:00 购买 Apple 股票)到使用统计模型的更复杂的定量分析。

统计套利是今天讨论的焦点,它围绕着利用统计分析而不是依赖物理失衡来利用市场的低效率展开。这种方法旨在识别和利用资产价格的统计失衡。为了更好地理解这个概念,了解一些基本的统计概念至关重要。

我们将探讨的关键概念之一是平稳性,尤其是在时间序列数据的背景下。平稳性是指一系列数据点,其中每个样本都是从相同的概率分布中抽取的,并且随着时间的推移具有一致的参数。简单来说,这意味着数据的均值和标准差随时间保持不变。这很重要,因为金融中使用的许多统计模型都假定平稳性。通过确保平稳性,我们可以相信从这些模型中获得的结果。

为了说明平稳性的概念,让我们生成一些数据点。我将使用一个名为“generate_data_point”的基本函数从标准正态分布创建一组样本。这些样本代表通常称为白噪声的固定时间序列。在这种情况下,均值为零,标准差为一。当我们绘制这些数据时,我们观察到一个类似于白噪声的随机模式。

然而,并非所有时间序列数据都表现出平稳性。如果我们引入均值趋势,时间序列就会变得不稳定。在金融领域,非平稳性可能比这个简单的例子复杂得多。描述性统计,例如均值,对于非平稳数据变得毫无意义,因为它们不能准确地代表整个时间序列。

现在,我们如何确定时间序列是否平稳?这就是假设检验发挥作用的地方,例如平稳性分析中常用的增强 Dickey-Fuller 检验。该测试帮助我们评估给定时间序列非平稳的概率。

让我们将增强的 Dickey-Fuller 测试应用于我们生成的时间序列数据。该检验提供了一个 p 值,它表示拒绝时间序列非平稳原假设的可能性。在我们的第一个例子中,数据被故意生成为静止的,p 值接近于零。这使我们能够拒绝原假设并得出时间序列可能平稳的结论。另一方面,在引入趋势的第二个示例中,p 值超过阈值 (0.01),我们无法拒绝原假设,表明时间序列可能是非平稳的。

但是,重要的是要注意假设检验有局限性。可能会出现误报,尤其是在处理财务数据中微妙或复杂的关系时。因此,必须谨慎行事,而不是仅仅依靠假设检验来确定平稳性。

现在,让我们将注意力转移到配对交易上。如果我想进行配对交易,我需要考虑多个配对并在每个配对上进行独立下注。通过交易 100、200 甚至 300 对来分散我的投资组合,而不是依赖单一货币对,这让我可以利用我在每一对中可能拥有的任何优势,从而增加我的整体成功机会。

交易对需要一个强大的框架来有效地管理和监控交易。这涉及不断更新货币对之间的关系并相应地调整位置。由于表示对之间关系的 beta 值会随时间变化,因此我需要一个能够动态适应这些变化的系统。

此外,为每笔交易制定明确的退出策略至关重要。如果货币对不再表现出预期的行为或者货币对之间的关系破裂,我必须确定何时平仓。这需要持续监控价差并具有预定义的退出交易标准。

此外,风险管理在配对交易中起着重要作用。根据波动性、相关性和整体投资组合敞口等因素仔细计算每对的头寸规模至关重要。通过分散交易和有效管理风险,我可以最大限度地减少不利市场条件的影响并最大限度地提高潜在利润。

为了有效地实施配对交易策略,交易者通常依赖先进的量化技术和开发复杂的算法。这些算法自动扫描市场以寻找潜在货币对,评估它们的协整和统计属性,并根据预定义的标准生成交易信号。

总之,在为算法交易构建统计模型时,了解平稳性并进行适当的测试至关重要。通过掌握平稳性的概念并使用增强的 Dickey-Fuller 测试等测试,交易者可以评估时间序列数据中出现非平稳性的可能性。配对交易作为一种统计套利策略,允许交易者利用两种相关证券之间历史关系的暂时偏差。然而,成功实施需要稳健的框架、持续监控、风险管理和使用先进的定量技术。

在 Quanto Peon,我们通过我们的 Quanto Peon 系列讲座提供有关统计和金融的免费讲座,努力弥合金融与技术之间的差距。我们的使命是使量化金融民主化,并为个人提供工具和知识来开发他们的算法交易策略。

"Basic Statistical Arbitrage: Understanding the Math Behind Pairs Trading" by Max Margenot
"Basic Statistical Arbitrage: Understanding the Math Behind Pairs Trading" by Max Margenot
  • 2017.07.25
  • www.youtube.com
This talk was given by Max Margenot at the Quantopian Meetup in Santa Clara on July 17th, 2017. To learn more about Quantopian, visit: https://www.quantopian...
 

金融数学的布朗运动 | Quants 的布朗运动 |随机微积分


金融数学的布朗运动 | Quants 的布朗运动 |随机微积分

你好,YouTube,欢迎回到 ASX 投资组合频道。我叫乔纳森,今天我们将深入探讨布朗运动的迷人世界,特别是在金融数学的背景下。这是一个至关重要的主题,因为它构成了随机过程和随机微积分的基础,这在金融数学领域是必不可少的。布朗运动是伊藤积分的基础,意义重大,理解它至关重要。在以后的视频中,我们将进一步探索数学,涵盖几何布朗运动、其应用和伊藤积分等主题。如果您想继续关注即将发布的视频,请务必点击订阅按钮。

在本视频中,我们将浏览我准备的一个 Jupyter notebook,以解释布朗运动是什么以及它是如何产生的。那么,让我们直接进入。我们将从考虑对称随机游走开始,然后转向缩放随机游走,展示它们如何收敛到布朗运动。在整个解释过程中,我们将使用 Steven Shreve 的书“金融随机微积分 II”中的符号和示例。

首先,重要的是要了解布朗运动的主要属性如下:它是一个鞅,这意味着期望完全基于粒子或股票价格的当前位置。此外,它是一个马尔可夫过程,它会累积二次方差。二次变分是随机微积分中的一个独特概念,使其有别于普通微积分。在这一集中,我们将深入探讨二次变差的含义。

如果您想跟随代码,可以在我的网站上找到它。我已经导入了本次演示所需的必要依赖项。重要的是要注意,布朗运动是一个随机过程,出于我们的目的,我们将考虑具有结果和过滤 F 的过滤概率空间,以及概率空间 P。这里,我们在区间内有一组真实结果从 0 到时间 T。

布朗运动的初始值始终为零。它具有独立增量,服从高斯分布,并且几乎可以肯定地表现出连续的样本路径。我们将详细解释所有这些属性。

让我们从最简单的例子开始:对称随机游走。如果您不熟悉随机游走的概念,请将其视为一系列连续的硬币抛掷。由变量 omega 表示的每个结果可以是正面或反面。我们将使用变量 X_j 来表示每个结果,正面为 1,反面为 -1。

如果我们定义一个 m_0 等于 0 的过程,那么 m_k 将是 k 次抛硬币的所有可能抛硬币路径的总和。在这种情况下,我们有一个随机游走,其中进程可以向上移动 1 或向下移动 1,我们将这些路径上的增量相加。我编写了一个脚本来在 10 年的时间范围内生成 10 个样本路径。该图演示了随机游走如何在每个时间步沿路径向上或向下移动 1。

这个例子揭示了一些有趣的特性。首先,时间段之间的增量,例如m_k+1 - m_k,是独立的。此外,这些独立增量的期望为零,方差等于时间差或时间步长之间的距离(k_i+1 - k_i)。方差以每单位时间一个的速率累积。

此外,对称随机游走是一个鞅。这意味着给定当前位置,下一个值的条件期望等于当前位置。在对称随机游走的背景下,期望

从我们离开的地方继续,在下一个视频中,我们将探索如何使用 Python 创建几何布朗运动的样本。几何布朗运动是金融数学中常用来模拟股票价格的随机过程。这是在该领域需要理解的基本概念。

但在我们深入探讨之前,让我们回顾一下布朗运动的一些关键属性。布朗运动是一个随机过程,具有以下几个特性:

  1. 独立增量:布朗运动的增量是独立的,即任意两点之间的变化与其他任意两点之间的变化无关。

  2. 高斯分布:布朗运动的增量服从高斯分布或正态分布。这种分布描述了各种结果的概率,是概率论中的一个基本概念。

  3. 连续样本路径:布朗运动具有连续的样本路径,这意味着它在每个时间段都是不可微的。这一特性使其适用于对具有随机波动的各种现象进行建模。

  4. 二次变分:二次变分是随机微积分中布朗运动的独特性质。它测量随时间累积的波动,对于理解随机过程的行为至关重要。

现在,让我们讨论几何布朗运动。几何布朗运动是布朗运动的扩展,包含指数增长。它通常用于模拟股票价格等金融资产的行为。几何布朗运动具有以下形式:

dS(t) = μS(t)dt + σS(t)dW(t)

其中,S(t) 表示时间 t 的资产价格,μ 是预期回报率或漂移率,σ 是回报率的波动率或标准差,dt 是一个小的时间间隔,dW(t) 是一个标准的布朗运动增量。

为了模拟几何布朗运动,我们可以使用欧拉方法或 Itô 积分等数值方法将过程离散化。这些方法允许我们使用一系列离散步骤来近似连续过程。

在接下来的视频中,我们将探讨几何布朗运动的数学细节及其在金融数学中的应用。我们还将提供 Python 中的实际示例和代码片段,以模拟和可视化几何布朗运动。

如果您有兴趣了解有关此主题的更多信息,请务必订阅我们的频道并继续关注下一个视频。我们期待与您分享更多见解。感谢您的关注,下期视频见!

Brownian Motion for Financial Mathematics | Brownian Motion for Quants | Stochastic Calculus
Brownian Motion for Financial Mathematics | Brownian Motion for Quants | Stochastic Calculus
  • 2021.09.09
  • www.youtube.com
In this tutorial we will investigate the stochastic process that is the building block of financial mathematics. We will consider a symmetric random walk, sc...
 

在 Python 中模拟几何布朗运动 | Quant 的随机微积分


在 Python 中模拟几何布朗运动 | Quant 的随机微积分

美好的一天,YouTube,欢迎回到 ASX 投资组合频道。我叫 Jonathan,今天我们要用 Python 模拟几何布朗运动。在本教程中,我们不会介绍几何布朗运动动力学的推导,也不会涵盖伊藤微积分、伊藤积分和随机过程。但是,我们将在以下教程中详细探讨这些主题。如果您有兴趣了解更多有关它们的信息,请订阅我们的频道并按下通知铃,以便在该视频发布时收到通知。

让我们进入模拟。我将使用这个 Jupyter notebook 进行演示。首先,我们将为模拟定义参数。一年的漂移系数 mu 设置为 0.1 或 10%。我们将时间步数定义为“n”并将其设置为 100 以进行粒度模拟。时间将以年为单位,用“T”表示。模拟次数将表示为“m”并设置为 100。初始股票价格 S0 设置为 100,波动率 sigma 设置为 30。让我们导入必要的依赖项:numpy 作为 np 和 matplotlib .pyplot 作为 plt。

现在让我们模拟几何布朗运动路径。为了计算时间步长,我们将 T 除以 n。接下来,我们将使用 numpy 数组一步执行模拟,而不是遍历路径。我们将定义一个名为“st”的数组并使用 numpy 的指数函数。在函数内部,我们将定义分量:mu 减去 sigma 的平方除以 2,乘以 dt。然后,我们将 sigma 乘以 numpy 的 random.normal 函数,它从正态分布中采样,然后乘以 dt 的平方根。该数组的大小为 m x n,分别代表模拟次数和时间步长。由于我们想要对每个时间步进行模拟,因此我们将对该数组进行转置。

为了包括每个模拟的初始点,我们将使用 numpy 的 vstack 函数将一个 numpy 数组与 st 模拟数组堆叠在一起。这将确保每次模拟都以初始值开始。最后,我们将堆叠数组乘以初始值,以计算漂移、方差和随机分量方面的每日变化。这将为我们提供时间步长实现。为了随时间累积这些值,我们将沿每个模拟路径使用 numpy 的累积乘积函数,指定轴 1。这将计算每个路径的累积乘积。

现在我们有了模拟路径,让我们考虑以年为单位的时间间隔。我们将使用 numpy 的 linspace 函数生成从 0 到 T 的均匀间隔的时间步长,具有 n+1 个空格。这将为我们提供一个名为“time”的数组。接下来,我们将创建一个名为“fill”的 numpy 数组,其形状与 st 相同,以便我们可以绘制函数。我们将使用 numpy 的完整功能并将 fill_value 设置为时间。对该向量进行转置,我们可以绘制 x 轴为年份、y 轴为股票价格的图形,同时考虑到 30% 的波动和 10% 的均值增加或漂移所导致的分散这种几何布朗运动。

几何布朗运动是期权定价理论和各种金融数学应用的有用模型。我希望您能在本教程中找到价值。在下一个视频中,我们将深入研究金融数学、伊藤微积分、伊藤积分,并探索如何通过添加不同的参数来增加随机微分方程的复杂性。如果您想了解更多信息,请务必订阅我们的频道并按下通知铃,以便在下周该视频发布时收到通知。在此之前,请继续关注更多有价值的内容。感谢您的收看,我们下个视频再见。

Simulating Geometric Brownian Motion in Python | Stochastic Calculus for Quants
Simulating Geometric Brownian Motion in Python | Stochastic Calculus for Quants
  • 2021.09.15
  • www.youtube.com
In this tutorial we will learn how to simulate a well-known stochastic process called geometric Brownian motion. This code can be found on my website and is ...
 

Quants 的随机微积分 |使用伊藤微积分理解几何布朗运动


Quants 的随机微积分 |使用伊藤微积分理解几何布朗运动

美好的一天,YouTube,欢迎回到 ASX 投资组合。今天,我们将讨论为什么布朗运动不是金融市场建模的不当选择。很明显,布朗运动会导致负股价,这是不现实的。相反,我们需要一种方法来保留布朗运动的一些随机特性并将它们纳入我们的模型。这可以通过使用 Ito 过程来实现,它允许我们添加来自布朗运动的风险源。

一个著名的伊藤过程是几何布朗运动 (GBM),你们中的许多人可能都熟悉它。我们可以利用布朗运动的特性来开发更符合现实生活示例的新模型。为此,我们采用了一种特殊类型的微积分,称为伊藤微积分,它通常用于金融随机数学。

今天,我们将重点了解伊藤积分以及它如何帮助我们解决复杂问题。我们将讨论 Ito 引理,它在 Ito 演算中用作恒等式并有助于规则推导。此外,我们将探讨 Ito-Dobelin 公式和几何布朗运动动力学的推导。

要深入研究这些概念,我强烈推荐 Stephen Shreve 的第二本书“随机微积分的连续时间模型”。第 4 章涵盖了我们今天要讨论的材料。

现在,让我们首先了解什么是伊藤积分。重要的是要记住,我们将要讨论的所有数学都是基于过滤后的概率空间。这个空间包含结果、过滤和概率度量。过滤是指包含到时间 t 为止的所有信息的西格玛代数。尽管概率论很复杂,但我们今天只简单介绍一下。为了更深入的理解,我建议参考 Shreve 的书的前三章。

伊藤积分用符号 ∫δdW 表示,其中 δ 是随机过程,dW 是维纳过程。为了理解它的含义,让我们想象一下将时间段从 0 到 T 分成小的间隔。我们可以将随机过程 δ 表示为 n 次方,其中 n 表示时间间隔的数量。这个过程是经过调整的,这意味着它的值是由每个时间间隔的抛硬币结果决定的。

现在,将积分视为总和的极限,因为区间数接近无穷大。每个被加数都包含随机过程 δ 乘以维纳过程在区间之间的变化。随着区间变小,我们收敛于 Ito 积分。然而,要存在这个极限,必须满足两个条件:过程 δ 必须适应过滤,并且它必须是平方可积的。

现在我们理解了符号,让我们继续讨论一般的 Ito 过程。这些过程发生在具有相同结果空间的相同时域中。它们涉及基于时间的积分和关于 Wiener 过程的 Ito 积分。基于时间的积分类似于常规黎曼积分,而伊藤积分则捕捉了过程的随机性。这些过程可分为漂移和扩散项。

伊藤过程的一个例子是几何布朗运动 (GBM)。它包括漂移项和扩散项。漂移由常数 μ 确定,而扩散由挥发性参数 σ 控制。 GBM 的动力学可以用积分表示,如等式所示。

对此进行扩展,我们还可以考虑伊藤过程的积分。例如,伊藤过程的积分可能代表交易损益 (P&L)。

在 Itô-Doob 分解中,这个一般过程由漂移项的积分、扩散项的积分和 Itô 积分项表示。现在,Itô-Doob 公式提供了一种计算过程函数微分的方法。它指出函数的微分等于函数关于时间的偏导数,加上函数关于状态变量的偏导数乘以漂移项,再加上函数关于状态变量的偏导数乘以扩散项的状态变量,加上函数相对于状态变量的偏导数乘以 Itô 积分项的积分。

该公式使我们能够计算函数值随着过程随时间的变化而发生的变化。它是伊藤微积分的基本工具,广泛用于随机分析和数学金融。

接下来是几何布朗运动 (GBM),它是一种特定类型的 Itô 过程,通常用于对股票价格和其他金融资产的动态建模。 GBM 结合了漂移和扩散成分。漂移项表示资产的预期回报率,而扩散项则反映资产价格变动的波动性或随机性。

可以使用 Itô 微积分推导出 GBM 的动力学。通过将 Itô 公式应用于资产价格的对数,我们获得了描述价格对数随时间变化的表达式。此变化等于漂移项乘以时间增量,加上扩散项乘以 Itô 积分。通过对等式两边取幂,我们恢复了资产价格本身的动态。

了解 GBM 的动态对于期权定价和风险管理至关重要。它使我们能够对资产价格的随机行为进行建模,并估计各种结果的概率。 GBM 已广泛应用于金融数学,并成为许多定价模型的基础,例如期权定价的 Black-Scholes 模型。

总之,伊藤微积分为金融领域的随机过程建模和分析提供了一个强大的框架。通过合并 Itô 积分并应用 Itô 引理和 Itô-Doob 公式,我们可以推导出各种金融变量的动态,并开发捕捉现实市场随机特性的模型。伊藤微积分彻底改变了数学金融领域,并继续成为理解和管理金融风险的重要工具。

Stochastic Calculus for Quants | Understanding Geometric Brownian Motion using Itô Calculus
Stochastic Calculus for Quants | Understanding Geometric Brownian Motion using Itô Calculus
  • 2021.09.22
  • www.youtube.com
In this tutorial we will learn the basics of Itô processes and attempt to understand how the dynamics of Geometric Brownian Motion (GBM) can be derived. Firs...