量化交易 (Quantitative trading) - 页 7

 

Martin Scholl(牛津大学):“Studying Market Ecology Using Agent-Based Models”



Martin Scholl(牛津大学):“Studying Market Ecology Using Agent-Based Models”

牛津大学研究员 Martin Scholl 使用基于主体的模型深入研究了市场生态学。与依赖有效市场假设等假设的传统方法不同,Scholl 对新古典金融中普遍采用的理性预期均衡理论提出质疑。他认为,这一理论要求所有参与者对现实世界有一个完美的理解,考虑到散户投资者和基金经理的认知局限性,这是不现实的。相反,他提倡应用生物学工具来分析现实世界的金融数据,为理解金融市场提供全新的视角。

为了探索市场生态,Scholl 将投资策略比作生物学中的物种,个人投资者代表特定物种的个体。使用特定策略投资的总财富与该物种的丰度或总种群规模相当。在投资游戏的玩具模型中,Scholl 介绍了一个简化的场景,代理人可以选择将他们的财富留在货币市场账户或投资于支付股息的股票。该模型允许检查各种投资策略和反对新古典主义的完美理性假设。

Scholl 确定了基于代理的模型中采用的不同投资策略来研究市场生态。第一种是完全理性的策略,资产净值在股票和现金之间分配。价值投资者估计股息的增长率以做出未来预测并了解股票的未来价格。第二种策略涉及分析近期价格并推断趋势的趋势追随者。第三种策略包括进入市场以满足流动性需求但在短期内对价格不敏感的噪声交易者。然而,它们的均值反转噪声过程在很长一段时间内与基本值相关联。

为了模拟市场机制和研究市场生态,Scholl 和他的团队在软件包的帮助下使用基于代理的模型。他们通过固定禀赋并将初始禀赋分配给不同物种的个体来确保模型不同运行之间的可比性,并跟踪相对份额。模拟运行了 200 年,能够观察到每个物种的平均年回报率。有趣的是,他们发现每种策略至少有一个区域是最有利可图的,无论其丰富程度如何。

在他的实验中,Scholl 检验了趋势追随者的行为和利润再投资的影响。他观察到,市场大部分时间都处于一个不稳定、混乱的区域,存在大量异常值,导致出现斑点噪声。当投资者将他们的利润再投资时,轨迹会围绕一个确定的中心点波动,但不会完全趋同于该中心点。增加趋势追随者的集中度会导致更高的回报波动。 Scholl 将趋势追随者的快速转变归因于投资者的理性和股息过程中的正自相关。

Scholl 解释说,基于主体的模型可以用来构建金融社区矩阵,类似于生物学中使用的捕食者和猎物 Volterra 方程。特定策略的回报等同于人口规模,回报对人口规模变化的敏感性代表社区矩阵。在金融市场中,当价格偏离均衡点时,就会出现不同策略之间的竞争。 Scholl 强调,金融市场表现出密度依赖性,使得物种相互作用比生物系统中的相互作用更加复杂。这种密度依赖性导致类似泡沫的价格上涨等情况,但承认这种情况是不现实的。

在市场生态学的背景下,Scholl 讨论了他的发现的实际意义。他提出了一个线性模型,该模型使用物种的丰度来描述不同类型捕食者之间的关系,从而影响市场结果。这种方法突出了投资的多维性质,并证明了适当调整策略规模以避免损失或成为高度依赖密度的金融市场猎物的重要性。它挑战了股票价格反映所有可用基本信息的传统观点,并将金融市场呈现为受各种条件影响的复杂系统。

Scholl 进一步阐述了他在基于代理的模型中使用简单线性模型来研究市场生态。通过分析市场活动的持有量和相对丰富度,他发现这种方法优于部门派生的模型,这些模型假设理性并自动转换基本面。然而,他承认他的模型存在局限性,并强调需要进一步研究以增强其真实性。他谈到的一个方面是模型对不同配方和定义的敏感性,特别是在趋势跟踪方面。虽然股息在他的模型中发挥着重要作用,但为现实世界的金融市场纳入更现实的元素将需要额外的步骤。

关于代理人对其模型的信念的适应性,Scholl 指出,市场运作通常涉及基金经理长期遵循招股说明书中概述的策略。这表明倾向于机械资产分配过程。因此,Scholl 倾向于对适应性较低的行为和智力进行建模。不过,他强调说,他在牛津大学的团队中的其他研究人员正在积极探索进化算法在改变参数甚至创新新策略方面的应用。

Martin Scholl 的研究重点是使用基于主体的模型研究市场生态。他通过应用生物学概念更好地理解金融市场来挑战传统金融理论和假设。通过将投资策略与生物学中的物种进行比较、分析不同的策略并模拟市场机制,Scholl 揭示了金融市场的复杂性以及各种策略之间的相互作用。他的研究结果表明,金融市场高度依赖密度,适当调整投资策略对于避免损失和成为这个动态生态系统中的猎物至关重要。 Scholl 的工作对市场作为复杂系统的本质提供了宝贵的见解,与股票价格仅反映基本信息的传统观点形成鲜明对比。

  • 00:00:00 来自牛津大学的 Martin Scholl 使用基于主体的模型讨论了他对市场生态学的研究。他解释说,他没有关注有效市场假说等常见假设,而是质疑新古典金融中使用的理性预期均衡理论,因为它要求所有参与者的理解与现实世界相匹配。他还透露,金融文献中有 300 多种因子模型,很难确定最佳使用的模型,散户投资者和基金经理的认知能力也存在物理限制。此外,他还讨论了将生物学工具应用于现实世界数据以更好地了解金融市场的重要性。

  • 00:05:00 Martin 讨论了如何使用基于代理的模型来研究市场生态。他解释说,投资策略可以比作生物学中的物种,个人投资者对应于特定物种的个体。使用特定策略投资的总财富是该物种的丰度或总种群规模。 Scholl 引入了一个投资游戏的玩具模型,代理人可以选择将他们的财富留在货币市场账户或投资于支付股息的股票。该模型适用于一只股票,这是一个简化的假设,在大多数情况下允许唯一的清算价格。 Scholl 还阐述了完美理性投资者的新古典主义假设,并强调了对这种方法的反对意见。

  • 00:10:00 Martin Scholl 使用生物学的隐喻解释了市场生态学的概念。他根据参与原因对市场中的代理人进行划分,并引入超额需求函数作为定义策略的一种方式。他解释了如何在投资过程中使用信号函数,以及不同的投资基金如何根据获取的信息和分析倾向于专注于不同的事物。战略的划分在不断发展的市场中至关重要,在这种市场中,专注于特定的利基市场以优化某些事物是有益的。

  • 00:15:00 Martin Scholl 讨论了在基于代理的模型中用于研究市场生态的不同策略。第一种策略是完全理性的策略,其中资产净值在股票和现金之间分配。价值投资者估计股息的增长率来做出预测,有助于了解未来股票的价格。第二种策略是基于趋势追随者,他们查看最近的价格并推断这些趋势。最后,该模型包括进入市场以满足流动性需求但对价格不敏感的噪声交易者,因此他们的信号在短时间范围内看起来是随机的。然而,正如 Buscher 及其同事所估计的那样,他们的均值反转噪声过程在很长一段时间内与基本值相关,并且会慢慢恢复到均值。

  • 00:20:00 Martin 解释了他们如何使用基于代理的模型模拟市场机制,这使他们能够研究市场生态。由于可能的解决方案众多,因此很难对模拟进行分析处理。因此,他们使用软件包来模拟不同的市场机制。他们固定禀赋以确保模型的不同运行之间的结果具有可比性。他们还将初始禀赋分配给不同物种的个体,并记录相对份额。他们运行了 200 年的模拟,并查看每个物种的平均年回报率。他们观察到,对于所有三种策略,至少有一个区域是它们最赚钱的区域,即使该区域不是物种最丰富的区域。

  • 00:25:00 牛津大学的 Martin Scholl 讨论了一项涉及趋势追随者的实验,其中价格偏离基本价值,由于股息过程的随机实现和引入的噪音而导致巨额利润和损失。该系统的大部分设计都花在了不稳定、混乱的区域,其中有大量异常值会产生斑点噪声。在第二个实验中,投资者被允许将利润再投资,轨迹被描绘成一个单纯形,财富被重新分配,但它们隐约地向确定的中心点汇聚,而不是左右波动。系统往往在确定的有吸引力的固定点附近区域,每个交易日公布市场清算价,影响交易者的估值和价格。

  • 00:30:00 Martin 解释了在分析具有趋势追随者、价值投资者和噪声交易者的系统中的固定点时通过蒙特卡罗实验获得的不同流线。线条的粗细表示每年在策略之间重新分配的财富数量,这表明大量的趋势追随者如何在系统中造成巨大损失。 Scholl 继续强调,拥挤对趋势追随者的作用与对价值投资者的作用不同,趋势追随者的集中度增加会导致回报的波动性增加。系统快速远离趋势追随者的根本原因是投资者的理性和分红过程中的正自相关。

  • 00:35:00 Martin Scholl 解释了如何使用基于主体的模型来研究市场生态以及如何构建金融社区矩阵。 Scholl 类比生物学中种群动力学中使用的捕食者和猎物 Volterra 方程,用于描述不同种群的动态,即不同物种如何根据种群规模相互作用。他指出,这个概念也可以应用于金融市场,其中特定策略的回报将被视为种群规模,而一个物种的回归对种群规模变化的敏感性将代表社区矩阵。

  • 00:40:00 牛津大学的马丁解释了金融市场生态中的物种如何在平衡点上与自己竞争,因为所有对角线条目都是负数,所有正数条目都是正数。系统是稳定的,因为固定点是稳定的,社区矩阵对人口的某些变化具有鲁棒性。然而,当市场远离均衡点时,当价值投资者数量较多时,趋势追随者和价值投资者之间开始竞争。密度依赖性使物种之间的相互作用比生物相互作用更复杂,而且在金融领域比在自然界更常见。在价格背离的不稳定区域,趋势跟随者受益于其他趋势跟随者,价格以泡沫状方式不断上涨,但这种情况很不现实。

  • 00:45:00 Martin Scholl 在短时间内讨论了趋势追随者的好处,因为他们可以从比他们稍慢的趋势追随者那里受益,因为他们可以在顶部卖出,或者至少在价格完全崩溃之前不会卖出。然而,在这个模型中,趋势追随者很简单,并且在相同的时间尺度上运作,而不管个人的策略如何。 Scholl 还讨论了如何将被动基金或指数跟踪器表示为将财富分配给特定资产的基金。更高比例的索引器会使系统更稳定并抑制整个系统。最后,Scholl 指出,他计算了所有这些信息以了解物种之间的二元关系,从而产生了一种叫做食物网的东西。

  • 00:50:00 Martin 讨论使用基于主体的模型研究市场生态。 Scholl 解释了节点如何是不同的物种,而边缘是它们之间的相互作用。使用营养级,他们可以确定哪个物种的利润水平最低,这意味着它不捕食其他物种,而哪个物种的流量水平最高,这意味着它捕食所有其他物种,使其成为顶级捕食者。 Scholl 解释了交通水平如何根据密度发生显着变化,以及每个群体如何遵循股息折扣的事情,价值投资者捕食噪音交易者和趋势追随者利用相关性。

  • 00:55:00 Martin Scholl 解释了使用基于主体的模型研究市场生态的实际意义。基于市场质量和错误定价的实验表明,使用物种丰度的简单线性模型可以很好地描述不同类型捕食者之间的关系,从而影响市场结果。开发的模型允许观察投资如何是多维的,强调策略对市场质量有不同的影响。根据 Scholl 的研究,金融市场具有高度的密度依赖性,这意味着投资者应该适当地调整他们的策略,以避免招致损失或自己成为猎物。这种方法允许将市场描述为受各种条件影响的复杂系统,这与传统金融相反,在传统金融中,股票价格被认为反映了所有可用的基本信息。

  • 01:00:00 在视频的这一部分中,Martin Scholl 讨论了他使用简单的线性模型来研究基于主体的模型的市场生态。通过观察市场活动的持有量和相对丰富度,他发现这种方法比使用假设合理性并自动转换基本面的部门派生模型提供了更好的预测。他还讨论了他的模型的局限性以及进一步研究以使其更符合实际的必要性。他解决的一个问题是关于模型对不同配方和定义的敏感性,特别是关于趋势跟踪,他解释说这主要是由他的模型中的红利驱动的,但需要采取进一步的措施才能使其更符合现实世界的金融市场。

  • 01:05:00 Martin Scholl 讨论了他使用基于主体的模型研究市场生态的方法。 Scholl 不假设代理人能够在他的模型中调整他们的信念。几十年来,市场运作通常涉及基金经理遵循招股说明书中概述的策略,这表明资产配置过程往往是机械的。 Scholl 倾向于在他的建模中倾向于较少的适应性行为和较少的智能。然而,牛津大学研究小组中的其他人致力于应用进化算法来改变策略的参数,甚至创新新的策略。
Martin Scholl (University of Oxford): "Studying Market Ecology Using Agent-Based Models"
Martin Scholl (University of Oxford): "Studying Market Ecology Using Agent-Based Models"
  • 2022.03.23
  • www.youtube.com
Abstract: This talk presents a mathematical analogy between financial trading strategies and biological species and shows how to apply standard concepts fro...
 

凯文韦伯斯特:“价格影响如何扭曲会计损益”



凯文韦伯斯特:“价格影响如何扭曲会计损益”

在 YouTube 视频中,凯文韦伯斯特深入探讨了价格影响如何扭曲会计损益 (P&L) 报表这一主题。他强调了准确建模价格影响以有效管理风险的重要性,并强调了管理流动性风险以避免陷入流动性不足的重要性。韦伯斯特承认有多种价格影响模型可用,但他们通常同意大部分数据。

演讲首先讨论价格影响和流动性风险之间的交叉点,特别是指出在金融危机之前,主要市场的流动性通常被认为是理所当然的。韦伯斯特分享了有力的引述,说明价格影响如何产生利润幻觉,导致价格偏离财务价值。演讲的目的是在数学上将这一概念形式化,提供一个基于估计清算对市场影响的量化框架,以消除利润幻觉。

韦伯斯特将价格影响解释为交易的因果模型,其中更激进的交易进一步推动价格,反之亦然。价格影响模型广泛应用于交易成本分析和优化执行,作为预估交易成本和优化执行策略的交易前工具。他展示了一份模拟交易成本分析报告,该报告允许交易员评估他们的算法每季度的表现,重点是最大限度地减少订单滑点,并同时考虑机械变动和 alpha 滑点。

演讲者讨论了欧洲证券和市场管理局 (ESMA) 发布的有关流动性压力测试的指南,其中涉及在市场压力期间模拟资产清算。模拟市场反应(例如价格错位)和采用对冲策略对于降低风险敞口至关重要。 Webster 参考了各种关于流动性压力测试和价格对会计损益影响的文献,包括 Cascioli、Boucheron、Farmer 以及 ESMA 和 Baffled Committee 等监管委员会的著作。他强调流动性压力测试的必要性,以减轻可能影响会计损益并导致高清算成本的情况。

引入交易足迹的概念,衡量价格影响对会计损益的扭曲效应,并将不同的损益定义联系在一起。 Webster 提出了一个简单的甩卖模型来说明 Casadio-Bouchard-Farmer 论文得出的关于会计损益的重要结论。他解释了交易员和平台经理每天观察到的数字如何高估了他们的最终损益,从而导致交易完成后出现通货紧缩。然而,这种通货膨胀特性可以实时测量和显示,为交易者提供可操作的信息。韦伯斯特指出,头寸通胀损失通常是暂时的,取决于风险承受能力。

讨论了与股票头寸估值相关的问题及其对公司损益的影响。韦伯斯特强调了确定使用哪些价格来标记股票头寸的模糊性,以及会计损益与交易算法使用的基本损益之间的差异。交易足迹定义为会计损益与基本损益之间的差异,在平仓时解决了歧义。演讲者探讨了头寸膨胀,做出了该属性成立的某些假设。还涉及了撞击模型及其两个案例,即最初的 OW 痣和 Fruehwirth 和 Bond 研究的 W 痣。

韦伯斯特解释说,要使模型有意义,需要满足 lambda 和 beta 之间的无套利条件以及自筹资金方程条件。他深入研究了在收盘时计算预期损益以及交易足迹如何将偏差引入会计损益。仓位膨胀属性导致仓位在进仓阶段膨胀,在持仓阶段保持不变,最终蒸发。所有这些方面都可以在交易屏幕上实时观察,为交易者提供有价值的见解。

韦伯斯特进一步解释了价格影响导致会计损益的扭曲。他讨论了交易者如何在没有 alpha 的情况下进行有利可图的交易,但警告说由于交易成本,这些利润是短暂的。尽早监测价格错位对于避免损失至关重要。此外,韦伯斯特指出,投资组合经理更喜欢将他们的投资组合视为一个整体,并引入了固定投资组合的概念,该概念控制着数学金融世界中投资组合的规模和周转率。

然后探讨与估计运行交易成本相关的固定投资组合的概念。通过了解传播者的时间尺度,交易者可以估计他们的头寸膨胀的程度以及他们在清算头寸时可能损失的利润幻觉。韦伯斯特使用经验数据演示了该框架,展示了它对现实世界场景的适用性。他将该框架应用于甩卖模型,并解释了会计损益与基本损益之间的差异,强调了它们如何根据交易者的风险厌恶程度为不同的目标函数提供信息。

演讲者深入探讨了甩卖或其他市场参与者的交易活动对交易者损益和头寸的影响。激进的对冲会导致拥挤效应和头寸膨胀,从而导致永久性损失。准确建模价格影响对于有效的风险管理至关重要,并且强调管理流动性风险以避免最终出现流动性不足的头寸。

韦伯斯特承认,虽然有许多不同的价格影响模型可用,但它们通常同意大部分数据。但是,影响持续的程度和持续时间可能会有所不同。临时错位可持续几天到一个月。从风险管理的角度来看,有明确的行动方案,而从交易者和绩效的角度来看,有效的沟通成为关键。了解 P&L 是否是机械的并去除机械部分可以让交易者专注于他们交易中的实际 alpha 或优势。

演讲者解释了“不操纵价格”的原则,强调即使交易者获得利润,也无法维持,因为利润最终会蒸发。头寸膨胀导致交易价值随时间缩减或立即清算,导致损益为零甚至负值。因此,交易者需要依靠其他变量来产生可持续的利润。韦伯斯特进一步探讨了初始影响状态、市场其余部分造成的影响以及交易者对冲和市场其余部分的影响之间的相关性。

总之,凯文·韦伯斯特对价格影响如何扭曲会计损益提供了全面的理解。他阐明了高波动性流动性制度期间的额外成本及其与大盘的相关性,强调了它们对偏见的影响。从监管的角度来看,公司债券和保险公司可能更容易受到这种偏见的影响。虽然韦伯斯特承认他缺乏股票以外市场的详细答案,但他为理解价格影响及其对损益的潜在扭曲提供了坚实的数学基础。

  • 00:00:00 是本次关于价格影响如何扭曲会计损益的谈话的基础。讨论的动机是价格影响和流动性风险之间的交集,以及主要市场的流动性在金融危机之前往往被认为是理所当然的事实。演讲者提供了两句有力的引述,说明了价格影响造成的利润幻觉,以及它如何导致价格偏离财务价值。该演讲旨在从数学上将这一想法形式化,并提供一个基于清算的估计市场影响的量化框架,以消除这种利润幻觉。

  • 00:05:00 演讲者讨论了作为交易因果模型的价格影响,以及如果交易更激进,它如何导致价格进一步被推高,反之亦然。业界使用价格影响模型进行交易成本分析和优化执行,从业者将其作为交易前工具来预估订单的预期交易成本并优化执行策略。演讲者提供了一份模拟 TCA 报告,以模拟这种流动性观点,供交易者评估他们的算法每季度的表现。交易者试图尽量减少订单滑点,价格影响和 alpha 滑点开始发挥作用,具体取决于机械移动或 alpha 导致的订单滑点百分比。

  • 00:10:00 凯文韦伯斯特讨论了欧洲证券和市场管理局发布的关于如何进行流动性压力测试的指南,其中涉及模拟市场压力期间的资产清算。他还解释了模拟市场反应的重要性,例如价格错位,以及对冲如何降低风险敞口。此外,他还回顾了两股关于流动性压力测试和价格对会计损益影响的文献,包括 Cascioli Boucheron Farmer 和监管机构如困惑委员会和 ESMA 的著作。最后,他强调需要进行流动性压力测试,以避免可能影响会计损益并产生高额清算成本的情况。

  • 00:15:00 演讲者讨论了有关流动性压力测试的各种文件的要点,包括决策者使用它们的必要性及其基于模拟的结构。他们推荐了 Francelli 的一篇关于模拟市场压力期间价格错位的论文,以及 Schweizer 和 Urzua 的两篇论文,它们为 OB 模型提供了另一种证明并大大提高了它的适用性。演讲者还介绍了交易足迹的概念,它将不同的损益定义联系在一起,并衡量价格影响对会计损益的扭曲效应。最后,他们建立了一个简单的甩卖模型来说明 Casadio-Bouchard-Farmer 论文关于会计损益的有力结论。

  • 00:20:00 Kevin Webster 讨论价格影响如何扭曲会计损益。他解释了交易员和平台经理每天查看的数字如何高估了他们的最终损益,从而在他们完成交易时使其缩小。然而,通货膨胀属性可以实时测量和显示,使交易者可以采取行动。韦伯斯特指出,头寸膨胀部分的损失通常是暂时的,取决于风险承受能力。最后,他介绍了交易者在计算盈亏时需要考虑的数学设置、变量和数量。

  • 00:25:00 在本节中,凯文韦伯斯特解释了与股票头寸估值相关的问题,以及它如何影响公司的损益 (P&L)。他谈到了确定使用什么价格来标记股票头寸的模糊性,以及交易算法使用的会计损益与基本损益之间的差异。他将交易足迹定义为会计损益与基本损益之间的差异,并解释了在平仓时如何消除歧义。他还讨论了头寸膨胀并提供了该属性成立的一些假设。最后,他提到了影响模型及其两个案例,即 Fruehwirth 和 Bond 研究的原始 OW 痣和 W 痣。

  • 00:30:00 Kevin Webster 解释说,为了使模型有意义,lambda 和 beta 之间需要有无套利条件,以及需要满足的自筹资金方程条件。他还详细介绍了如何在收盘时计算预期损益,以及交易足迹如何将偏差引入会计损益。最后,他讨论了仓位膨胀属性如何导致仓位在进仓阶段膨胀,在持仓阶段停留,并最终蒸发。所有这些都可以在交易屏幕上实时观察到。

  • 00:35:00 在本节中,金融专家凯文韦伯斯特解释了会计损益中出现的价格影响扭曲。他讨论了交易者如何在交易没有 alpha 的情况下进行获利交易,同时还警告说,由于交易成本,这些利润不会持续太久,交易者应及早监控这些价格位置以避免损失。此外,他解释说,投资组合经理更喜欢将他们的投资组合视为一个整体,他定义了一个固定投资组合来控制数学金融领域投资组合的规模和周转率。

  • 00:40:00 Kevin Webster 讨论固定投资组合的概念以及如何使用它来估算运行交易成本。通过了解传播者的时间尺度,交易者可以估计他们的头寸被夸大了多少,以及如果他们开始清算他们的头寸,他们可能会损失利润的错觉。韦伯斯特随后在经验数据上模拟了该框架,并强调这些公式可以应用于现实世界的场景。最后,他将该框架应用于甩卖模型,并解释了会计损益与基本损益之间的差异,以及它们如何根据交易者的风险厌恶程度为不同的目标函数提供信息。

  • 00:45:00 Kevin 讨论甩卖或其他市场参与者的交易活动如何影响交易者的损益和头寸。他证明激进的对冲会导致拥挤效应和头寸膨胀,从而导致永久性损失。此外,他还强调了准确建模价格影响以有效管理风险的重要性,并强调了在结束流动性不足头寸之前管理流动性风险的重要性。最后,他指出,虽然有许多不同的价格影响模型,但它们通常对大部分数据达成一致。

  • 00:50:00 演讲者讨论了不同的影响模型如何不仅反对价格影响的数量或变化,而且反对影响消失的持续时间。他们提供了一个可能持续几天到一个月的临时错位的例子。然而,如果交易员或绩效经理想要消除他们的头寸偏差或执行风险管理,任何影响模型都应该足够了,并且有一套可操作的模型可以与利益相关者进行有效沟通。从风险管理的角度来看,有一个明确的行动集。相反,从交易者和业绩的角度来看,这主要是一种沟通的事情,通过了解 p/l 是否是机械的,去除 p/l 的机械部分,可以关注交易中的实际 alpha 或实际优势.

  • 00:55:00 凯文韦伯斯特解释说,无价格操纵原则意味着即使交易者获利,他们也无法锁定,因为它们最终会蒸发。证明头寸通胀导致交易价值随时间缩减或立即清算,从而导致零损益甚至负损益。交易者需要依靠其他变量来获利,因为头寸膨胀不允许利润成为永久性的。韦伯斯特进一步讨论了初始影响状态、由市场其余部分引起的初始影响以及来自交易者对冲和市场其余部分的影响之间的相关性。

  • 01:00:00 Kevin Webster 讨论价格影响如何扭曲会计损益。他解释说,高波动性流动性制度期间的额外成本以及与其他市场的相关性可能会在一定程度上造成这种偏见。从监管的角度来看,公司债券和保险公司可能更容易受到这种偏见的影响。然而,正如他承认的那样,他没有非常详细的答案,因为他不确定如何回答股票以外的某些问题。总的来说,他提供了对价格影响及其如何扭曲损益的数学理解。
Kevin Webster: "How Price Impact Distorts Accounting P&L"
Kevin Webster: "How Price Impact Distorts Accounting P&L"
  • 2022.02.16
  • www.youtube.com
Full Talk Title: "How Price Impact Distorts Accounting P&L - Revisiting Caccioli, Bouchaud and Farmer's Impact-Adjusted Valuation"This presentation revisits ...
 

Laura Leal(普林斯顿大学)-“学习高频金融的功能控制”



Laura Leal(普林斯顿大学)-“学习高频金融的功能控制”

来自普林斯顿大学的研究员Laura Leal就深度神经网络在高频金融中的应用发表了内容丰富的演讲。她强调了传统解决方案的局限性,并探讨了在该领域利用神经网络的优势。 Leal 强调了他们适应复杂因素的能力,例如自相关和日内季节性,传统模型难以应对。通过利用神经网络,交易者可以通过最小化市场影响和顺利交易来实现最佳执行。

为了解决对神经网络黑盒性质的担忧,Leal 引入了可解释性的概念。她讨论了神经网络控制在低维流形上的投影,从而能够更好地理解相关风险以及与熟悉的风险部门的偏差。该团队评估了神经网络控制的性能,并将其与经典的封闭式 PDE(偏微分方程)解决方案进行了比较。他们检查了价值函数、按市值计算的财富和预测中的相对误差,以评估神经网络方法的准确性和有效性。

Leal 深入研究了神经网络训练的复杂性,强调了结合真实世界数据和准确动态的重要性。她还提出了一个多偏好控制器,允许交易者输入他们的风险偏好,从而更快地适应新的市场条件。通过考虑风险规避参数并结合交易者的偏好,神经网络可以生成高频金融中随机优化问题的解决方案。

演讲者讨论了用于风险控制的神经网络的结构,强调了它的循环性质。虽然网络不是太深,但它在每个时间步都采用循环结构,同时更新权重。网络的输入包括时间和库存,而输出是控制本身——确定每个时间步的最佳库存交易量。为了解决财务数据可用性有限的挑战,采用迁移学习,使用蒙特卡罗方法模拟数据。

Leal 概述了使用线性回归将神经网络控制投影到线性函数空间的过程。这种投影技术有助于更好地理解神经网络的非线性函数及其与封闭形式控制解决方案的一致性。结果证明了结合季节性和风险厌恶参数对模型对市场的反应的影响。此外,演示者强调了 gamma 的重要性,在文献中通常将其设置为 2,但当采用 3 比 2 时显示了非线性解决方案。

对神经网络控制在执行高频金融交易时的性能和准确性进行了全面评估。 Leal 比较了价值函数、按市值计价的财富,以及在不同情景和伽玛值下的预测相对误差。虽然神经网络表现出卓越的性能,但它以非线性方式执行交易,偏离了已知的控制解决方案。这引发了关于使用神经网络进行交易并根据其与既定解决方案的差异确定适当保证金水平的决定的问题。

Leal 探索了多偏好控制器方法的好处,允许交易者输入他们的风险转换参数并使用预先训练的模型立即开始交易。虽然神经网络解决方案的执行时间比 PDE 解决方案更长,但它提供了更大的灵活性和对不同风险偏好的适应性。为了增强可解释性,Leal 提出了一种使用线性回归的投影思想,在保留多偏好能力的同时减少了计算负担。她还强调了神经网络近似概念的更广泛应用,表明它在其他金融问题(例如对冲)中的相关性。

讨论了高频金融中神经网络的训练过程,强调离线训练以避免与在线强化学习相关的延迟问题。该网络将时间、库存和潜在的风险规避参数作为输入,并产生一个比率作为输出。 Leal 还描述了迁移学习中的微调过程,一旦网络收敛,就从模拟数据过渡到从多伦多证券交易所获得的真实数据增量。演示者强调了在训练过程中使用真实世界数据和准确动态的重要性,因为它增强了网络捕捉高频金融复杂性的能力。

在随后的部分中,Laura Leal 提供了对高频金融神经网络中采用的输入和目标函数的见解。神经网络将库存作为一天中特定库存的平均体积的一部分,允许标准化表示。目标函数被定义为最大化问题,输出作为最优执行的控制。神经网络的结构基于函数逼近,利用两个输入节点和四个隐藏层来捕获潜在关系。

在回答有关两个控制解决方案之间差异的问题时,Leal 澄清说,这可以解释为投资者不断变化的效用的反映。通过调整伽马参数,可以采用不同的效用函数,从而导致控制解决方案的变化。在他们的研究中,团队根据对实际交易者的实证测试选择了三半的伽玛值,结果令人满意。

Leal 进一步强调,神经网络的输出是可观察和可分析的。他们可以监控网络持有的头寸以及它们在整个交易日内的演变情况,从而为决策过程提供透明度和洞察力。这种水平的可解释性和理解力使交易者能够对神经网络的执行策略充满信心。

Leal 还讨论了与开发高频金融功能控制相关的挑战。虽然平均控制过程可以提供对交易执行的整体洞察,但它可能无法准确代表个别轨迹的行为。市场动态,例如模因股票的出现,需要调整控制方法以有效捕捉不断变化的条件。

最后,Laura Leal 的演讲阐明了在高频金融领域建立有效控制的复杂性。通过利用深度神经网络,研究人员和交易员可以克服传统模型的局限性并适应该领域的复杂动态。风险偏好、可解释性措施和真实世界数据的结合有助于开发稳健且适应性强的控制解决方案。通过他们的工作,Leal 和她的团队提供了宝贵的见解和解决方案,为在高频金融领域做出更高效、更明智的决策铺平了道路。

  • 00:00:00 Laura Leal 介绍了她与 Matthias 和 Charlotte 在使用深度神经网络解决高频金融中的最优执行问题方面的合作。目标是避免大的市场影响并尽可能顺利和秘密地进行交易。该团队引入了可解释性的想法来解决神经网络是黑匣子的问题,他们将神经网络控制投射到低维流形上,以更好地理解风险以及神经网络解决方案与熟悉的风险之间的差距部门。他们评估性能,查看价值函数、财富标记市场和预测中的相对误差,并将神经网络解决方案与经典的封闭式 PDE 解决方案进行比较。

  • 00:05:00 来自普林斯顿大学的 Laura Leal 讨论了神经网络如何改进传统解决方案的局限性,例如 PD(偏微分)模型,这些模型难以适应自相关、重尾等高频金融的复杂性和日内季节性。然而,神经网络运行起来可能很耗时,因此她提出了一个多偏好控制器,输入交易者的风险偏好以更快地适应新的日子,生成随机优化问题的解决方案。然后,Leal 概述了文献,包括最佳执行模型,并解释了神经网络可以在高频金融中学习的状态变量,如库存、控制和价格。

  • 00:10:00 Laura 讨论了高频金融中价格过程的演变及其如何受到交易速度的影响。她解释了交易速度越快,消耗的流动性就越多,从而推高价格并产生永久的市场影响。最小化的客观标准取决于控制,即交易速度,并且具有终端组件和运行成本组件。终端成本分为三个部分,包括最终的现金财富、持有库存的罚款以及最终库存可以卖多少钱。运行成本是全天持有库存的惩罚,这两个参数对于风险管理至关重要。 Leal 还讨论了 gamma 对于他们的神经网络解决方案的重要性,并且在文献中通常被视为等于 2。

  • 00:15:00 来自普林斯顿大学的演讲者 Laura Leal 解释了使用神经网络来学习高频金融问题中的近似值,其中价值函数在库存上有一些二次项。使用神经度量时的等效解决方案不同于优化控制 mu,因为必须选择神经网络的参数。神经网络用于所有时间步长,使其能够学习如何根据代理的价格、库存和财富做出反应。该过程使用具有时间和库存输入的前馈、完全连接的神经网络结构。但是,可以通过多种方式对输入进行概括,以包含比视频中用于说明目的的风险偏好参数更多的输入。

  • 00:20:00 Laura Leal 解释了高频金融中用于风险控制的神经网络的结构。网络不是很深,但它是循环的,在每个时间步重用相同的结构来同时更新权重。网络的输入是时间和库存,输出是控制,也就是神经网络本身,每个时间步输出一定数量的库存进行交易。迁移学习用于使用蒙特卡洛模拟数据,而不是使用昂贵或稀疏的财务数据。使用的数据来自多伦多证券交易所 2008 年 1 月至 2009 年 12 月,神经网络用于解决重尾、自相关和盘中季节性问题。

  • 00:25:00 在本节中,Laura Leal 解释了将神经网络获得的控制投影到 q 的线性函数空间的过程,使用线性回归找到 beta1 和 beta2 项以确定 r 平方,显示有多少神经网络的非线性函数可以投影到封闭形式的控制空间。结果表明,当向代码添加功能时,例如季节性和学习代理的风险厌恶参数,对模型对市场的反应有显着影响,但当考虑 gamma 等于 3 比 2 时,有一个非- 神经网络的线性解决方案。

  • 00:30:00 Laura 检查神经网络控制在执行高频金融交易时的性能和准确性。她将价值函数和标记与不同场景和伽玛值的市场财富进行了比较。她还评估了投影中的相对误差,并指出虽然神经网络具有更好的性能,但它以与已知控制不同的非线性方式执行。这引发了关于是否使用神经网络进行交易以及根据其与舒适的已知解决方案的距离设置多少保证金的问题。

  • 00:35:00 在本节中,劳拉讨论了她在高频金融中优化执行的多偏好控制器的发现。 Leal 发现,对于所有参数集,神经网络解决方案比 PDE 解决方案的执行时间更长,因为前者对季节性做出反应。然而,通过这种方法,交易者可以输入他们当前的风险转换参数并立即开始使用已经训练过的东西进行交易。 Leal 还通过投影思想提出了可解释性,该思想使用线性回归和同一问题的多偏好版本来消除一些计算负担。此外,Leal 在她的论文中讨论了其他论文,以及如何将这种神经网络近似思想应用于许多其他金融问题,包括对冲。

  • 00:40:00 Laura Leal 讨论了高频金融中使用的神经网络的训练过程。她解释说,网络是离线训练的,而不是通过在线强化学习,以避免延迟问题。一旦网络经过训练,它就会接受时间和库存输入,可能带有风险规避参数,并输出一个比率。最终用户不需要了解网络的内部运作。 Leal 还解释了迁移学习中使用的微调程序,其中涉及在网络收敛后切换到来自多伦多证券交易所的真实数据增量。最后,她解决了有关预处理和优化的问题,强调了在训练过程中使用真实世界数据和准确动态的重要性。

  • 00:45:00 在视频的这一部分,Laura Leal 讨论了高频金融神经网络中使用的输入和目标函数。神经网络将库存作为一天中该库存的平均体积的比例,该比例取负一到一之间的值。目标函数是一个以输出为控制的最大化问题,神经网络的结构是基于函数逼近的。 Leal 还解释说,神经网络结构中有两个输入节点和四个隐藏层。最后,她解决了一个关于两个控制解决方案之间差异的问题,并澄清这可以解释为投资者效用变化的结果。

  • 00:50:00 Laura 讨论了伽马 2 和三半模型及其效用函数之间的区别。她解释说,使用 gamma 2,解决方案不再是封闭形式的解决方案,而是通过神经网络生成近似解决方案。选择 gamma three halves 的原因是在公司内部与实际交易员进行测试,结果表现良好。此外,Leal 确认可以观察和分析神经网络输出,他们确实知道它采取的位置以及它们在一天中的变化情况。

  • 00:55:00 在本节中,Laura Leal 讨论了对高频金融进行功能控制的挑战。虽然平均控制流程可以深入了解交易的执行情况,但在查看单个轨迹时可能并不完全准确。她还解决了一个关于使用两块方法进行优化的问题,并解释了该方法需要如何适应不断变化的动态,例如模因股票。总的来说,Leal 的演讲阐明了为高频金融创建功能控制的复杂性。
Laura Leal (Princeton University) - "Learning a Functional Control for High-Frequency Finance"
Laura Leal (Princeton University) - "Learning a Functional Control for High-Frequency Finance"
  • 2021.11.17
  • www.youtube.com
Laura Leal (Princeton University) is our last speaker for the Fall 2021 seminar series. Her topic is called "Learning a Functional Control for High-Frequency...
 

Vineel Yellapantula(康奈尔大学 MFE '20):“SEC 文件中的量化文本”


Vineel Yellapantula(康奈尔大学 MFE '20):“SEC 文件中的量化文本”

Vineel Yellapantula 介绍了他的暑期项目,该项目涉及应用自然语言处理 (NLP) 技术根据 SEC 文件中的文本信息进行股票交易,尤其侧重于 MD&A 部分。该项目的目标是为美国市场上 430 只股票的每份报告分配一个分数,并根据分数将它们分为五个分位数来分析它们的表现。 Yellapantula 使用余弦和 Jaccard 相似度等传统方法来确定文本之间的相似度得分,事实证明 Jaccard 相似度随着时间的推移更加一致。他还探索了在文本数据集上使用循环神经网络 (RNN) 和 Keras 创建情感分析模型,他的模型达到了令人印象深刻的 87.5% 的准确率。

在演示过程中,Yellapantula 强调了为每个特定问题选择适当方法并结合其他数据以改进结果的重要性。他强调了通过文本数据提供的丰富信息,尤其是在 10-K 文件中,并提到使用以前的文件开发的因素可能比仅依赖当前文件的因素更有效。 Yellapantula 指出了将深度学习技术用于文本数据的各种替代方案,包括 glove、word2vec、BERT 和 RNN。他进一步建议合并更多数据源,例如 8-K 文件和新闻周期,以增强模型的预测能力。然而,他承认在他的研究中存在选择偏差,因为它侧重于 2007 年至 2020 年该指数中表现良好的股票。

在专门用于情感分析的部分中,Yellapantula 解释了使用 RNN 和 Keras 创建模型的过程。这些步骤包括对文本进行标记以理解其含义,通过嵌入降低维度,以及使用 LSTM 层和具有 sigmoid 函数的密集层进行情感分类。他使用 IMDB 评论演示了这种方法的应用,将评论长度限制为 500 字,并用零填充较短的评论以保持一致性。通过严格的评估,Yellapantula 的情感分析模型达到了 87.5% 的准确率。

此外,Yellapantula 强调了信息相关性在确定因素的有效性及其随时间的一致性方面的重要性。他引用了一项研究,该研究表明报告稳定的公司往往表现良好,表明这是一个有前途的探索因素。最后,Yellapantula 对观众的兴趣表示感谢,并期待未来的进一步参与。

Vineel Yellapantula 的项目演示了如何应用 NLP 技术从 SEC 文件中的文本信息中提取有价值的见解。通过为报告打分并分析其表现,他的工作有助于理解语言如何影响股票交易。此外,他对使用 RNN 进行情感分析的探索展示了深度学习在从文本数据中捕捉情感方面的潜力。通过谨慎的方法选择和合并额外的数据源,Yellapantula 强调了提高此类模型的准确性和有效性的机会。

  • 00:00:00 在本节中,Vineel Yellapantula 描述了他的暑期项目,该项目涉及使用自然语言处理 (NLP) 技术根据 SEC 文件中存在的文本信息交易股票,特别是 MD&A 部分。该项目的重点是为美国市场上 430 只股票的每份报告找到一个分数,并根据分数将它们分为五个分位数后分析它们的表现。 Vineel 使用余弦相似度和 jaccard 相似度等传统方法来计算文本之间的相似度得分,事实证明,jaccard 相似度随着时间的推移更加一致。 Vineel 还提到,RNN 等深度学习技术可用于此目的。

  • 00:05:00 在本节中,Vineel Yellapantula 解释了如何在文本数据集上使用循环神经网络 (RNN) 和 keras 创建情感分析模型。该过程涉及对文本进行标记以理解其含义,使用嵌入降低维度,然后使用 LSTM 层和具有 S 形函数的密集层对文本的情感进行分类。 Vineel 展示了他如何使用 IMDB 评论处理数据,将评论的长度限制在 500 字以内,并用零填充较短的评论以保持长度的一致性。他的模型能够达到 87.5% 的准确率。

  • 00:10:00 在视频的这一部分,Vineel Yellapantula 讨论了通过文本数据提供的丰富信息,尤其是在 10-K 文件中。他指出,许多因素可以通过这些文件得到发展,使用以前文件的因素可能比只关注当前文件的因素更有效。此外,Yellapantula 指出,有多种方法可以将深度学习用于文本数据,例如 glove、word2vec、BERT 和 RNN。他强调,针对特定问题选择正确的方法至关重要,并结合更多数据(例如 8-K 文件和新闻周期)可以带来更好的结果。最后,Yellapantula 承认他的研究存在一些选择偏差,因为他关注的是 2007 年至 2020 年该指数中表现良好的股票。

  • 00:15:00 在本节中,Vineel Yellapantula 讨论了信息相关性在确定一个因素是否有效时的重要性,以及因素随时间的一致性。他还提到了一项研究,该研究发现报告稳定的公司表现良好,表明这是一个值得探索的好因素。最后,他感谢观众的兴趣,并期待在秋天见到他们。
Vineel Yellapantula (Cornell MFE '20): "Quantifying Text in SEC Filings"
Vineel Yellapantula (Cornell MFE '20): "Quantifying Text in SEC Filings"
  • 2021.05.12
  • www.youtube.com
CFEM alumnus Vineel Yellapantula discusses his summer project at AbleMarkets under Prof. Irene Aldridge, “Quantifying Sentiment in SEC Filings.” By utilizing...
 

Zihao Zhang(Oxford-Man Institute)-“通过订单数据对市场进行深度学习”



Zihao Zhang(Oxford-Man Institute)-“通过订单数据对市场进行深度学习”

Zihao Zhang 是 Oxford-Man Institute 的博士后研究员,也是机器学习研究小组的一员,介绍了他的团队最近在通过订单数据将深度学习应用于市场方面的工作。他们的重点是市场微观结构数据,尤其是限价订单簿,它为特定金融工具的整体需求和供应动态提供了宝贵的见解。通过结合市场订单和限价订单簿数据,张和他的团队发现他们可以减少信号差异并获得更好的预测信号。他们模型的这种应用具有增强交易执行和做市策略的潜力。

张以简要介绍市场微观结构数据开始他的演讲,特别强调市场订单数据的重要性。该数据源提供高度精细的信息,与限价订单簿数据相比提供频繁的更新和事件,后者在现有文献中受到更多关注。他介绍了他们的深度学习模型,解释了他们为按订单数据分析市场而设计的网络架构。 Zhang 强调说,他们的工作代表了第一个使用市场按订单数据预测高频运动的预测模型,提供了另一种信息来源,扩展了 alpha 发现的可能性。

接下来,Zhang 深入探讨了限价订单簿的概念,它综合记录了给定时间点金融工具的所有未完成限价订单。他强调,虽然图表数据提供的是低频信息,但股票的价格实际上是由多变量时间序列的限价订单簿表示的。 Zhang 解释了限价订单簿如何根据提交的订单组织成不同的价格水平,每个价格水平由不同交易者分割的大量小订单组成。他还讨论了在新消息到达时如何更新订单簿,这可以引入新头寸、取消现有订单或修改当前订单。 Zhang 指出,限价订单簿的派生数据揭示了特定金融工具的整体供需关系,他的目标是确定利用包含订单下达和取消信息的市场订单数据是否可以提供更多见解用于做出预测。

展望未来,张探索了如何在深度学习中利用订单数据来预测市场走势。尽管市场订单数据中的消息字符串与限价订单簿相比具有较低的维度,但它们提供了可用于预测的额外信息。 Zhang 解释了如何将过去的事件转化为二维矩阵,形成可以输入神经网络进行预测的图像。然后可以将卷积层产生的特征集成到循环神经层中,以学习结构并捕获额外的依赖关系。最后一层根据使用阈值返回的分类设置生成预测。

Zhang 继续讨论用于使用限价订单簿数据进行预测的网络架构。在这种情况下,前两个组件被替换为来自个体交易者的消息,卷积层被替换为 LSTM 层或注意力层。 Zhang 简要解释了注意力机制,它有助于单点预测并涉及编码器-解码器结构。编码器从输入时间中提取有意义的特征并将它们汇总为隐藏状态,而解码器生成预测。归一化用于根据中间价确定订单是买入还是卖出。

在随后的部分中,Zhang 展示了他们的模型使用一组资产训练的结果,将其归一化为相似的规模,并使用简单线性模型、多层感知器、LSTM 和注意力模型等不同模型进行测试,同时结合了极限顺序书籍数据和纯环境数据。结果表明,来自环境数据的预测信号与来自限价订单簿的信号的相关性较低,这表明这两个来源的组合可以减少信号方差,从多样化中受益,并产生更好的预测信号。因此,对来自两种数据类型的预测信号进行平均的集成模型表现出最佳性能。

Zhang 继续讨论将按订单市场 (MBO) 数据纳入预测的潜在好处,并强调使用这些数据执行特征工程的能力。他展示了提前 2 到 20 个跳动点的预测范围的结果,并指出在 50 和 100 个跳动点之前观察到的类似行为。 Zhang 还回答了听众提出的问题,包括使用所有工具训练单一模型以提高泛化能力的可能性,以及来自伦敦证券交易所的 MBO 数据来源。在回答听众关于关注 NF1 而不是 PNL 的问题时,Zhang 同意并承认 PNL 是更相关的成功衡量标准。

Zhang 进一步讨论了预测信号的使用以及定义它们的各种方法,例如使用原始信号或基于 softmax 概率设置阈值。他总结了论文的要点,提出按订单 (MBO) 数据而不是限价订单簿数据对市场进行建模,并测试深度学习模型,包括 LSTM 保留机制。结果表明,MBO 和限价订单簿数据的组合产生了最佳结果。 Zhang 解答了观众关于市场走势之间的自相关、过滤掉噪音交易以及在限价单图片建模中使用 CNN 层的动机等问题。

在下一节中,Zhang 解释了如何将订单簿视为可以使用卷积神经网络 (CNN) 进行有效探索的空间结构。使用 CNN 从每个价格水平中提取信息已被证明对预测很有价值。选择长短期记忆 (LSTM) 层而不是多层感知器,因为它保持数据的时间流并总结过去的事件以进行预测。 Zhang 指出,由于金融时间序列的性质,使用注意力机制的好处是有限的。该论文包括对其模型中使用的超参数的详细描述。

Zhang 解决了人们对神经网络方法中使用的大量参数及其在预测股市方面的有效性的担忧。他承认大量参数可能会受到批评,但强调他的团队只微调了几个特定于他们模型的参数。他们尚未考虑使用买卖差价作为成功的标准,但认识到其进一步探索的潜力。张认为他们的模型对交易执行和做市策略具有实用价值。但是,他提到,如果打算跨越价差,则可能需要对数据进行下采样,因为订单簿数据的频繁更新会使交易执行复杂化。最后,在为 Elo 限价订单簿建模时,他们汇总了每个价格水平的总规模,而不是包括有关单个订单规模的信息。

在总结部分,张解释了按订单行情和按价格数据行情的区别。市场订单数据允许跟踪单个订单,这对于市场价格数据是不可能的。通过适当的特征工程,订单市场数据可以提供额外的信息并产生 alpha。 Zhang 还讨论了他的模型如何在保持大小不变的情况下处理特定限价单价格的修改。每条具有更新价格的新消息都被视为新的更新,从而丰富了数据集。

总的来说,Zihao Zhang 的演讲展示了深度学习在订单数据市场中的应用,突出了其从市场微观结构数据中提取有价值见解的潜力。通过结合市场订单和限价订单簿数据,Zhang 的团队展示了信号方差的减少和改进的预测信号的生成。他们的工作有望加强交易执行和做市策略,为金融市场分析领域做出宝贵贡献。

  • 00:00:00 Zihao Zhang 是 Oxford Man Institute 的博士后,也是机器学习研究小组的一员,介绍了他最近与 Brian Ling 和 Stefan Loren 合作,将深度学习模型应用于按订单数据进行市场营销。张先生首先简单介绍了市场微观结构数据,包括限价订单簿和订单市场数据。他强调,后者可以说是最精细的信息来源,与限价订单簿数据相比,它提供了更多的更新和事件,但在当前的文献中基本上被忽视了。 Zhang 介绍了他们的深度学习模型,并讨论了他们为此类数据设计的网络架构。他还强调,他们的工作是第一个使用市场按订单数据预测高频运动的预测模型,它提供了一个正交信息源,扩展了 alpha 发现的范围。

  • 00:05:00 Zihao 解释了限价单的概念,它是给定时间点金融工具所有未完成的限价订单的记录。他强调,虽然图表数据提供的是低频信息,但股票价格实际上是以限价订单簿为代表的多元时间序列。张解释了限价订单簿是如何根据提交的订单分为不同的价格级别,每个价格级别由许多由不同交易者分割的小订单组成。他还讨论了当收到新消息时如何更新订单簿,新消息可以添加新头寸、取消现有订单或更新现有订单。张指出,从限价订单簿中导出的数据显示了特定金融工具的整体供求关系,他的重点是看是否可以使用包含订单下达和取消信息的订单数据的市场为进行预测提供额外的信息。

  • 00:10:00 Zihao Zhang 讨论市场订单数据如何用于深度学习以预测市场走势。虽然市场订单数据中的消息字符串的维度低于限价订单簿,但它们提供了可用于预测的额外信息。张解释说,过去事件的图像可以形成二维矩阵,并输入神经网络进行预测。然后可以将卷积层产生的特征放入循环神经层以学习结构和附加依赖项。最后一层基于使用阈值返回的分类设置输出预测。

  • 00:15:00 Oxford-Man Institute 的 Zihao Zhang 解释了用于根据限价订单簿数据进行预测的网络架构,其中前两个组件被替换为来自个体交易者的消息,卷积层被替换为 LSTM 层或注意力层。 Zhang 还简要解释了注意机制,在这种情况下用于单点预测,涉及编码器和解码器结构,编码器从输入时间中提取有意义的特征并将它们汇总到隐藏状态,而解码器生成预测.标准化用于根据中间价确定订单是买入还是卖出。

  • 00:20:00 在视频的这一部分,Zihao Zhang 展示了使用一组资产训练的模型的结果,将其归一化为相似的规模,并在简单线性模型、多层感知、LSTM 和使用限制顺序组数据和纯环境数据的注意模型。结果表明,来自环境数据的预测信号与来自限价订单簿的信号的相关性较低,这表明这两种信号的组合可以减少信号方差,从多样化中受益,并产生更好的预测信号。因此,对来自两种类型数据的预测信号进行平均的集成模型提供了最佳性能。

  • 00:25:00 Zihao Zhang 讨论了将按订单市场 (MBO) 数据纳入预测的潜在好处,并提到了使用数据进行特征工程的能力。显示了提前 2-20 个跳动点的预测范围的结果,在 50 和 100 个跳动点之前看到了类似的行为。 Zhang 还回答了听众的实施问题,包括使用所有工具训练单一模型以提高泛化能力以及来自伦敦证券交易所的 MBO 数据的来源。一位听众质疑关注 NF1 而不是 PNL,Zhang 同意并承认 PNL 是更相关的成功衡量标准。

  • 00:30:00 Zihao Zhang 讨论了预测信号的使用以及定义它们的不同方式,例如使用原始信号或为来自 softmax 的概率设置阈值。他总结了这篇论文,提出按订单 (MBO) 数据而非限价订单簿数据对市场进行建模,并测试包括 LSTM 保留机制在内的深度学习模型。结果表明,MBO 和限价订单簿数据的组合给出了最好的结果。 Zhang 还回答了观众关于市场走势之间的自动关联、过滤掉噪音交易以及在限价订单图片建模中使用 CNN 层的动机等问题。

  • 00:35:00 在视频的这一部分,牛津人研究所的 Zihao Zhang 解释了如何将订单簿视为可以使用相同层进行探索的空间结构。人们发现使用卷积神经网络 (CNN) 从每个价格水平中提取信息有助于预测。之所以选择长短期记忆 (LSTM) 层而不是多层感知,是因为它不会扭曲时间流,并且会总结过去的事件以做出预测。由于金融时间序列的特性,人们发现使用注意力机制的好处是有限的。该论文包括对所用超参数的详细描述。

  • 00:40:00 Zihao Zhang 讨论了神经网络方法中使用的参数数量及其在预测股市方面的有效性。他指出,虽然大量参数可能是对神经网络方法的批评,但他和他的团队只为他们的特定模型调整了几个参数。他们没有考虑使用买卖价差作为成功的标准,但承认可以进一步探索。 Zhang 认为,他们的模型的应用对于交易执行和做市策略很有用,但如果想要交叉点差,他们可能需要对数据进行下采样来进行交易,因为帐面数据通常会有太多更新进行交易。最后,在为 Elo 限价订单簿建模时,他们汇总了每个价格水平的总规模,而不是包括有关单个订单规模的信息。

  • 00:45:00 在本节中,来自牛津曼研究所的 Zihao Zhang 解释了按订单行情和按价格数据行情的区别。市场订单数据允许跟踪单个订单,这对于价格数据市场是不可能的。通过适当的特征工程,来自市场的订单数据可以提供额外的信息并产生 alpha。此外,Zhang 讨论了他的模型如何在保持大小不变的情况下处理特定限价订单的价格修改。他解释说,每条具有更新价格的新消息都被视为新更新。
Zihao Zhang (Oxford-Man Institute) - "Deep Learning for Market by Order Data"
Zihao Zhang (Oxford-Man Institute) - "Deep Learning for Market by Order Data"
  • 2021.10.27
  • www.youtube.com
Next up in the Cornell-Citi webinar series is Dr. Zihao Zhang, who spoke on Tuesday, Oct. 26.Abstract: Market by order (MBO) data - a detailed feed of indiv...
 

Peter Carr(纽约大学)“Stoptions”壮举。洛伦佐·托里切利(帕尔马大学)



Peter Carr(纽约大学)“Stoptions”壮举。洛伦佐·托里切利(帕尔马大学)

Peter Carr 介绍了一种名为“止损”的金融产品,它结合了期货合约和看跌期权的特点。 Stoptions 允许所有者通过加入百慕大看跌期权元素来避免不利的价格变化。 Carr 解释了期权的概念,并提供了一个为期三天的期权示例,其中包含不同的楼层。然后他继续讨论一天和两天停损的估值,后者有两个楼层,并且可以灵活地在第一天或第二天行权。

卡尔通过深入研究向后递归、已婚看跌期权的估值以及伪和的使用,进一步探索了更长时期的止损估值。他建议利用逻辑分布来表示已婚看跌期权的价格变化。止损的价值可以使用“平值”期权的简单公式获得,估值和对冲可以通过分析来完成。

Carr 通过讨论与市场采用此类选项相关的挑战来结束本文。他强调了为这些产品寻找买家和卖家的重要性,并分享了他与潜在买家和卖家的对话。此外,Carr 承认,stoptions 模型是 Black-Scholes 和 Bachelier 等现有模型的替代方案,但它可能无法最佳地适应所有情况。尽管如此,他强调他们的模型旨在捕捉在金融中具有特殊意义的大量二元运算。

在后面的部分中,Carr 和 Lorenzo Torricelli 提出了一个使用共轭范式和逻辑分布的“停止”模型。该模型通过单一参数提供了期限结构的灵活性,允许一次性适应各种期限结构。然而,由于其向下倾斜的隐含波动率图,它可能并不完全适合市场。作者承认他们模型的局限性,并认识到他们的模型旨在捕捉金融中无数的二元操作。他们讨论了罢工和单一期权之间的可选性,以及通过伪求和的重复可选性。该部分以互相欣赏和期待参加彼此的研讨会作为结尾。

  • 00:00:00 Peter Carr 介绍了“止损”,这是一种新的金融产品,它是期货合约和看跌期权的混合体。止损具有标的资产和固定期限,并进行每日监控,所有者应计入标的的每次价格变化。止损与期货合约的不同之处在于,所有者可以通过看跌期权元素避免不利的价格变化。看跌期权是百慕大看跌期权,这意味着所有者可以在任何一天结束时行使它,将当天的价格变化替换为下限,合同规定的常数可以是时间的任何函数。

  • 00:05:00 Peter Carr 解释了期权的概念以及它们在金融协议中的作用。期权是一种金融产品,只要在止损合约中有超过一天的时间,它就可以选择何时停止承受价格变化的风险,从而提供灵活性。一个人只能行使一次期权,并且在那个时候,他们必须行使。期权一词是指何时通过行权停止对标的资产的敞口。卡尔以三天期权为例说明了这一概念,并概述了与该期权相关的三个不同楼层。当一个人行使期权时,合同就会到期,这只能发生一次。虽然此类合同目前不进行交易,但它们已嵌入许多金融协议中。

  • 00:10:00 Peter Carr 讨论了一个与百慕大行使风格的合同示例,称为“停止”。虽然它不是直接交易,但止损可以帮助理解百慕大掉期期权及其与价格水平期权的区别。通过假设 iid 价格变化,止损估值被简化为函数迭代,并且通过对价格变化施加特定的分布假设,估值被简化为伪加法。从止损中获得的见解可用于流动性交易的百慕大期权,卡尔继续解释一日和两天止损的估值。一日止损支付固定的底价,而两天的止损有两层,可以在第一天或第二天行使。

  • 00:15:00 这部分,Peter Carr 讨论了如果当场完成练习,第二天结束时的收益。称为 u1,它是在第一天结束时计算的。 Carr 指出,由于 u1 在第一天结束时是已知常量,因此不妨在第一天结束时假设它。此外,Carr 建议在时间为零时分解出 u1,并将 a1 的收益更改为 a1 - u1。这使得收益类似于已婚看跌期权或写在 u1 上的看跌期权,其中 u1 添加到看跌期权收益中。 Carr 解释说,一旦存在对普通期权进行估值的模型,就可以通过计算嵌入看跌期权来对多日期权(包括 2 日期权)进行估值。

  • 00:20:00 在本节中,来自纽约大学的 Peter Carr 和来自帕尔马大学的 Lorenzo Torricelli 讨论了如何通过假设价格增量在统计上相互独立并且具有相同的分布来对两天和三天的期权进行估值。他们使用统计学中的一个常见假设,称为 iid(独立同分布),用于一系列随机变量。为了对为期两天的期权的已婚看跌期权进行估值,他们使用了一种符号,该符号涉及收益的已知部分,称为 a1,以及标的资产今天的价格,称为 a2。对于三天的期权,他们引入了一个连续值,用 cv 表示,并使用动态规划来计算它的值。

  • 00:25:00 Peter Carr 解释了向后递归的过程和已婚看跌期权的估值。他从第二天开始,因为问题中所需的所有不确定性在第二天结束时都已解决。他将持续价值设置为第二天,即第三天,还有一个行使机会,然后退回第一天,计算收益价值和持续价值。然后,他退回到估值日的零时间并计算持续价值和收益,即已婚看跌期权的价值。随机收益的均值是先前计算的已婚看跌期权价值,影响价格变化分布的参数在零时已知。

  • 00:30:00 在本节中,Peter Carr 讨论了一个行使价为 A1 的已婚看跌期权的估值,其底层证券是另一个行使价为 A2 的已婚看跌期权。他解释说,这种估值涉及迭代一个函数,其参数在不同时间可能不同,并允许函数自行组合。被迭代的函数是一个单日香草结婚看跌欧式价值函数,Carr 指出,可以通过利用一种叫做关联函数方程的东西找到一个描述这个值并以封闭形式迭代的函数。通过直接对已婚看跌期权价值函数求值并要求它求解关联函数方程,可以使用 Breeden-Litzenberger 结果确定风险中性分布。本节最后解释说,使用一个自变量和可逆 g 的函数,可以确定已婚看跌期权的价值。

  • 00:35:00 Peter Carr 解释了伪和的概念,伪和是函数中两个参数的组合。通过使用可逆函数,该数量可用于通过楼层的重复伪和来查找基于 n 的选项的值。为了使这种方法无套利,必须仔细选择函数并将其表示为对其收益的风险中性期望。 Carr 表明此方法的生成器必须是任何基数的对数,并且标量 b 必须为正。已婚看跌期权还必须使用自然对数 g 逆函数进行适当评估,这需要对罢工进行两次微分以获得分布函数。最终,该方法涉及到 b 的比例因子,它不是标准差,而是与其成正比。

  • 00:40:00 Peter Carr 讨论了使用 logistic 分布来表示已婚看跌期权的价格变化。他使用具有两个基础成分的金融产品的指数,推导出一个执行价格为 a1 且基础均值为 a2 的已婚看跌期权公式。他将此称为伪和,并将实数集扩展为包括负无穷大作为中性元素。他解释说,这会创建一个可交换的幺半群结构,这只有在无套利期权估值和具有指数尾的对称逻辑分布的情况下才有可能。逻辑分布允许明确的累积分布函数,并且被认为比正态分布更友好。 Carr 建议逻辑分布的规模是期权到期时间的增函数。

  • 00:45:00 彼得讨论“止损”,这是一种结合了期权和掉期特征的合约。停止涉及将一个逻辑随机变量交换为另一个,其中变量是独立的且分布相同的。要对 n 天的停靠点进行估值,需要指定 t 的函数 b,它将逻辑分布的宽度与时间范围的长度联系起来。百慕大止损的价值由简单的公式给出,估值和对冲可以通过分析来完成。对于“平价”止损,价值以一种简单的方式增长,即时间的对数。

  • 00:50:00 Peter Carr 讨论了“停止”定价模型,该模型假设 iid 增量并将估值减少到迭代函数评估。通过假设常见增量的逻辑分布,该模型进一步简化为特定类型的伪和,称为对数和指数函数。由于有限责任,标的证券价格需要真实且非负数。该模型可以扩展到股票,重新定义期权合约以乘以相对价格而不是增加价格增量。支持正随机变量的结果分布称为共轭幂数字分布,它是具有负偏度的重尾分布,是一个不错的选择。该模型有未来的研究机会,可以应用于实际用途,例如与美联储会议的同步合同。

  • 00:55:00 纽约大学教授彼得卡尔讨论了市场对一种期权的采用以及寻找买家和卖家的过程。他谈到了他与美国银行首席外来交易员的谈话,他表示有兴趣购买期权,以及可能的卖方,例如保险公司或养老金计划。收养过程涉及寻找买家,Peter 分享说,他计划与一位在保险公司工作的朋友就此进行 Zoom 通话。对话以 Lorenzo Torricelli 对基于物流分布和相关流程的财务模型的讨论结束。

  • 01:00:00 在本节中,Peter Carr 讨论了正模型的对数回报的征收结构和模型中的回报的技术细节,包括对数逻辑、偏斜逻辑和逻辑回报过程。他解释说,这些过程是纯粹的跳跃,可以被认为是一个无限可分的时间族,一个定理保证了一个加法过程的存在,该加法过程是随机连续的,具有独立的增量。此外,该加法过程支持证券分配公式下的隐含价格分配。 Carr 然后解释了这个过程如何自然地成为一个市场,以及它如何拥有支持简单定价公式的良好理想属性。最后,他展示了数值测试的结果以及物流定价模型与标准正态模型的密度比较。

  • 01:05:00 Peter Carr 讨论了 CPDA 模型中正态分布和逻辑分布形状之间的差异。他指出,在 CPDA 模型中,分布的偏度和形状随时间变化,而在正常世界中,这不会发生。在查看正态分布和逻辑分布之间的比较时,他表示分布非常相似,但可以清楚地看出峰度。他还展示了他的累积系统结构的结果,他观察到他可以生成更灵活的形状,例如爆炸变体和短期、非常陡峭的偏度增加。最后,他讨论了 cpda 模型的隐含波动率表面,他指出波动率表面可以通过几个参数变得灵活。

  • 01:10:00 纽约大学的 Peter Carr 和帕尔马大学的 Lorenzo Torricelli 讨论了他们提出的“停止”模型,该模型使用共轭范式和逻辑分布来创建一个只有一个参数的完全灵活的期限结构。 one 参数同时产生更大的宽度和更多的负偏度,但必须介于 0 和 1 之间以防止矩均值不存在。该模型可以在一次罢工时适应任何期限结构,但可能并不总是最适合市场,因为它会产生一个向下倾斜的图表,这与隐含波动率对罢工的向上倾斜图表不同。 Carr 和 Torricelli 承认他们的模型是 Black-Scholes 和 Bachelier 模型的替代品,但预计他们的模型不足以应对所有情况。他们争辩说,有无数的二元运算具有与加法和乘法相似的属性,它们对金融具有特殊的重要性,而他们的模型旨在捕捉到这一点。

  • 01:15:00 在本节中,Peter Carr 和 Lorenzo Torricelli 讨论了罢工和单一之间的可选性,如欧式期权,以及作为重复伪求和的重复可选性,即百慕大变种期权。他们提到了在选择分布时要牢记二元运算比例多于两个的重要性,并以互相感谢并期待参加彼此的研讨会结束讨论。
Peter Carr (NYU) "Stoptions" feat. Lorenzo Torricelli (University of Parma)
Peter Carr (NYU) "Stoptions" feat. Lorenzo Torricelli (University of Parma)
  • 2021.04.14
  • www.youtube.com
Abstract: We introduce a new derivative security called a stoption. After paying an upfront premium, the owner of a stoption accrues realized price changes ...
 

Lorenzo Torricelli(帕尔马大学)-“期权定价中的附加逻辑过程”



Lorenzo Torricelli(帕尔马大学)-“期权定价中的附加逻辑过程”

帕尔马大学杰出教授洛伦佐·托里切利 (Lorenzo Torricelli) 通过探索加性逻辑模型和自相似规范,深入研究了期权定价的复杂性。在他富有启发性的演讲中,他阐明了使用这些创新模型为普通期权定价的公式,并通过展示逻辑定价模型与传统正态模型之间的密度比较来举例说明它们的应用。

此外,Torricelli 对逻辑模型的累积期限结构与齐次模型的期限结构的线性革命进行了基准分析。他富有洞察力的观察表明,逻辑模型在塑造期限结构方面提供了更大的灵活性,从而提供了优于传统方法的显着优势。

为了提供全面的理解,Torricelli 还检查了与这些模型相关的波动率表面。他注意到模型中存在正偏态,这是由于对数回报的偏态分布和 logistic 分布的峰态造成的。然而,他强调逻辑分布本身不存在偏斜,因为它表现出对称性。 Torricelli 进一步讨论了模态参数对波动率期限结构的影响,承认所选参数化的改进潜力。

最后,Torricelli 强调,从这些模型中导出的期权公式是明确和众所周知的,有助于它们的实际实施。值得注意的是,他赞扬了性能测试期间表现出的令人印象深刻的速度。作为透明度和学术合作的证明,Torricelli 计划公开与这些模型相关的代码,使研究人员和从业者都受益。

  • 00:00:00 帕尔马大学的 Lorenzo Torricelli 介绍了基于物流配送的财务模型,首先介绍了期权函数的估值方程和用于评估价值亭的函数。通过对 k 取导数,得到隐含的证券价格分布,可以看出 logistic 函数与标的物的真实价值相关联,而偏态 logistic 分布与来自 merit put valuation 的正价格过程相关联.将分布的无限可分结构视为一个时间族,并验证了加性过程的存在性,得到支持隐含价格分布并确定语句公式的独立增量的随机连续过程。

  • 00:05:00 帕尔马大学教授Lorenzo Torricelli正在讨论期权定价中的加法逻辑模型和自相似规范。他使用模型解释了普通期权的定价公式,并根据术语函数的价格对其进行了实例化。他展示了 logistic 定价模型和正态模型之间的密度比较,并观察到 logistic 模型的分布形状随时间变化,而正态分布的形状不随时间变化。他还将逻辑模型的累积期限结构与齐次模型的期限结构的线性革命进行了比较,并观察到前者的形状更加灵活。

  • 00:10:00 Lorenzo Torricelli 讨论了 CPDA 模型的图表以及 SLA 和 CPDA 模型的隐含波动率表面。波动率表面表明,由于对数回报的偏态分布和逻辑分布的峰度,正模型存在偏态。然而,逻辑分布没有偏斜,因为它是对称的。 Torricelli 提到模态参数也类似地影响波动率期限结构,并且在选择的参数化方面有改进的余地。总的来说,期权公式明确且已知,速度测试非常快。该代码也将公开。
Lorenzo Torricelli (University of Parma) - "Additive Logistic Processes in Option Pricing"
Lorenzo Torricelli (University of Parma) - "Additive Logistic Processes in Option Pricing"
  • 2021.04.12
  • www.youtube.com
On April 13th, 2021, as part of the Cornell-Citi Financial Data Science Seminar Series, Lorenzo Torricelli explains his work on logistic models in conjunctio...
 

Yumeng Ding (Cornell MFE '20) - “解释机器学习模型”



Yumeng Ding (Cornell MFE '20) - “解释机器学习模型”

Yumeng Ding 是一位经验丰富的研究员,他深入研究了解释用于股票价格预测的机器学习模型的领域。在她的综合分析中,她探索了一系列可解释性方法,包括部分依赖图、排列特征重要性、边缘统计和 LIME,以阐明这些模型的内部工作原理。通过采用这些方法,Ding 旨在揭示单个因素的贡献及其在预测股票价格中的交互作用。

丁的研究围绕三种因素展开:技术、质量和价值,它们被用作各种机器学习模型(如分类器和回归)的输入。利用前面提到的可解释性方法,她揭示了这些因素与股票价格预测之间错综复杂的关系。通过严格的回测,丁发现非线性模型在性能上优于线性模型。此外,她观察到不同因素的影响表现出时间变化,突出了股价预测的动态性质。最终,Ding 将 AdaBoost 确定为最适合其特定场景的模型。

重要的是,丁强调了可解释性方法在理解机器学习模型中的重要性。她强调,虽然矢量方法可以快速洞察最具预测性的交互,但它无法揭示这些交互的质量。 Ding 强调了使用二维部分依赖图有效可视化更简单交互的价值。此外,她还建议使用线图方法来深入研究个体交互的复杂性并可视化局部效果,只要数据足够清晰,没有噪音。

在总结她的发现时,丁强调了她项目中的两个关键要点。首先,她确认机器学习模型在大多数情况下优于线性朴素回归,因为它们能够捕获复杂的交互效应。其次,她强调了通过利用各种可解释性方法来解释机器学习模型的可行性。这些技术使研究人员能够阐明各个因素的贡献并理解它们对预测的交互影响。

  • 00:00:00 Yumeng Ding 讨论了他们解释用于进行股票价格预测的机器学习模型的方法。他们利用三种类型的因素——技术、质量和价值——使用各种机器学习模型(如分类器和回归)进行预测。为了解释他们的模型,他们使用了可解释性方法,例如部分依赖图、排列特征重要性、边缘统计和 LIME,这些方法允许分解单个特征效应及其相互作用。通过他们的回测,他们发现非线性模型优于线性模型,并且因素影响随时间而变化。他们得出结论,AdaBoost 是他们场景的最佳模型。

  • 00:05:00 Yumeng Ding 讨论解释机器学习模型的各种方法。她强调,虽然矢量方法可以快速有效地找到最具预测性的交互,但它只显示交互的强度而不是交互的质量。她强调二维部分依赖对于可视化一些简单的交互是必要的。丁建议,线图方法适用于深入研究个体交互的细节和可视化局部交互,前提是数据不太嘈杂。她最后指出,他们的项目突出了两个要点:首先,机器学习模型在大多数情况下都优于线性朴素回归,因为它们能够捕捉交互效应。其次,可以使用各种可用的可解释性方法来解释机器学习模型,这使我们能够解释各个因素如何单独和交互地对预测做出贡献。
Yumeng Ding (Cornell MFE '20) - "Interpreting Machine Learning Models"
Yumeng Ding (Cornell MFE '20) - "Interpreting Machine Learning Models"
  • 2021.03.12
  • www.youtube.com
March 9, 2021CFEM alumna Yumeng Ding discusses her team capstone project, which was titled, “Interpreting Machine Learning Models.” By utilizing Machine Lear...
 

Silvia Ruiz(Cornell MFE '20):“如何使用 NLP 技术预测股票走势”



Silvia Ruiz(Cornell MFE '20):“如何使用 NLP 技术预测股票走势”

西尔维娅·鲁伊斯 (Silvia Ruiz) 是康奈尔大学 MFE 项目的应届毕业生,她分享了她的项目的见解,该项目专注于使用 NLP(自然语言处理)技术预测股票价格。她的团队研究的目的是探索公司文件(例如 10-K 和 10-Q 报告)与随后对股价的影响之间的关系。为实现这一目标,他们从 EDGAR 网站收集了一个庞大的数据集,其中包含 1,095 份报告,涵盖标准普尔 500 指数五个行业的 50 家公司。

最初,Ruiz 和她的团队尝试了基于字典的模型,但在有效性方面遇到了局限性。为了解决这个问题,他们采用了先进的方法,例如 word to back 模型和 Finberg,事实证明,这对于理解公司文件中嵌入的上下文细微差别至关重要。此外,他们还采用了各种情绪指标,包括词的极性和复杂性,以及 xg 提升模型来预测股价走势。

他们预测的准确性在两个不同的时间范围内进行了评估。在短期内,他们的模型达到了 61% 的惊人准确率,而在长期内,它表现出了 53% 的可观准确率。利用这些预测作为投资决策的信号,它们的表现优于同等权重的投资组合。然而,Ruiz 强调需要跨不同部门进行进一步研究,以提高其研究结果的准确性和普遍性。

Silvia Ruiz 慷慨地提供了她的联系信息并提供了她在 Github 上的项目存储库的链接,从而结束了她的讨论。这种姿态鼓励后续查询并促进合作,以促进 NLP 技术在股票价格预测领域的理解和应用。

  • 00:00:00 刚从康奈尔大学 MFE 毕业生 Silvia Ruiz 谈到了她的项目,即是否可以使用 NLP 技术预测股票价格。 Sylvia 和她的团队旨在调查 10k 和 10q 等公司备案对公司股价的影响,并从标普 500 五个行业的 50 家公司的 edgar 网站收集了 1095 份报告的数据。他们发现使用基于字典的模型效果不佳,需要单词的方法来支持模型和 Finberg 来理解上下文。最后,他们使用了多种情绪指标,包括词的极性和复杂性,并运行了一个以预测股票价格为变量的 xg 提升模型。

  • 00:05:00 Silvia Ruiz 解释了她如何尝试使用 NLP 技术预测股票走势。她提到她的团队通过在报告发布前和发布后五天的股票价格来计算市场回报,并将它们与市场回报进行比较。长短期准确率为 61%,而长期准确率为 53%,他们将预测作为投资股票的信号。他们的策略比同等权重的投资组合更有效,但需要进一步研究,特别是跨不同部门,以获得更准确的结果。她分享了她的联系信息和 Github 链接以供进一步查询。
Silvia Ruiz (Cornell MFE '20): "How to Predict Stock Movements Using NLP Techniques"
Silvia Ruiz (Cornell MFE '20): "How to Predict Stock Movements Using NLP Techniques"
  • 2021.05.12
  • www.youtube.com
Silvia Ruiz will discuss her CFEM capstone project, which was titled, “How to Predict Stock Movements Using NLP Techniques.” By utilizing NLP techniques, the...
 

Charles-Albert Lehalle:“理解自然语言处理的尝试”



Charles-Albert Lehalle:“理解自然语言处理的尝试”

在此视频演示中,Charles-Albert Lehalle 和他的团队深入研究了自然语言处理 (NLP) 在金融领域的应用。他们的讨论围绕三个关键领域展开:情绪分析、股价预测和交易成本建模。他们承认与 NLP 相关的挑战,例如过度拟合和嵌入偏差的风险,并提出了潜在的解决方案,包括多任务学习和扩展词典。该团队探索了自然语言处理在金融行业的潜力和局限性,强调了理解不同行业背景和语言模式的重要性。

Lehalle 和他的团队展示了他们自己使用 NLP 技术进行的实验,就 NLP 如何压缩信息并为金融分析师提供信息指标提供了宝贵的见解。他们强调了在金融领域采用 NLP 的挑战,包括对特定领域知识的需求以及从非结构化文本数据中提取有意义信息的困难。还讨论了围绕在金融中使用 NLP 的道德问题,例如利用社交媒体数据进行交易。

在整个演示过程中,Charles-Albert Lehalle 分享了他在各种 NLP 主题方面的专业知识和知识。他解释了基于词典和基于嵌入的 NLP 方法在金融领域的应用,并提出结合这两种方法来捕获文本数据中的词汇和概率特征。解决了在嵌入中区分同义词和反义词的挑战,Lehalle 的团队探索了生成模型来控制文本的结构和情感。强调了理解嵌入和参考模型(例如表示联合词分布的矩阵)的重要性。

Lehalle 进一步探讨了上下文在 NLP 中的重要性,讨论了嵌入如何根据上下文偏向于正面和负面的词。他解释了如何使用马尔可夫链构建参考矩阵模型,并展示了在嵌入中识别同义词的实验。承认 NLP 在捕获公司名称及其相关极性方面的局限性,以及针对监督嵌入的多任务学习的建议。演讲者还谈到了 Loughran-McDonald Lexicon 的正面和负面词汇的不平衡以及处理金融文本中反讽的挑战。

演讲最后概述了 Sylvia Ruiz 的一个项目,她是康奈尔大学金融工程的应届毕业生。该项目侧重于使用 NLP 技术预测股价,特别是通过从 50 家标准普尔 500 指数公司的 10-K 和 10-Q 文件中提取管理讨论部分,并分析情绪以评估其对股价的影响。 Lehalle 讨论了基于字典的模型的局限性,并解释了他们的团队如何扩展字典、使用 FinBERT 来理解上下文并利用各种功能来衡量情绪。无论从短期还是长期来看,它们都比同等权重的投资组合取得了更好的表现。

总之,Charles-Albert Lehalle 和他的团队阐明了 NLP 在金融领域的潜力和挑战。他们提供了有效应用 NLP 技术的见解、实验和策略,同时强调负责任地使用以及对技术和金融领域的深刻理解的重要性。

  • 00:00:00 演讲者介绍量化金融专家 Charles-Albert Lehalle,他将就 NLP 发表 40 分钟的演讲。演讲者提到了 Lehalle 过去关于量化金融的出版物,其中涵盖了 NLP 的多个主题。演讲者还介绍了最近从康奈尔大学毕业并在 Rebellion Research 从事 NLP 项目的 Sylvia Ruiz。该演讲旨在帮助人们开始使用 NLP,由于需要数据抓取和应用程序包,NLP 通常让人感到害怕。演讲者简要介绍了 NLP 在金融领域的应用,并提到 Lehalle 的团队使用 NLP 已经一年多了,一些预测器和策略已经投入生产。该演讲基于 Mengedar 正在进行的工作,演讲者鼓励听众发送他们认为应该包含在演讲中的链接或论文。

  • 00:05:00 Charles-Albert Lehalle 讨论了在金融交易中使用自然语言处理 (NLP) 的可能性。通过使用 NLP,交易者能够快速访问文本形式的信息,例如收益公告、社交媒体和金融新闻的抄本。此信息可以使交易者在其他人之前购买时具有速度优势,从而使价格上涨。此外,交易员可以使用 NLP 对许多公司的大量文本进行横切,并根据预期回报对其进行排名。然而,Lehalle 指出,由于可能的参数数量,NLP 存在过度喂养的高风险。尽管如此,通过了解收到的信息,交易者可以相应地调整他们的策略以获得潜在利润。

  • 00:10:00 Charles-Albert Lehalle 讨论了基于词典和基于嵌入的自然语言处理 (NLP) 方法在金融领域的应用。他解释了基于词典的系统是如何由人类分析师构建的,他们对大量文本进行注释以识别对股票的正面或负面情绪,而基于嵌入的系统则对单词的概率上下文进行建模。 Lehalle 建议将这两种方法结合起来,以捕获金融市场文本数据的词汇和概率特征。他还概述了他探索嵌入如何捕捉同义词和反义词的方法,这对金融预测分析具有实际意义。

  • 00:15:00 在本节中,Charles-Albert Lehalle 讨论了自然语言处理 (NLP) 中涉及的挑战。虽然捕获同义词可以降低文本的复杂性,但嵌入可能难以区分同义词和反义词。如果您想将词典注入无法区分它们的系统,这会带来挑战。 Lehalle 的团队正在尝试开发一个文本生成模型来控制文本的结构和情感,看看他们是否可以恢复他们放入语言中的内容。他们计划使用大量财经新闻语料库来应用这些技术并分析它们的工作原理。这个过程的理论方面包括使用单词 2x keygram 方法和随机矩阵。

  • 00:20:00 在本节中,Charles-Albert Lehalle 使用 skip-gram word2vec 模型解释了自然语言处理。他讨论了嵌入矩阵的低秩分解,以及如何将其重写为具有软最大输出的神经网络。他还解释了像 BERT 这样的模型中的注意力头如何更本地化,有很多本地嵌入处理上下文。他强调了理解嵌入和参考模型的重要性,参考模型是一个用于优化损失函数的大隐藏矩阵。

  • 00:25:00 Charles-Albert Lehalle 解释了自然语言处理中参考模型的概念。他讨论了不同类型的参考模型,包括表示所有单词联合分布的大矩阵、真实参考模型的统计估计以及生成文本的隐藏参考模型。他还谈到了常客同义词,这些词具有相同的嵌入,即使从语义的角度来看它们是反义词,因为它们经常出现在语料库中的相同位置。这种理解在自然语言处理中的伦理讨论中很重要。

  • 00:30:00 在本节中,Lehalle 讨论了上下文在自然语言处理中的重要性,并举例说明了嵌入如何根据上下文偏向于正面和负面的词。他还解释了使用马尔可夫链生成语料库如何帮助构建单词的大参考矩阵模型,以及正确嵌入单词的损失函数如何是两个分布之间的交叉熵。提出的第一个实验涉及设计具有同义词的合成语言,并尝试将同义词恢复为嵌入中的块。然而,发现嵌入的可识别性较差,因此很难从大嵌入中恢复低维空间。最后,计算同义词嵌入之间的余弦相似度。

  • 00:35:00 Charles-Albert Lehalle 讨论了使用 Lung Hand Micro Lexicon 来训练嵌入以区分正面和负面金融新闻标题。他指出,嵌入并不是为了区分经常一起出现的同义词,例如标题中的词,因此使用标题上的嵌入来识别正面和负面的词是具有挑战性的。然而,随着时间的推移观察财经新闻的正文,余弦相似度指标表明正面和负面的词可以清楚地区分。 Lehalle 还表明,在金融危机期间,公司名称(例如银行)更接近于负面词而不是正面词。总的来说,词汇在嵌入中的定位极大地影响了他们区分财经新闻中正面和负面词汇的能力。

  • 00:40:00 演讲者 Charles-Albert Lehalle 讨论了自然语言处理 (NLP) 在公司名称及其相关极性以及嵌入的非平稳性方面的局限性。他建议嵌入侧重于优先考虑邻域词的分布,使它们难以区分频率和同义词。 Lehalle 继续建议多任务学习,同时训练嵌入和由极化词典监督的任务,可能是一个好主意。此外,他指出,公司名称可能是一个有用的声誉指标,与试图欺骗 NLP 算法的公司相比,NLP 生成的新闻报道更受关注。最后,他解释说,NLP 算法可能会被用来提取信息并用新的价值来标记它,从而允许推断出分析师的估计而不是价格。

  • 00:45:00 在视频的这一部分,演讲者讨论了 Loughran-McDonald Lexicon 中负面词和正面词的不平衡,该词库由人类建立,用于自然语言处理 (NLP) 以进行金融文本分析。他们认为,这种不平衡可能是由于倾向于保护的律师所写的财务文件的法律和结构化性质造成的。演讲者还谈到了 NLP 在交易成本建模中的使用,以及处理长篇金融文本中的讽刺意味的挑战。然后他们介绍了 Sylvia Ruiz,她是康奈尔大学金融工程项目的应届毕业生,她介绍了她的团队使用 NLP 技术预测股票价格的项目。该项目的重点是从标准普尔 500 指数成份股的 50 家公司的 10K 和 10Q 文件中提取管理层讨论部分,并分析情绪以确定对股价的影响。

  • 00:50:00 Charles-Albert Lehalle 讨论了使用基于字典的模型进行自然语言处理 (NLP) 的问题,以及他和他的团队如何使用 NLP 技术改进他们的模型。他解释了他们如何通过使用 skipgram 模型和 FinBERT 模型来理解上下文来扩展他们的词典以对单词进行更平衡的分类。然后,他们在运行 xg 提升模型以预测股票价格是上涨还是下跌之前,使用各种特征来衡量情绪和单词的复杂性。尽管他们的准确性相对较低,但他们能够制定出一种在短期和长期都比同等权重的投资组合表现更好的策略。

  • 00:55:00 Charles-Albert Lehalle 讨论自然语言处理 (NLP) 在金融行业的潜力。他建议有必要进行更多的研究,并且将行业划分为部门可能是有益的,因为每个部门都有不同的语言模式。此外,他建议不要试图同时理解文本和预测诸如期望之类的东西,因为 NLP 可能更好地用于压缩信息并提供信息指标。相反,分析师可以使用自己的推理将预测与预期进行比较,并创建一个“意外预测器”。总的来说,Lehalle 强调在尝试将 NLP 集成到财务分析中之前,需要了解 NLP 的局限性和优势。

  • 01:00:00 在本节中,演讲者讨论了使用 NLP 模型的对抗训练来提高其鲁棒性。该技术可用于解决语言偏见,例如性别中立。演讲者还考虑使用对抗训练来打破正面和负面词语之间的中立性,但警告说这可能不适合构建交易策略。然后,讨论转向从财务文件(例如 10K 文件)中提取部分的挑战,因为公司在标记和格式化其部分的方式上存在差异。

  • 01:00:00 演讲者讨论了使用 NLP 模型的对抗训练来提高它们的鲁棒性。该技术可用于解决语言偏见,例如性别中立。演讲者还考虑使用对抗训练来打破正面和负面词语之间的中立性,但警告说这可能不适合构建交易策略。然后,讨论转向从财务文件(例如 10K 文件)中提取部分的挑战,因为公司在标记和格式化其部分的方式上存在差异。

  • 01:05:00 在视频的这一部分,Charles-Albert Lehalle 解释说他没有比较自己的嵌入和彭博社的情绪指数,因为这不是研究的目的。他认为,彭博社的预测者可能是在尝试建立预测指标,而不是指数,后者很难作为基准。他透露,有关于使用 NLP 构建经验资产定价因子的论文,并解释说 NLP 可用于根据语料库中包含的信息创建许多因子,例如 10k 因子或风险部分因子。因此,NLP只是一种技术,而语料库是这种情况下最重要的因素。
Charles-Albert Lehalle: "An Attempt to Understand Natural Language Processing"
Charles-Albert Lehalle: "An Attempt to Understand Natural Language Processing"
  • 2021.02.17
  • www.youtube.com
Full Title: "An Attempt to Understand Natural Language Processing And Illustration On A Financial Dataset"Speaker: Charles-Albert Lehalle (Capital Fund Manag...