牛津大学研究员 Martin Scholl 使用基于主体的模型深入研究了市场生态学。与依赖有效市场假设等假设的传统方法不同,Scholl 对新古典金融中普遍采用的理性预期均衡理论提出质疑。他认为,这一理论要求所有参与者对现实世界有一个完美的理解,考虑到散户投资者和基金经理的认知局限性,这是不现实的。相反,他提倡应用生物学工具来分析现实世界的金融数据,为理解金融市场提供全新的视角。
Martin Scholl 的研究重点是使用基于主体的模型研究市场生态。他通过应用生物学概念更好地理解金融市场来挑战传统金融理论和假设。通过将投资策略与生物学中的物种进行比较、分析不同的策略并模拟市场机制,Scholl 揭示了金融市场的复杂性以及各种策略之间的相互作用。他的研究结果表明,金融市场高度依赖密度,适当调整投资策略对于避免损失和成为这个动态生态系统中的猎物至关重要。 Scholl 的工作对市场作为复杂系统的本质提供了宝贵的见解,与股票价格仅反映基本信息的传统观点形成鲜明对比。
00:00:00 来自牛津大学的 Martin Scholl 使用基于主体的模型讨论了他对市场生态学的研究。他解释说,他没有关注有效市场假说等常见假设,而是质疑新古典金融中使用的理性预期均衡理论,因为它要求所有参与者的理解与现实世界相匹配。他还透露,金融文献中有 300 多种因子模型,很难确定最佳使用的模型,散户投资者和基金经理的认知能力也存在物理限制。此外,他还讨论了将生物学工具应用于现实世界数据以更好地了解金融市场的重要性。
00:05:00 Martin 讨论了如何使用基于代理的模型来研究市场生态。他解释说,投资策略可以比作生物学中的物种,个人投资者对应于特定物种的个体。使用特定策略投资的总财富是该物种的丰度或总种群规模。 Scholl 引入了一个投资游戏的玩具模型,代理人可以选择将他们的财富留在货币市场账户或投资于支付股息的股票。该模型适用于一只股票,这是一个简化的假设,在大多数情况下允许唯一的清算价格。 Scholl 还阐述了完美理性投资者的新古典主义假设,并强调了对这种方法的反对意见。
00:10:00 Martin Scholl 使用生物学的隐喻解释了市场生态学的概念。他根据参与原因对市场中的代理人进行划分,并引入超额需求函数作为定义策略的一种方式。他解释了如何在投资过程中使用信号函数,以及不同的投资基金如何根据获取的信息和分析倾向于专注于不同的事物。战略的划分在不断发展的市场中至关重要,在这种市场中,专注于特定的利基市场以优化某些事物是有益的。
00:15:00 Martin Scholl 讨论了在基于代理的模型中用于研究市场生态的不同策略。第一种策略是完全理性的策略,其中资产净值在股票和现金之间分配。价值投资者估计股息的增长率来做出预测,有助于了解未来股票的价格。第二种策略是基于趋势追随者,他们查看最近的价格并推断这些趋势。最后,该模型包括进入市场以满足流动性需求但对价格不敏感的噪声交易者,因此他们的信号在短时间范围内看起来是随机的。然而,正如 Buscher 及其同事所估计的那样,他们的均值反转噪声过程在很长一段时间内与基本值相关,并且会慢慢恢复到均值。
00:20:00 Martin 解释了他们如何使用基于代理的模型模拟市场机制,这使他们能够研究市场生态。由于可能的解决方案众多,因此很难对模拟进行分析处理。因此,他们使用软件包来模拟不同的市场机制。他们固定禀赋以确保模型的不同运行之间的结果具有可比性。他们还将初始禀赋分配给不同物种的个体,并记录相对份额。他们运行了 200 年的模拟,并查看每个物种的平均年回报率。他们观察到,对于所有三种策略,至少有一个区域是它们最赚钱的区域,即使该区域不是物种最丰富的区域。
00:25:00 牛津大学的 Martin Scholl 讨论了一项涉及趋势追随者的实验,其中价格偏离基本价值,由于股息过程的随机实现和引入的噪音而导致巨额利润和损失。该系统的大部分设计都花在了不稳定、混乱的区域,其中有大量异常值会产生斑点噪声。在第二个实验中,投资者被允许将利润再投资,轨迹被描绘成一个单纯形,财富被重新分配,但它们隐约地向确定的中心点汇聚,而不是左右波动。系统往往在确定的有吸引力的固定点附近区域,每个交易日公布市场清算价,影响交易者的估值和价格。
00:30:00 Martin 解释了在分析具有趋势追随者、价值投资者和噪声交易者的系统中的固定点时通过蒙特卡罗实验获得的不同流线。线条的粗细表示每年在策略之间重新分配的财富数量,这表明大量的趋势追随者如何在系统中造成巨大损失。 Scholl 继续强调,拥挤对趋势追随者的作用与对价值投资者的作用不同,趋势追随者的集中度增加会导致回报的波动性增加。系统快速远离趋势追随者的根本原因是投资者的理性和分红过程中的正自相关。
00:35:00 Martin Scholl 解释了如何使用基于主体的模型来研究市场生态以及如何构建金融社区矩阵。 Scholl 类比生物学中种群动力学中使用的捕食者和猎物 Volterra 方程,用于描述不同种群的动态,即不同物种如何根据种群规模相互作用。他指出,这个概念也可以应用于金融市场,其中特定策略的回报将被视为种群规模,而一个物种的回归对种群规模变化的敏感性将代表社区矩阵。
Abstract: This talk presents a mathematical analogy between financial trading strategies and biological species and shows how to apply standard concepts fro...
讨论了与股票头寸估值相关的问题及其对公司损益的影响。韦伯斯特强调了确定使用哪些价格来标记股票头寸的模糊性,以及会计损益与交易算法使用的基本损益之间的差异。交易足迹定义为会计损益与基本损益之间的差异,在平仓时解决了歧义。演讲者探讨了头寸膨胀,做出了该属性成立的某些假设。还涉及了撞击模型及其两个案例,即最初的 OW 痣和 Fruehwirth 和 Bond 研究的 W 痣。
00:15:00 演讲者讨论了有关流动性压力测试的各种文件的要点,包括决策者使用它们的必要性及其基于模拟的结构。他们推荐了 Francelli 的一篇关于模拟市场压力期间价格错位的论文,以及 Schweizer 和 Urzua 的两篇论文,它们为 OB 模型提供了另一种证明并大大提高了它的适用性。演讲者还介绍了交易足迹的概念,它将不同的损益定义联系在一起,并衡量价格影响对会计损益的扭曲效应。最后,他们建立了一个简单的甩卖模型来说明 Casadio-Bouchard-Farmer 论文关于会计损益的有力结论。
00:20:00 Kevin Webster 讨论价格影响如何扭曲会计损益。他解释了交易员和平台经理每天查看的数字如何高估了他们的最终损益,从而在他们完成交易时使其缩小。然而,通货膨胀属性可以实时测量和显示,使交易者可以采取行动。韦伯斯特指出,头寸膨胀部分的损失通常是暂时的,取决于风险承受能力。最后,他介绍了交易者在计算盈亏时需要考虑的数学设置、变量和数量。
00:25:00 在本节中,凯文韦伯斯特解释了与股票头寸估值相关的问题,以及它如何影响公司的损益 (P&L)。他谈到了确定使用什么价格来标记股票头寸的模糊性,以及交易算法使用的会计损益与基本损益之间的差异。他将交易足迹定义为会计损益与基本损益之间的差异,并解释了在平仓时如何消除歧义。他还讨论了头寸膨胀并提供了该属性成立的一些假设。最后,他提到了影响模型及其两个案例,即 Fruehwirth 和 Bond 研究的原始 OW 痣和 W 痣。
00:30:00 Kevin Webster 解释说,为了使模型有意义,lambda 和 beta 之间需要有无套利条件,以及需要满足的自筹资金方程条件。他还详细介绍了如何在收盘时计算预期损益,以及交易足迹如何将偏差引入会计损益。最后,他讨论了仓位膨胀属性如何导致仓位在进仓阶段膨胀,在持仓阶段停留,并最终蒸发。所有这些都可以在交易屏幕上实时观察到。
00:40:00 Kevin Webster 讨论固定投资组合的概念以及如何使用它来估算运行交易成本。通过了解传播者的时间尺度,交易者可以估计他们的头寸被夸大了多少,以及如果他们开始清算他们的头寸,他们可能会损失利润的错觉。韦伯斯特随后在经验数据上模拟了该框架,并强调这些公式可以应用于现实世界的场景。最后,他将该框架应用于甩卖模型,并解释了会计损益与基本损益之间的差异,以及它们如何根据交易者的风险厌恶程度为不同的目标函数提供信息。
00:45:00 Kevin 讨论甩卖或其他市场参与者的交易活动如何影响交易者的损益和头寸。他证明激进的对冲会导致拥挤效应和头寸膨胀,从而导致永久性损失。此外,他还强调了准确建模价格影响以有效管理风险的重要性,并强调了在结束流动性不足头寸之前管理流动性风险的重要性。最后,他指出,虽然有许多不同的价格影响模型,但它们通常对大部分数据达成一致。
01:00:00 Kevin Webster 讨论价格影响如何扭曲会计损益。他解释说,高波动性流动性制度期间的额外成本以及与其他市场的相关性可能会在一定程度上造成这种偏见。从监管的角度来看,公司债券和保险公司可能更容易受到这种偏见的影响。然而,正如他承认的那样,他没有非常详细的答案,因为他不确定如何回答股票以外的某些问题。总的来说,他提供了对价格影响及其如何扭曲损益的数学理解。
00:00:00 Laura Leal 介绍了她与 Matthias 和 Charlotte 在使用深度神经网络解决高频金融中的最优执行问题方面的合作。目标是避免大的市场影响并尽可能顺利和秘密地进行交易。该团队引入了可解释性的想法来解决神经网络是黑匣子的问题,他们将神经网络控制投射到低维流形上,以更好地理解风险以及神经网络解决方案与熟悉的风险之间的差距部门。他们评估性能,查看价值函数、财富标记市场和预测中的相对误差,并将神经网络解决方案与经典的封闭式 PDE 解决方案进行比较。
00:05:00 来自普林斯顿大学的 Laura Leal 讨论了神经网络如何改进传统解决方案的局限性,例如 PD(偏微分)模型,这些模型难以适应自相关、重尾等高频金融的复杂性和日内季节性。然而,神经网络运行起来可能很耗时,因此她提出了一个多偏好控制器,输入交易者的风险偏好以更快地适应新的日子,生成随机优化问题的解决方案。然后,Leal 概述了文献,包括最佳执行模型,并解释了神经网络可以在高频金融中学习的状态变量,如库存、控制和价格。
00:10:00 Laura 讨论了高频金融中价格过程的演变及其如何受到交易速度的影响。她解释了交易速度越快,消耗的流动性就越多,从而推高价格并产生永久的市场影响。最小化的客观标准取决于控制,即交易速度,并且具有终端组件和运行成本组件。终端成本分为三个部分,包括最终的现金财富、持有库存的罚款以及最终库存可以卖多少钱。运行成本是全天持有库存的惩罚,这两个参数对于风险管理至关重要。 Leal 还讨论了 gamma 对于他们的神经网络解决方案的重要性,并且在文献中通常被视为等于 2。
00:15:00 来自普林斯顿大学的演讲者 Laura Leal 解释了使用神经网络来学习高频金融问题中的近似值,其中价值函数在库存上有一些二次项。使用神经度量时的等效解决方案不同于优化控制 mu,因为必须选择神经网络的参数。神经网络用于所有时间步长,使其能够学习如何根据代理的价格、库存和财富做出反应。该过程使用具有时间和库存输入的前馈、完全连接的神经网络结构。但是,可以通过多种方式对输入进行概括,以包含比视频中用于说明目的的风险偏好参数更多的输入。
00:30:00 Laura 检查神经网络控制在执行高频金融交易时的性能和准确性。她将价值函数和标记与不同场景和伽玛值的市场财富进行了比较。她还评估了投影中的相对误差,并指出虽然神经网络具有更好的性能,但它以与已知控制不同的非线性方式执行。这引发了关于是否使用神经网络进行交易以及根据其与舒适的已知解决方案的距离设置多少保证金的问题。
Laura Leal (Princeton University) is our last speaker for the Fall 2021 seminar series. Her topic is called "Learning a Functional Control for High-Frequency...
CFEM alumnus Vineel Yellapantula discusses his summer project at AbleMarkets under Prof. Irene Aldridge, “Quantifying Sentiment in SEC Filings.” By utilizing...
Zhang 解决了人们对神经网络方法中使用的大量参数及其在预测股市方面的有效性的担忧。他承认大量参数可能会受到批评,但强调他的团队只微调了几个特定于他们模型的参数。他们尚未考虑使用买卖差价作为成功的标准,但认识到其进一步探索的潜力。张认为他们的模型对交易执行和做市策略具有实用价值。但是,他提到,如果打算跨越价差,则可能需要对数据进行下采样,因为订单簿数据的频繁更新会使交易执行复杂化。最后,在为 Elo 限价订单簿建模时,他们汇总了每个价格水平的总规模,而不是包括有关单个订单规模的信息。
00:00:00 Zihao Zhang 是 Oxford Man Institute 的博士后,也是机器学习研究小组的一员,介绍了他最近与 Brian Ling 和 Stefan Loren 合作,将深度学习模型应用于按订单数据进行市场营销。张先生首先简单介绍了市场微观结构数据,包括限价订单簿和订单市场数据。他强调,后者可以说是最精细的信息来源,与限价订单簿数据相比,它提供了更多的更新和事件,但在当前的文献中基本上被忽视了。 Zhang 介绍了他们的深度学习模型,并讨论了他们为此类数据设计的网络架构。他还强调,他们的工作是第一个使用市场按订单数据预测高频运动的预测模型,它提供了一个正交信息源,扩展了 alpha 发现的范围。
Next up in the Cornell-Citi webinar series is Dr. Zihao Zhang, who spoke on Tuesday, Oct. 26.Abstract: Market by order (MBO) data - a detailed feed of indiv...
在后面的部分中,Carr 和 Lorenzo Torricelli 提出了一个使用共轭范式和逻辑分布的“停止”模型。该模型通过单一参数提供了期限结构的灵活性,允许一次性适应各种期限结构。然而,由于其向下倾斜的隐含波动率图,它可能并不完全适合市场。作者承认他们模型的局限性,并认识到他们的模型旨在捕捉金融中无数的二元操作。他们讨论了罢工和单一期权之间的可选性,以及通过伪求和的重复可选性。该部分以互相欣赏和期待参加彼此的研讨会作为结尾。
00:00:00 Peter Carr 介绍了“止损”,这是一种新的金融产品,它是期货合约和看跌期权的混合体。止损具有标的资产和固定期限,并进行每日监控,所有者应计入标的的每次价格变化。止损与期货合约的不同之处在于,所有者可以通过看跌期权元素避免不利的价格变化。看跌期权是百慕大看跌期权,这意味着所有者可以在任何一天结束时行使它,将当天的价格变化替换为下限,合同规定的常数可以是时间的任何函数。
00:05:00 Peter Carr 解释了期权的概念以及它们在金融协议中的作用。期权是一种金融产品,只要在止损合约中有超过一天的时间,它就可以选择何时停止承受价格变化的风险,从而提供灵活性。一个人只能行使一次期权,并且在那个时候,他们必须行使。期权一词是指何时通过行权停止对标的资产的敞口。卡尔以三天期权为例说明了这一概念,并概述了与该期权相关的三个不同楼层。当一个人行使期权时,合同就会到期,这只能发生一次。虽然此类合同目前不进行交易,但它们已嵌入许多金融协议中。
00:10:00 Peter Carr 讨论了一个与百慕大行使风格的合同示例,称为“停止”。虽然它不是直接交易,但止损可以帮助理解百慕大掉期期权及其与价格水平期权的区别。通过假设 iid 价格变化,止损估值被简化为函数迭代,并且通过对价格变化施加特定的分布假设,估值被简化为伪加法。从止损中获得的见解可用于流动性交易的百慕大期权,卡尔继续解释一日和两天止损的估值。一日止损支付固定的底价,而两天的止损有两层,可以在第一天或第二天行使。
00:20:00 在本节中,来自纽约大学的 Peter Carr 和来自帕尔马大学的 Lorenzo Torricelli 讨论了如何通过假设价格增量在统计上相互独立并且具有相同的分布来对两天和三天的期权进行估值。他们使用统计学中的一个常见假设,称为 iid(独立同分布),用于一系列随机变量。为了对为期两天的期权的已婚看跌期权进行估值,他们使用了一种符号,该符号涉及收益的已知部分,称为 a1,以及标的资产今天的价格,称为 a2。对于三天的期权,他们引入了一个连续值,用 cv 表示,并使用动态规划来计算它的值。
00:25:00 Peter Carr 解释了向后递归的过程和已婚看跌期权的估值。他从第二天开始,因为问题中所需的所有不确定性在第二天结束时都已解决。他将持续价值设置为第二天,即第三天,还有一个行使机会,然后退回第一天,计算收益价值和持续价值。然后,他退回到估值日的零时间并计算持续价值和收益,即已婚看跌期权的价值。随机收益的均值是先前计算的已婚看跌期权价值,影响价格变化分布的参数在零时已知。
00:35:00 Peter Carr 解释了伪和的概念,伪和是函数中两个参数的组合。通过使用可逆函数,该数量可用于通过楼层的重复伪和来查找基于 n 的选项的值。为了使这种方法无套利,必须仔细选择函数并将其表示为对其收益的风险中性期望。 Carr 表明此方法的生成器必须是任何基数的对数,并且标量 b 必须为正。已婚看跌期权还必须使用自然对数 g 逆函数进行适当评估,这需要对罢工进行两次微分以获得分布函数。最终,该方法涉及到 b 的比例因子,它不是标准差,而是与其成正比。
00:45:00 彼得讨论“止损”,这是一种结合了期权和掉期特征的合约。停止涉及将一个逻辑随机变量交换为另一个,其中变量是独立的且分布相同的。要对 n 天的停靠点进行估值,需要指定 t 的函数 b,它将逻辑分布的宽度与时间范围的长度联系起来。百慕大止损的价值由简单的公式给出,估值和对冲可以通过分析来完成。对于“平价”止损,价值以一种简单的方式增长,即时间的对数。
00:50:00 Peter Carr 讨论了“停止”定价模型,该模型假设 iid 增量并将估值减少到迭代函数评估。通过假设常见增量的逻辑分布,该模型进一步简化为特定类型的伪和,称为对数和指数函数。由于有限责任,标的证券价格需要真实且非负数。该模型可以扩展到股票,重新定义期权合约以乘以相对价格而不是增加价格增量。支持正随机变量的结果分布称为共轭幂数字分布,它是具有负偏度的重尾分布,是一个不错的选择。该模型有未来的研究机会,可以应用于实际用途,例如与美联储会议的同步合同。
00:55:00 纽约大学教授彼得卡尔讨论了市场对一种期权的采用以及寻找买家和卖家的过程。他谈到了他与美国银行首席外来交易员的谈话,他表示有兴趣购买期权,以及可能的卖方,例如保险公司或养老金计划。收养过程涉及寻找买家,Peter 分享说,他计划与一位在保险公司工作的朋友就此进行 Zoom 通话。对话以 Lorenzo Torricelli 对基于物流分布和相关流程的财务模型的讨论结束。
Abstract: We introduce a new derivative security called a stoption. After paying an upfront premium, the owner of a stoption accrues realized price changes ...
00:00:00 帕尔马大学的 Lorenzo Torricelli 介绍了基于物流配送的财务模型,首先介绍了期权函数的估值方程和用于评估价值亭的函数。通过对 k 取导数,得到隐含的证券价格分布,可以看出 logistic 函数与标的物的真实价值相关联,而偏态 logistic 分布与来自 merit put valuation 的正价格过程相关联.将分布的无限可分结构视为一个时间族,并验证了加性过程的存在性,得到支持隐含价格分布并确定语句公式的独立增量的随机连续过程。
On April 13th, 2021, as part of the Cornell-Citi Financial Data Science Seminar Series, Lorenzo Torricelli explains his work on logistic models in conjunctio...
March 9, 2021CFEM alumna Yumeng Ding discusses her team capstone project, which was titled, “Interpreting Machine Learning Models.” By utilizing Machine Lear...
最初,Ruiz 和她的团队尝试了基于字典的模型,但在有效性方面遇到了局限性。为了解决这个问题,他们采用了先进的方法,例如 word to back 模型和 Finberg,事实证明,这对于理解公司文件中嵌入的上下文细微差别至关重要。此外,他们还采用了各种情绪指标,包括词的极性和复杂性,以及 xg 提升模型来预测股价走势。
Silvia Ruiz will discuss her CFEM capstone project, which was titled, “How to Predict Stock Movements Using NLP Techniques.” By utilizing NLP techniques, the...
Full Title: "An Attempt to Understand Natural Language Processing And Illustration On A Financial Dataset"Speaker: Charles-Albert Lehalle (Capital Fund Manag...
Martin Scholl(牛津大学):“Studying Market Ecology Using Agent-Based Models”
Martin Scholl(牛津大学):“Studying Market Ecology Using Agent-Based Models”
牛津大学研究员 Martin Scholl 使用基于主体的模型深入研究了市场生态学。与依赖有效市场假设等假设的传统方法不同,Scholl 对新古典金融中普遍采用的理性预期均衡理论提出质疑。他认为,这一理论要求所有参与者对现实世界有一个完美的理解,考虑到散户投资者和基金经理的认知局限性,这是不现实的。相反,他提倡应用生物学工具来分析现实世界的金融数据,为理解金融市场提供全新的视角。
为了探索市场生态,Scholl 将投资策略比作生物学中的物种,个人投资者代表特定物种的个体。使用特定策略投资的总财富与该物种的丰度或总种群规模相当。在投资游戏的玩具模型中,Scholl 介绍了一个简化的场景,代理人可以选择将他们的财富留在货币市场账户或投资于支付股息的股票。该模型允许检查各种投资策略和反对新古典主义的完美理性假设。
Scholl 确定了基于代理的模型中采用的不同投资策略来研究市场生态。第一种是完全理性的策略,资产净值在股票和现金之间分配。价值投资者估计股息的增长率以做出未来预测并了解股票的未来价格。第二种策略涉及分析近期价格并推断趋势的趋势追随者。第三种策略包括进入市场以满足流动性需求但在短期内对价格不敏感的噪声交易者。然而,它们的均值反转噪声过程在很长一段时间内与基本值相关联。
为了模拟市场机制和研究市场生态,Scholl 和他的团队在软件包的帮助下使用基于代理的模型。他们通过固定禀赋并将初始禀赋分配给不同物种的个体来确保模型不同运行之间的可比性,并跟踪相对份额。模拟运行了 200 年,能够观察到每个物种的平均年回报率。有趣的是,他们发现每种策略至少有一个区域是最有利可图的,无论其丰富程度如何。
在他的实验中,Scholl 检验了趋势追随者的行为和利润再投资的影响。他观察到,市场大部分时间都处于一个不稳定、混乱的区域,存在大量异常值,导致出现斑点噪声。当投资者将他们的利润再投资时,轨迹会围绕一个确定的中心点波动,但不会完全趋同于该中心点。增加趋势追随者的集中度会导致更高的回报波动。 Scholl 将趋势追随者的快速转变归因于投资者的理性和股息过程中的正自相关。
Scholl 解释说,基于主体的模型可以用来构建金融社区矩阵,类似于生物学中使用的捕食者和猎物 Volterra 方程。特定策略的回报等同于人口规模,回报对人口规模变化的敏感性代表社区矩阵。在金融市场中,当价格偏离均衡点时,就会出现不同策略之间的竞争。 Scholl 强调,金融市场表现出密度依赖性,使得物种相互作用比生物系统中的相互作用更加复杂。这种密度依赖性导致类似泡沫的价格上涨等情况,但承认这种情况是不现实的。
在市场生态学的背景下,Scholl 讨论了他的发现的实际意义。他提出了一个线性模型,该模型使用物种的丰度来描述不同类型捕食者之间的关系,从而影响市场结果。这种方法突出了投资的多维性质,并证明了适当调整策略规模以避免损失或成为高度依赖密度的金融市场猎物的重要性。它挑战了股票价格反映所有可用基本信息的传统观点,并将金融市场呈现为受各种条件影响的复杂系统。
Scholl 进一步阐述了他在基于代理的模型中使用简单线性模型来研究市场生态。通过分析市场活动的持有量和相对丰富度,他发现这种方法优于部门派生的模型,这些模型假设理性并自动转换基本面。然而,他承认他的模型存在局限性,并强调需要进一步研究以增强其真实性。他谈到的一个方面是模型对不同配方和定义的敏感性,特别是在趋势跟踪方面。虽然股息在他的模型中发挥着重要作用,但为现实世界的金融市场纳入更现实的元素将需要额外的步骤。
关于代理人对其模型的信念的适应性,Scholl 指出,市场运作通常涉及基金经理长期遵循招股说明书中概述的策略。这表明倾向于机械资产分配过程。因此,Scholl 倾向于对适应性较低的行为和智力进行建模。不过,他强调说,他在牛津大学的团队中的其他研究人员正在积极探索进化算法在改变参数甚至创新新策略方面的应用。
Martin Scholl 的研究重点是使用基于主体的模型研究市场生态。他通过应用生物学概念更好地理解金融市场来挑战传统金融理论和假设。通过将投资策略与生物学中的物种进行比较、分析不同的策略并模拟市场机制,Scholl 揭示了金融市场的复杂性以及各种策略之间的相互作用。他的研究结果表明,金融市场高度依赖密度,适当调整投资策略对于避免损失和成为这个动态生态系统中的猎物至关重要。 Scholl 的工作对市场作为复杂系统的本质提供了宝贵的见解,与股票价格仅反映基本信息的传统观点形成鲜明对比。
凯文韦伯斯特:“价格影响如何扭曲会计损益”
凯文韦伯斯特:“价格影响如何扭曲会计损益”
在 YouTube 视频中,凯文韦伯斯特深入探讨了价格影响如何扭曲会计损益 (P&L) 报表这一主题。他强调了准确建模价格影响以有效管理风险的重要性,并强调了管理流动性风险以避免陷入流动性不足的重要性。韦伯斯特承认有多种价格影响模型可用,但他们通常同意大部分数据。
演讲首先讨论价格影响和流动性风险之间的交叉点,特别是指出在金融危机之前,主要市场的流动性通常被认为是理所当然的。韦伯斯特分享了有力的引述,说明价格影响如何产生利润幻觉,导致价格偏离财务价值。演讲的目的是在数学上将这一概念形式化,提供一个基于估计清算对市场影响的量化框架,以消除利润幻觉。
韦伯斯特将价格影响解释为交易的因果模型,其中更激进的交易进一步推动价格,反之亦然。价格影响模型广泛应用于交易成本分析和优化执行,作为预估交易成本和优化执行策略的交易前工具。他展示了一份模拟交易成本分析报告,该报告允许交易员评估他们的算法每季度的表现,重点是最大限度地减少订单滑点,并同时考虑机械变动和 alpha 滑点。
演讲者讨论了欧洲证券和市场管理局 (ESMA) 发布的有关流动性压力测试的指南,其中涉及在市场压力期间模拟资产清算。模拟市场反应(例如价格错位)和采用对冲策略对于降低风险敞口至关重要。 Webster 参考了各种关于流动性压力测试和价格对会计损益影响的文献,包括 Cascioli、Boucheron、Farmer 以及 ESMA 和 Baffled Committee 等监管委员会的著作。他强调流动性压力测试的必要性,以减轻可能影响会计损益并导致高清算成本的情况。
引入交易足迹的概念,衡量价格影响对会计损益的扭曲效应,并将不同的损益定义联系在一起。 Webster 提出了一个简单的甩卖模型来说明 Casadio-Bouchard-Farmer 论文得出的关于会计损益的重要结论。他解释了交易员和平台经理每天观察到的数字如何高估了他们的最终损益,从而导致交易完成后出现通货紧缩。然而,这种通货膨胀特性可以实时测量和显示,为交易者提供可操作的信息。韦伯斯特指出,头寸通胀损失通常是暂时的,取决于风险承受能力。
讨论了与股票头寸估值相关的问题及其对公司损益的影响。韦伯斯特强调了确定使用哪些价格来标记股票头寸的模糊性,以及会计损益与交易算法使用的基本损益之间的差异。交易足迹定义为会计损益与基本损益之间的差异,在平仓时解决了歧义。演讲者探讨了头寸膨胀,做出了该属性成立的某些假设。还涉及了撞击模型及其两个案例,即最初的 OW 痣和 Fruehwirth 和 Bond 研究的 W 痣。
韦伯斯特解释说,要使模型有意义,需要满足 lambda 和 beta 之间的无套利条件以及自筹资金方程条件。他深入研究了在收盘时计算预期损益以及交易足迹如何将偏差引入会计损益。仓位膨胀属性导致仓位在进仓阶段膨胀,在持仓阶段保持不变,最终蒸发。所有这些方面都可以在交易屏幕上实时观察,为交易者提供有价值的见解。
韦伯斯特进一步解释了价格影响导致会计损益的扭曲。他讨论了交易者如何在没有 alpha 的情况下进行有利可图的交易,但警告说由于交易成本,这些利润是短暂的。尽早监测价格错位对于避免损失至关重要。此外,韦伯斯特指出,投资组合经理更喜欢将他们的投资组合视为一个整体,并引入了固定投资组合的概念,该概念控制着数学金融世界中投资组合的规模和周转率。
然后探讨与估计运行交易成本相关的固定投资组合的概念。通过了解传播者的时间尺度,交易者可以估计他们的头寸膨胀的程度以及他们在清算头寸时可能损失的利润幻觉。韦伯斯特使用经验数据演示了该框架,展示了它对现实世界场景的适用性。他将该框架应用于甩卖模型,并解释了会计损益与基本损益之间的差异,强调了它们如何根据交易者的风险厌恶程度为不同的目标函数提供信息。
演讲者深入探讨了甩卖或其他市场参与者的交易活动对交易者损益和头寸的影响。激进的对冲会导致拥挤效应和头寸膨胀,从而导致永久性损失。准确建模价格影响对于有效的风险管理至关重要,并且强调管理流动性风险以避免最终出现流动性不足的头寸。
韦伯斯特承认,虽然有许多不同的价格影响模型可用,但它们通常同意大部分数据。但是,影响持续的程度和持续时间可能会有所不同。临时错位可持续几天到一个月。从风险管理的角度来看,有明确的行动方案,而从交易者和绩效的角度来看,有效的沟通成为关键。了解 P&L 是否是机械的并去除机械部分可以让交易者专注于他们交易中的实际 alpha 或优势。
演讲者解释了“不操纵价格”的原则,强调即使交易者获得利润,也无法维持,因为利润最终会蒸发。头寸膨胀导致交易价值随时间缩减或立即清算,导致损益为零甚至负值。因此,交易者需要依靠其他变量来产生可持续的利润。韦伯斯特进一步探讨了初始影响状态、市场其余部分造成的影响以及交易者对冲和市场其余部分的影响之间的相关性。
总之,凯文·韦伯斯特对价格影响如何扭曲会计损益提供了全面的理解。他阐明了高波动性流动性制度期间的额外成本及其与大盘的相关性,强调了它们对偏见的影响。从监管的角度来看,公司债券和保险公司可能更容易受到这种偏见的影响。虽然韦伯斯特承认他缺乏股票以外市场的详细答案,但他为理解价格影响及其对损益的潜在扭曲提供了坚实的数学基础。
Laura Leal(普林斯顿大学)-“学习高频金融的功能控制”
Laura Leal(普林斯顿大学)-“学习高频金融的功能控制”
来自普林斯顿大学的研究员Laura Leal就深度神经网络在高频金融中的应用发表了内容丰富的演讲。她强调了传统解决方案的局限性,并探讨了在该领域利用神经网络的优势。 Leal 强调了他们适应复杂因素的能力,例如自相关和日内季节性,传统模型难以应对。通过利用神经网络,交易者可以通过最小化市场影响和顺利交易来实现最佳执行。
为了解决对神经网络黑盒性质的担忧,Leal 引入了可解释性的概念。她讨论了神经网络控制在低维流形上的投影,从而能够更好地理解相关风险以及与熟悉的风险部门的偏差。该团队评估了神经网络控制的性能,并将其与经典的封闭式 PDE(偏微分方程)解决方案进行了比较。他们检查了价值函数、按市值计算的财富和预测中的相对误差,以评估神经网络方法的准确性和有效性。
Leal 深入研究了神经网络训练的复杂性,强调了结合真实世界数据和准确动态的重要性。她还提出了一个多偏好控制器,允许交易者输入他们的风险偏好,从而更快地适应新的市场条件。通过考虑风险规避参数并结合交易者的偏好,神经网络可以生成高频金融中随机优化问题的解决方案。
演讲者讨论了用于风险控制的神经网络的结构,强调了它的循环性质。虽然网络不是太深,但它在每个时间步都采用循环结构,同时更新权重。网络的输入包括时间和库存,而输出是控制本身——确定每个时间步的最佳库存交易量。为了解决财务数据可用性有限的挑战,采用迁移学习,使用蒙特卡罗方法模拟数据。
Leal 概述了使用线性回归将神经网络控制投影到线性函数空间的过程。这种投影技术有助于更好地理解神经网络的非线性函数及其与封闭形式控制解决方案的一致性。结果证明了结合季节性和风险厌恶参数对模型对市场的反应的影响。此外,演示者强调了 gamma 的重要性,在文献中通常将其设置为 2,但当采用 3 比 2 时显示了非线性解决方案。
对神经网络控制在执行高频金融交易时的性能和准确性进行了全面评估。 Leal 比较了价值函数、按市值计价的财富,以及在不同情景和伽玛值下的预测相对误差。虽然神经网络表现出卓越的性能,但它以非线性方式执行交易,偏离了已知的控制解决方案。这引发了关于使用神经网络进行交易并根据其与既定解决方案的差异确定适当保证金水平的决定的问题。
Leal 探索了多偏好控制器方法的好处,允许交易者输入他们的风险转换参数并使用预先训练的模型立即开始交易。虽然神经网络解决方案的执行时间比 PDE 解决方案更长,但它提供了更大的灵活性和对不同风险偏好的适应性。为了增强可解释性,Leal 提出了一种使用线性回归的投影思想,在保留多偏好能力的同时减少了计算负担。她还强调了神经网络近似概念的更广泛应用,表明它在其他金融问题(例如对冲)中的相关性。
讨论了高频金融中神经网络的训练过程,强调离线训练以避免与在线强化学习相关的延迟问题。该网络将时间、库存和潜在的风险规避参数作为输入,并产生一个比率作为输出。 Leal 还描述了迁移学习中的微调过程,一旦网络收敛,就从模拟数据过渡到从多伦多证券交易所获得的真实数据增量。演示者强调了在训练过程中使用真实世界数据和准确动态的重要性,因为它增强了网络捕捉高频金融复杂性的能力。
在随后的部分中,Laura Leal 提供了对高频金融神经网络中采用的输入和目标函数的见解。神经网络将库存作为一天中特定库存的平均体积的一部分,允许标准化表示。目标函数被定义为最大化问题,输出作为最优执行的控制。神经网络的结构基于函数逼近,利用两个输入节点和四个隐藏层来捕获潜在关系。
在回答有关两个控制解决方案之间差异的问题时,Leal 澄清说,这可以解释为投资者不断变化的效用的反映。通过调整伽马参数,可以采用不同的效用函数,从而导致控制解决方案的变化。在他们的研究中,团队根据对实际交易者的实证测试选择了三半的伽玛值,结果令人满意。
Leal 进一步强调,神经网络的输出是可观察和可分析的。他们可以监控网络持有的头寸以及它们在整个交易日内的演变情况,从而为决策过程提供透明度和洞察力。这种水平的可解释性和理解力使交易者能够对神经网络的执行策略充满信心。
Leal 还讨论了与开发高频金融功能控制相关的挑战。虽然平均控制过程可以提供对交易执行的整体洞察,但它可能无法准确代表个别轨迹的行为。市场动态,例如模因股票的出现,需要调整控制方法以有效捕捉不断变化的条件。
最后,Laura Leal 的演讲阐明了在高频金融领域建立有效控制的复杂性。通过利用深度神经网络,研究人员和交易员可以克服传统模型的局限性并适应该领域的复杂动态。风险偏好、可解释性措施和真实世界数据的结合有助于开发稳健且适应性强的控制解决方案。通过他们的工作,Leal 和她的团队提供了宝贵的见解和解决方案,为在高频金融领域做出更高效、更明智的决策铺平了道路。
Vineel Yellapantula(康奈尔大学 MFE '20):“SEC 文件中的量化文本”
Vineel Yellapantula 介绍了他的暑期项目,该项目涉及应用自然语言处理 (NLP) 技术根据 SEC 文件中的文本信息进行股票交易,尤其侧重于 MD&A 部分。该项目的目标是为美国市场上 430 只股票的每份报告分配一个分数,并根据分数将它们分为五个分位数来分析它们的表现。 Yellapantula 使用余弦和 Jaccard 相似度等传统方法来确定文本之间的相似度得分,事实证明 Jaccard 相似度随着时间的推移更加一致。他还探索了在文本数据集上使用循环神经网络 (RNN) 和 Keras 创建情感分析模型,他的模型达到了令人印象深刻的 87.5% 的准确率。
在演示过程中,Yellapantula 强调了为每个特定问题选择适当方法并结合其他数据以改进结果的重要性。他强调了通过文本数据提供的丰富信息,尤其是在 10-K 文件中,并提到使用以前的文件开发的因素可能比仅依赖当前文件的因素更有效。 Yellapantula 指出了将深度学习技术用于文本数据的各种替代方案,包括 glove、word2vec、BERT 和 RNN。他进一步建议合并更多数据源,例如 8-K 文件和新闻周期,以增强模型的预测能力。然而,他承认在他的研究中存在选择偏差,因为它侧重于 2007 年至 2020 年该指数中表现良好的股票。
在专门用于情感分析的部分中,Yellapantula 解释了使用 RNN 和 Keras 创建模型的过程。这些步骤包括对文本进行标记以理解其含义,通过嵌入降低维度,以及使用 LSTM 层和具有 sigmoid 函数的密集层进行情感分类。他使用 IMDB 评论演示了这种方法的应用,将评论长度限制为 500 字,并用零填充较短的评论以保持一致性。通过严格的评估,Yellapantula 的情感分析模型达到了 87.5% 的准确率。
此外,Yellapantula 强调了信息相关性在确定因素的有效性及其随时间的一致性方面的重要性。他引用了一项研究,该研究表明报告稳定的公司往往表现良好,表明这是一个有前途的探索因素。最后,Yellapantula 对观众的兴趣表示感谢,并期待未来的进一步参与。
Vineel Yellapantula 的项目演示了如何应用 NLP 技术从 SEC 文件中的文本信息中提取有价值的见解。通过为报告打分并分析其表现,他的工作有助于理解语言如何影响股票交易。此外,他对使用 RNN 进行情感分析的探索展示了深度学习在从文本数据中捕捉情感方面的潜力。通过谨慎的方法选择和合并额外的数据源,Yellapantula 强调了提高此类模型的准确性和有效性的机会。
Zihao Zhang(Oxford-Man Institute)-“通过订单数据对市场进行深度学习”
Zihao Zhang(Oxford-Man Institute)-“通过订单数据对市场进行深度学习”
Zihao Zhang 是 Oxford-Man Institute 的博士后研究员,也是机器学习研究小组的一员,介绍了他的团队最近在通过订单数据将深度学习应用于市场方面的工作。他们的重点是市场微观结构数据,尤其是限价订单簿,它为特定金融工具的整体需求和供应动态提供了宝贵的见解。通过结合市场订单和限价订单簿数据,张和他的团队发现他们可以减少信号差异并获得更好的预测信号。他们模型的这种应用具有增强交易执行和做市策略的潜力。
张以简要介绍市场微观结构数据开始他的演讲,特别强调市场订单数据的重要性。该数据源提供高度精细的信息,与限价订单簿数据相比提供频繁的更新和事件,后者在现有文献中受到更多关注。他介绍了他们的深度学习模型,解释了他们为按订单数据分析市场而设计的网络架构。 Zhang 强调说,他们的工作代表了第一个使用市场按订单数据预测高频运动的预测模型,提供了另一种信息来源,扩展了 alpha 发现的可能性。
接下来,Zhang 深入探讨了限价订单簿的概念,它综合记录了给定时间点金融工具的所有未完成限价订单。他强调,虽然图表数据提供的是低频信息,但股票的价格实际上是由多变量时间序列的限价订单簿表示的。 Zhang 解释了限价订单簿如何根据提交的订单组织成不同的价格水平,每个价格水平由不同交易者分割的大量小订单组成。他还讨论了在新消息到达时如何更新订单簿,这可以引入新头寸、取消现有订单或修改当前订单。 Zhang 指出,限价订单簿的派生数据揭示了特定金融工具的整体供需关系,他的目标是确定利用包含订单下达和取消信息的市场订单数据是否可以提供更多见解用于做出预测。
展望未来,张探索了如何在深度学习中利用订单数据来预测市场走势。尽管市场订单数据中的消息字符串与限价订单簿相比具有较低的维度,但它们提供了可用于预测的额外信息。 Zhang 解释了如何将过去的事件转化为二维矩阵,形成可以输入神经网络进行预测的图像。然后可以将卷积层产生的特征集成到循环神经层中,以学习结构并捕获额外的依赖关系。最后一层根据使用阈值返回的分类设置生成预测。
Zhang 继续讨论用于使用限价订单簿数据进行预测的网络架构。在这种情况下,前两个组件被替换为来自个体交易者的消息,卷积层被替换为 LSTM 层或注意力层。 Zhang 简要解释了注意力机制,它有助于单点预测并涉及编码器-解码器结构。编码器从输入时间中提取有意义的特征并将它们汇总为隐藏状态,而解码器生成预测。归一化用于根据中间价确定订单是买入还是卖出。
在随后的部分中,Zhang 展示了他们的模型使用一组资产训练的结果,将其归一化为相似的规模,并使用简单线性模型、多层感知器、LSTM 和注意力模型等不同模型进行测试,同时结合了极限顺序书籍数据和纯环境数据。结果表明,来自环境数据的预测信号与来自限价订单簿的信号的相关性较低,这表明这两个来源的组合可以减少信号方差,从多样化中受益,并产生更好的预测信号。因此,对来自两种数据类型的预测信号进行平均的集成模型表现出最佳性能。
Zhang 继续讨论将按订单市场 (MBO) 数据纳入预测的潜在好处,并强调使用这些数据执行特征工程的能力。他展示了提前 2 到 20 个跳动点的预测范围的结果,并指出在 50 和 100 个跳动点之前观察到的类似行为。 Zhang 还回答了听众提出的问题,包括使用所有工具训练单一模型以提高泛化能力的可能性,以及来自伦敦证券交易所的 MBO 数据来源。在回答听众关于关注 NF1 而不是 PNL 的问题时,Zhang 同意并承认 PNL 是更相关的成功衡量标准。
Zhang 进一步讨论了预测信号的使用以及定义它们的各种方法,例如使用原始信号或基于 softmax 概率设置阈值。他总结了论文的要点,提出按订单 (MBO) 数据而不是限价订单簿数据对市场进行建模,并测试深度学习模型,包括 LSTM 保留机制。结果表明,MBO 和限价订单簿数据的组合产生了最佳结果。 Zhang 解答了观众关于市场走势之间的自相关、过滤掉噪音交易以及在限价单图片建模中使用 CNN 层的动机等问题。
在下一节中,Zhang 解释了如何将订单簿视为可以使用卷积神经网络 (CNN) 进行有效探索的空间结构。使用 CNN 从每个价格水平中提取信息已被证明对预测很有价值。选择长短期记忆 (LSTM) 层而不是多层感知器,因为它保持数据的时间流并总结过去的事件以进行预测。 Zhang 指出,由于金融时间序列的性质,使用注意力机制的好处是有限的。该论文包括对其模型中使用的超参数的详细描述。
Zhang 解决了人们对神经网络方法中使用的大量参数及其在预测股市方面的有效性的担忧。他承认大量参数可能会受到批评,但强调他的团队只微调了几个特定于他们模型的参数。他们尚未考虑使用买卖差价作为成功的标准,但认识到其进一步探索的潜力。张认为他们的模型对交易执行和做市策略具有实用价值。但是,他提到,如果打算跨越价差,则可能需要对数据进行下采样,因为订单簿数据的频繁更新会使交易执行复杂化。最后,在为 Elo 限价订单簿建模时,他们汇总了每个价格水平的总规模,而不是包括有关单个订单规模的信息。
在总结部分,张解释了按订单行情和按价格数据行情的区别。市场订单数据允许跟踪单个订单,这对于市场价格数据是不可能的。通过适当的特征工程,订单市场数据可以提供额外的信息并产生 alpha。 Zhang 还讨论了他的模型如何在保持大小不变的情况下处理特定限价单价格的修改。每条具有更新价格的新消息都被视为新的更新,从而丰富了数据集。
总的来说,Zihao Zhang 的演讲展示了深度学习在订单数据市场中的应用,突出了其从市场微观结构数据中提取有价值见解的潜力。通过结合市场订单和限价订单簿数据,Zhang 的团队展示了信号方差的减少和改进的预测信号的生成。他们的工作有望加强交易执行和做市策略,为金融市场分析领域做出宝贵贡献。
Peter Carr(纽约大学)“Stoptions”壮举。洛伦佐·托里切利(帕尔马大学)
Peter Carr(纽约大学)“Stoptions”壮举。洛伦佐·托里切利(帕尔马大学)
Peter Carr 介绍了一种名为“止损”的金融产品,它结合了期货合约和看跌期权的特点。 Stoptions 允许所有者通过加入百慕大看跌期权元素来避免不利的价格变化。 Carr 解释了期权的概念,并提供了一个为期三天的期权示例,其中包含不同的楼层。然后他继续讨论一天和两天停损的估值,后者有两个楼层,并且可以灵活地在第一天或第二天行权。
卡尔通过深入研究向后递归、已婚看跌期权的估值以及伪和的使用,进一步探索了更长时期的止损估值。他建议利用逻辑分布来表示已婚看跌期权的价格变化。止损的价值可以使用“平值”期权的简单公式获得,估值和对冲可以通过分析来完成。
Carr 通过讨论与市场采用此类选项相关的挑战来结束本文。他强调了为这些产品寻找买家和卖家的重要性,并分享了他与潜在买家和卖家的对话。此外,Carr 承认,stoptions 模型是 Black-Scholes 和 Bachelier 等现有模型的替代方案,但它可能无法最佳地适应所有情况。尽管如此,他强调他们的模型旨在捕捉在金融中具有特殊意义的大量二元运算。
在后面的部分中,Carr 和 Lorenzo Torricelli 提出了一个使用共轭范式和逻辑分布的“停止”模型。该模型通过单一参数提供了期限结构的灵活性,允许一次性适应各种期限结构。然而,由于其向下倾斜的隐含波动率图,它可能并不完全适合市场。作者承认他们模型的局限性,并认识到他们的模型旨在捕捉金融中无数的二元操作。他们讨论了罢工和单一期权之间的可选性,以及通过伪求和的重复可选性。该部分以互相欣赏和期待参加彼此的研讨会作为结尾。
Lorenzo Torricelli(帕尔马大学)-“期权定价中的附加逻辑过程”
Lorenzo Torricelli(帕尔马大学)-“期权定价中的附加逻辑过程”
帕尔马大学杰出教授洛伦佐·托里切利 (Lorenzo Torricelli) 通过探索加性逻辑模型和自相似规范,深入研究了期权定价的复杂性。在他富有启发性的演讲中,他阐明了使用这些创新模型为普通期权定价的公式,并通过展示逻辑定价模型与传统正态模型之间的密度比较来举例说明它们的应用。
此外,Torricelli 对逻辑模型的累积期限结构与齐次模型的期限结构的线性革命进行了基准分析。他富有洞察力的观察表明,逻辑模型在塑造期限结构方面提供了更大的灵活性,从而提供了优于传统方法的显着优势。
为了提供全面的理解,Torricelli 还检查了与这些模型相关的波动率表面。他注意到模型中存在正偏态,这是由于对数回报的偏态分布和 logistic 分布的峰态造成的。然而,他强调逻辑分布本身不存在偏斜,因为它表现出对称性。 Torricelli 进一步讨论了模态参数对波动率期限结构的影响,承认所选参数化的改进潜力。
最后,Torricelli 强调,从这些模型中导出的期权公式是明确和众所周知的,有助于它们的实际实施。值得注意的是,他赞扬了性能测试期间表现出的令人印象深刻的速度。作为透明度和学术合作的证明,Torricelli 计划公开与这些模型相关的代码,使研究人员和从业者都受益。
Yumeng Ding (Cornell MFE '20) - “解释机器学习模型”
Yumeng Ding (Cornell MFE '20) - “解释机器学习模型”
Yumeng Ding 是一位经验丰富的研究员,他深入研究了解释用于股票价格预测的机器学习模型的领域。在她的综合分析中,她探索了一系列可解释性方法,包括部分依赖图、排列特征重要性、边缘统计和 LIME,以阐明这些模型的内部工作原理。通过采用这些方法,Ding 旨在揭示单个因素的贡献及其在预测股票价格中的交互作用。
丁的研究围绕三种因素展开:技术、质量和价值,它们被用作各种机器学习模型(如分类器和回归)的输入。利用前面提到的可解释性方法,她揭示了这些因素与股票价格预测之间错综复杂的关系。通过严格的回测,丁发现非线性模型在性能上优于线性模型。此外,她观察到不同因素的影响表现出时间变化,突出了股价预测的动态性质。最终,Ding 将 AdaBoost 确定为最适合其特定场景的模型。
重要的是,丁强调了可解释性方法在理解机器学习模型中的重要性。她强调,虽然矢量方法可以快速洞察最具预测性的交互,但它无法揭示这些交互的质量。 Ding 强调了使用二维部分依赖图有效可视化更简单交互的价值。此外,她还建议使用线图方法来深入研究个体交互的复杂性并可视化局部效果,只要数据足够清晰,没有噪音。
在总结她的发现时,丁强调了她项目中的两个关键要点。首先,她确认机器学习模型在大多数情况下优于线性朴素回归,因为它们能够捕获复杂的交互效应。其次,她强调了通过利用各种可解释性方法来解释机器学习模型的可行性。这些技术使研究人员能够阐明各个因素的贡献并理解它们对预测的交互影响。
Silvia Ruiz(Cornell MFE '20):“如何使用 NLP 技术预测股票走势”
Silvia Ruiz(Cornell MFE '20):“如何使用 NLP 技术预测股票走势”
西尔维娅·鲁伊斯 (Silvia Ruiz) 是康奈尔大学 MFE 项目的应届毕业生,她分享了她的项目的见解,该项目专注于使用 NLP(自然语言处理)技术预测股票价格。她的团队研究的目的是探索公司文件(例如 10-K 和 10-Q 报告)与随后对股价的影响之间的关系。为实现这一目标,他们从 EDGAR 网站收集了一个庞大的数据集,其中包含 1,095 份报告,涵盖标准普尔 500 指数五个行业的 50 家公司。
最初,Ruiz 和她的团队尝试了基于字典的模型,但在有效性方面遇到了局限性。为了解决这个问题,他们采用了先进的方法,例如 word to back 模型和 Finberg,事实证明,这对于理解公司文件中嵌入的上下文细微差别至关重要。此外,他们还采用了各种情绪指标,包括词的极性和复杂性,以及 xg 提升模型来预测股价走势。
他们预测的准确性在两个不同的时间范围内进行了评估。在短期内,他们的模型达到了 61% 的惊人准确率,而在长期内,它表现出了 53% 的可观准确率。利用这些预测作为投资决策的信号,它们的表现优于同等权重的投资组合。然而,Ruiz 强调需要跨不同部门进行进一步研究,以提高其研究结果的准确性和普遍性。
Silvia Ruiz 慷慨地提供了她的联系信息并提供了她在 Github 上的项目存储库的链接,从而结束了她的讨论。这种姿态鼓励后续查询并促进合作,以促进 NLP 技术在股票价格预测领域的理解和应用。
Charles-Albert Lehalle:“理解自然语言处理的尝试”
Charles-Albert Lehalle:“理解自然语言处理的尝试”
在此视频演示中,Charles-Albert Lehalle 和他的团队深入研究了自然语言处理 (NLP) 在金融领域的应用。他们的讨论围绕三个关键领域展开:情绪分析、股价预测和交易成本建模。他们承认与 NLP 相关的挑战,例如过度拟合和嵌入偏差的风险,并提出了潜在的解决方案,包括多任务学习和扩展词典。该团队探索了自然语言处理在金融行业的潜力和局限性,强调了理解不同行业背景和语言模式的重要性。
Lehalle 和他的团队展示了他们自己使用 NLP 技术进行的实验,就 NLP 如何压缩信息并为金融分析师提供信息指标提供了宝贵的见解。他们强调了在金融领域采用 NLP 的挑战,包括对特定领域知识的需求以及从非结构化文本数据中提取有意义信息的困难。还讨论了围绕在金融中使用 NLP 的道德问题,例如利用社交媒体数据进行交易。
在整个演示过程中,Charles-Albert Lehalle 分享了他在各种 NLP 主题方面的专业知识和知识。他解释了基于词典和基于嵌入的 NLP 方法在金融领域的应用,并提出结合这两种方法来捕获文本数据中的词汇和概率特征。解决了在嵌入中区分同义词和反义词的挑战,Lehalle 的团队探索了生成模型来控制文本的结构和情感。强调了理解嵌入和参考模型(例如表示联合词分布的矩阵)的重要性。
Lehalle 进一步探讨了上下文在 NLP 中的重要性,讨论了嵌入如何根据上下文偏向于正面和负面的词。他解释了如何使用马尔可夫链构建参考矩阵模型,并展示了在嵌入中识别同义词的实验。承认 NLP 在捕获公司名称及其相关极性方面的局限性,以及针对监督嵌入的多任务学习的建议。演讲者还谈到了 Loughran-McDonald Lexicon 的正面和负面词汇的不平衡以及处理金融文本中反讽的挑战。
演讲最后概述了 Sylvia Ruiz 的一个项目,她是康奈尔大学金融工程的应届毕业生。该项目侧重于使用 NLP 技术预测股价,特别是通过从 50 家标准普尔 500 指数公司的 10-K 和 10-Q 文件中提取管理讨论部分,并分析情绪以评估其对股价的影响。 Lehalle 讨论了基于字典的模型的局限性,并解释了他们的团队如何扩展字典、使用 FinBERT 来理解上下文并利用各种功能来衡量情绪。无论从短期还是长期来看,它们都比同等权重的投资组合取得了更好的表现。
总之,Charles-Albert Lehalle 和他的团队阐明了 NLP 在金融领域的潜力和挑战。他们提供了有效应用 NLP 技术的见解、实验和策略,同时强调负责任地使用以及对技术和金融领域的深刻理解的重要性。