量化交易 (Quantitative trading) - 页 6

 

Ernest Chan (Predictnow.ai) - “如何使用机器学习进行优化”



Ernest Chan (Predictnow.ai) - “如何使用机器学习进行优化”

Predictnow.ai 的联合创始人 Ernest Chan 深入探讨了传统投资组合优化方法在应对市场状况变化时所面临的挑战。他建议机器学习可以为这个问题提供解决方案。 Chan 解释了他的团队如何将机器学习技术应用于投资组合优化,重点是整合时间序列特征来衡量各种财务方面,如波动性、价格和利率。通过将 Farmer-French 三因素模型与排名比预测更重要的理解相结合,他们旨在实现最佳投资组合优化。

Chan 继续分享了 CBO 模型性能的具体结果,并提供了使用此方法体验到投资组合性能改进的客户示例。他强调,机器学习模型具有适应体制变化的能力,使它们能够有效应对不断变化的市场条件。此外,他还讨论了如何使用利用时间序列特征的机器学习算法来计算标准普尔 500 指数及其成分股的回报。

此外,Chan 强调了他的团队在优化和推测方面采用的集成方法。他提到了他们的“秘方”,可以消除对大量计算能力的需求。他们不是遵循预测制度和以其回报分布为条件的两步过程,而是利用视觉因素直接预测投资组合的表现。此外,Chan 澄清说,通过在他们的算法中包含很大一部分训练样本,预期回报与过去的结果一致。

Ernest Chan 博士解释了传统投资组合优化方法在制度变化的情况下所面临的挑战,并强调了机器学习在解决这一问题中的作用。他讨论了机器学习技术的应用、时间序列特征的重要性以及排名在实现最佳投资组合优化方面的重要性。他分享了具体结果和客户成功案例,强调了机器学习模型对不断变化的市场条件的适应性。 Chan 还提供了使用机器学习算法计算回报的见解,并阐明了他们的集成方法和独特的方法。

  • 00:00:00 在本节中,Ernest Chan 讨论了传统的投资组合优化方法和市场体制变化的挑战,这意味着过去最优的投资组合在未来可能不是最优的。他解释说,大多数方法使用过去的历史回报或信息作为输入,而没有考虑制度变化。他建议机器学习可以通过利用大数据和在不同市场观察到的所有变量来帮助解决这个问题。机器学习可以产生不仅仅基于历史回报的预期回报,因此更适合应对政权更迭。

  • 00:05:00 在本节中,Ernest Chan 讨论了金融制度的概念及其对优化的影响。他解释说,虽然有一些可行的制度,如熊市或牛市,但也有一些无法明确定义且不断变化的隐藏制度。这些制度很难预测并破坏经典的优化方法。这种理解促使陈博士开发了条件投资组合优化技术,该技术可以使用大量变量来衡量和适应当前状况。这种技术可以在不同的市场条件下提高交易策略的性能。

  • 00:10:00 在本节中,Ernest Chan 讨论了使用机器学习进行优化以及如何使用监督学习调整参数。他解释说,在监督学习中,有一个带标签的目标变量,比如要优化的参数,即交易策略的夏普比率或未来一个月的回报。输入是衡量当前制度的市场和宏观经济变量的组合,以及交易者可以调整的控制变量,形成一个大数据集。为了优化,对参数的各种组合进行穷举搜索以找到最大锐比,这就是条件参数优化。 Ernest Chan 以一个使用玩具策略的简单示例作为结尾,该示例说明了市场特征和控制特征的组合以形成一行输入。

  • 00:15:00 在本节中,Ernest Chan 解释了他的团队如何将机器学习应用于投资组合优化。该团队使用他们应用于参数优化的相同机器学习方法来解决这个更广泛的问题。他们使用大数据作为输入特征和隐藏区域的隐式预测。与仅依赖过去收益和收益协方差作为输入数据的经典投资组合优化方法不同,他们的方法考虑了当前的市场状况、技术和基本指标以及宏观经济指标以适应制度并找到当前条件下的最优投资组合商情。该团队回答了问答中的问题,解释说他们不使用模拟而是使用真实市场数据来计算给定特定假设资本配置的回报。

  • 00:20:00 在本节中,Ernest Chan 解释了通过机器学习进行投资组合优化的特征类型。他强调只使用时间序列特征,不涉及横截面特征。这种方法侧重于投资组合或市场制度作为一个整体的特征,例如衡量金融、波动性、价格和利率的因素。虽然这看起来很奇怪,但 Chan 将其与 Farmer-French 三因素模型的解释质量联系起来。使用机器学习模型,目标不是预测回报,而是对其进行准确排序以实现最佳投资组合优化。

  • 00:25:00 在本节中,Ernest Chan 讨论了排名在金融应用中的重要性以及如何将其应用于投资组合优化。他解释说,如果回报预测的幅度和符号不准确,使用机器学习模型预测横截面回报的传统方法可能会导致垃圾进,垃圾出的情况。然而,使用结合了 Fama-French 因子模型和排名比预测更重要的概念的 CPO 方法,最优解在程序的任何步骤中都更加稳定,不会出错。他还指出,由于排名,这种方法可以容忍机器学习预测中的巨大错误。

  • 00:30:00 在本节中,Ernest Chan 讨论了如何使用熟悉的市场指标(例如期权购买活动的净 Delta)来衡量行为金融学的影响。他解释说,他的公司将此指标用作其 CBO 模型的特征之一,该模型考虑了现象的影响,而不是现象的核心原因。 Chan 然后分享了 CBO 模型性能的具体结果,包括击败均值方差方法和优于传统资产。此外,他还提供了一个示例,说明与其他方法相比,CBO 方法如何在特定时间段内更好地为成长股和大盘股分配权重。

  • 00:35:00 在本节中,演讲者解释了经典的投资和交易方法是固定的而不是自适应的,不像 CBO(组合贝叶斯优化)方法那样优于经典方法,因为它可以适应市场机制,从而导致更好的性能。 CBO 旨在优化和推荐交易,即使现有的投资组合已经有与之相关的交易成本。 CBO 不会产生额外的交易成本,只是建议购买更多或更少的特定股票。演讲者随后引用了采用 CBO 方法并发现其投资组合绩效有所改善的客户示例。

  • 00:40:00 在本节中,Ernest 谈到了一个案例研究,在该案例研究中,他们能够在股票投资组合中实现正回报,尽管每只股票的限制为 0% 到 25%。该投资组合由科技股组成,预计将在 2022 年严重崩盘,但他们在此期间将 50% 分配给现金的方法有助于产生回报。当被问及他们方法的可重复性时,Ernest 解释说,虽然某些特征(如期权的净 Delta)是重要的输入特征,但他们已经在他们的网站上公开了对它们的高级描述。他还提到使用梯度过程决策树和其他机器学习算法,他们定义市场机制的方法是通过使用数百个特征来表示。

  • 00:45:00 在本节中,Chan 解释了如何通过构建响应变量(例如夏普比率)并针对每个市场状态的控制变量的不同场景拟合函数 F,将机器学习用于优化。监督学习算法的标签是要最大化的变量,例如夏普比率,每个投资组合建议被送入预测公式,直到找到表现最好的投资组合。 Chan 指出,问题的复杂性并不与投资组合中的资产数量呈线性关系,但他的团队开发了一种算法来管理该问题。他们使用的最大投资组合范围是标准普尔 500 指数。

  • 00:50:00 在本节中,Ernest Chan 提供了一个示例,说明机器学习模型如何通过使用现金分配作为指标来响应政权变化。当 2022 年熊市开始时,该模型大部分时间都保持现金状态,从而使投资组合免于负回报。他还提到,由于学习算法和优化算法的非线性特性,目标函数可以设置为任何东西,而不仅仅是传统的最大锐利比率或回报,并且权重、ESG 和营业额等约束可以被应用。该软件非常灵活,可以适应客户提供的任何市场功能。此外,Chan 提到该模型可以处理历史较短的股票,因为它允许在投资组合中添加和删除成分,并且可以在每次重新平衡时重新训练该模型。

  • 00:55:00 在本节中,Chan 讨论了标准普尔 500 指数及其成分股的回报率计算。他解释说,使用机器学习算法计算投资组合的回报与使用马科维茨技术不同,因为机器学习算法使用时间序列特征而不是股票回报作为输入。 Chan 还指出,状态变化由 180 个变量定义,每日、每月和每季度的测量值被用作输入机器学习算法的特征,机器学习算法选择对预测投资组合未来有用的排名靠前的特征。最后,Chan 将该问题重新定义为排名问题而不是回归问题,并且它也可以重新定义为分类问题。

  • 01:00:00 在本节中,演讲者讨论了使用一组投资组合而不是仅使用一个最优投资组合的可能性,但研究团队需要进一步研究。他们还确认,如果有 100 万个投资组合组合,则该模型每天需要根据 100 万个历史数据组合进行训练。然而,他们提到了他们的“秘方”,可以消除对这种计算能力的需求。演讲者还解释说,他们不使用预测制度然后以该制度的回报分布为条件的两步过程,而是使用视觉因素直接预测投资组合的表现。他们结束讨论时说,如果他们在模型中包含大量训练样本,预期回报将与过去发生的情况相似。
Ernest Chan (Predictnow.ai) - "How to Use Machine Learning for Optimization"
Ernest Chan (Predictnow.ai) - "How to Use Machine Learning for Optimization"
  • 2023.03.01
  • www.youtube.com
Abstract: Conditional Portfolio Optimization is a portfolio optimization technique that adapts to market regimes via machine learning. Traditional portfolio...
 

金融机器学习 - Ernest Chan 博士的从业者视角



金融机器学习 - Ernest Chan 博士的从业者视角

在这段信息丰富的视频中,Ernest Chan 博士深入研究了金融机器学习领域,探讨了几个关键方面并阐明了重要的考虑因素。他强调了避免过度拟合的重要性,并提倡模型透明。此外,陈博士强调了利用非线性模型预测市场行为的好处。然而,他也讨论了机器学习在金融市场中的局限性,例如自反性和市场不断变化的动态。

陈博士强调的一个关键点是金融数据科学领域专业知识的重要性。他强调需要进行特征选择,以更好地理解影响模型结论的基本变量。通过识别这些重要的输入,投资者和交易者可以深入了解他们的损失并理解为什么做出某些决定。

陈博士还谈到了机器学习在风险管理和资本配置方面的应用。他建议寻找一个利基市场,避免与资金雄厚的组织直接竞争。通过这样做,从业者可以增加他们在这些领域取得成功的机会。

在整个视频中,陈博士强调了与不同模型和策略相关的优势和挑战。他指出,虽然传统的定量策略(例如线性模型)易于理解且不太容易过度拟合,但它们在预测变量之间存在非线性依赖性。相比之下,机器学习模型擅长处理非线性关系,但它们的复杂性和不透明性会给解释其结果和评估统计显着性带来挑战。

陈博士还讨论了使用机器学习预测金融市场的局限性。他强调,市场在不断发展,因此很难准确预测。然而,他建议机器学习可以成功地预测私人信息,例如交易策略,其中不太可能与相同的参数竞争。

此外,Chan 博士还谈到了将基础数据(包括分类数据)纳入机器学习模型。他指出,机器学习模型在处理实值数据和分类数据方面优于线性回归模型。然而,他告诫不要仅仅依赖机器学习,强调深厚的领域专业知识对于创建有效的特征和准确解释数据仍然至关重要。

在资本配置领域,陈博士强调了机器学习如何提供更复杂的预期回报,挑战将过去的表现作为未来成功的唯一指标。他还讨论了机器学习可以提供的市场理解的细微差别,概率每天都在变化,这与经典统计的静态概率分布不同。

Chan 博士最后解决了深度学习在创建需要领域专业知识的不同横截面特征方面的局限性。他分享了他对强化学习在金融模型中的适用性的看法,指出它在高频下的潜在有效性,但在较长时间范围内的局限性。

对于那些有兴趣进一步探索金融机器学习的人,Chan 博士推荐他的公司 PredictNow.ai 作为无代码金融机器学习专业知识的宝贵资源。

  • 00:00:00 事实上,它们的使用越来越广泛。在视频的这一部分,Ernest Chan 博士讨论了他在机器学习方面的悠久历史,以及他如何发现将其应用于金融的价值,他承认直到最近才很难做到这一点。他提倡简单的模型和策略,例如单因素模型和线性模型,这些模型和策略几十年来一直对量化交易者有效。随着量化交易的兴起,这些模型的利润越来越低,Chan 解释了他如何能够以大多数人没有采用的方式从机器学习中提取价值。

  • 00:05:00 在本节中,Ernest Chan 博士讨论了金融机器学习中过度拟合的历史问题;当模型必须拟合多个参数时,过度拟合的风险非常高,尤其是在处理每日金融时间序列等低频金融数据时。然而,多年来,机器学习(尤其是深度学习)的进步使得克服过度拟合成为可能。随机森林、交叉验证、dropout 等技术有助于减少过度拟合,算法等其他工具使机器学习变得透明。黑箱交易和缺乏透明度的问题在于,无法解释您进行某些交易的原因是不可接受的,即使您赚钱了。

  • 00:10:00 在本节中,Ernest Chan 博士讨论了机器学习中特征选择的概念,这可以帮助交易者和投资者更好地理解导致特定机器学习模型得出结论的重要变量。通过识别导致结果的重要输入,特征选择可以帮助投资者深入了解他们亏损的原因或模型做出错误决定的原因。陈博士还强调,与主要信号发生器相比,机器学习可更有效地用于风险管理和资本配置,因为市场预测受反身性影响,这在过去检测模式时造成了困难。

  • 00:15:00 在本节中,Ernest Chan 博士讨论了使用机器学习预测金融市场的局限性,金融市场不断发展,无法与预测癌症等疾病相提并论。不过,他解释说,使用机器学习来预测私人信息(例如交易策略)可能是一种成功的方法,因为其他对冲基金并没有与完全相同的参数竞争。他还将传统的定量策略与基于机器学习的策略进行了比较,指出机器学习可以帮助通过非线性模型对替代数据集和大型数据集进行建模。

  • 00:20:00 在本节中,Ernest Chan 博士讨论了使用非线性模型预测市场行为的好处。传统的量化模型易于理解并且是线性的,因此很难过拟合,但它们无法处理预测变量之间的非线性依赖性。另一方面,机器学习模型可以轻松处理非线性依赖,它们的复杂性和不透明性使其难以复制。此外,机器学习模型提供了成功的可能性,允许更明智的资本配置。然而,过度拟合是机器学习模型的一个问题,评估统计显着性可能很困难。模拟回测是一个不完美的解决方案,市场的细微差别无法在模拟中完全捕捉到。

  • 00:25:00 在本节中,Ernest Chan 博士讨论了传统量化策略与基于机器学习的策略之间的区别。他解释说,模拟市场和为传统策略创建准确的误差线要困难得多,因此很难评估它们的有效性。另一方面,机器学习模型很容易生成多个回测,只需切换随机种子,每个回测都可能给出不同的结果。这种随机性可以更轻松地评估回溯测试的统计显着性,使其成为在交易中使用机器学习的主要优势。然而,金融数据科学是构建战略最困难和最耗时的步骤,因为金融数据通常存在许多问题,即使来自信誉良好的供应商也是如此。

  • 00:30:00 在本节中,Ernest Chan 博士概述了与使用情绪数据相关的一些问题。他指出,情绪数据并不总是可信的,因为处理新闻的公司可以返回并更改参数以使其看起来不错。由于无法知道数据是否被带有偏见地看待,因此有必要将原始新闻通讯处理成新的情绪,从而引入风险。此外,数据对自动化响应提出了重大挑战。金融数据科学步骤具有挑战性,因为它需要通过领域专业知识的人类智能,这是金融机器学习问题中的一个自相矛盾的问题。第二步是机器学习,科技行业已经解决了。最后一步是构建和回测交易策略,这需要将预测组合成一个连贯的策略并评估统计显着性。

  • 00:35:00 在本节中,Ernest Chan 博士讨论了如何按照标准程序将预测转换为投资组合,这些程序可以在金融教科书中找到。但是,这需要一些领域专业知识并且不是完全自动的。他还强调了金融数据科学的困难,例如使特征静止以及使用元标记来预测策略是否有利可图而不是预测市场的重要性。 Chan 博士建议阅读他关于应用于金融的元标记的博客文章以获取更多信息。他还提到随机森林是金融机器学习最流行的模型选择,因为它很好地捕捉了非线性并且具有恰到好处的复杂性。

  • 00:40:00 在这一部分,Ernest Chan 博士谈到了机器学习在预测市场趋势和避免损失方面的重要性。他分享了他使用机器学习模型检测世界经济中是否存在恐怖活动的个人经验,并警告不要听从其建议的风险,就像辉瑞疫苗公告的情况一样。他还强调了特征选择在向投资者解释损失方面的重要性,并向初学者推荐了他自己的机器学习书籍。此外,Chan 博士强调了数据清洁度和平稳性对于做出正确预测的重要性,为此他分享了一个示例,说明非平稳时间序列如何对模型的准确预测能力产生负面影响。

  • 00:45:00 在本节中,Ernest Chan 博士讨论了将基础数据(尤其是分类数据)纳入机器学习模型。虽然线性回归模型无法处理分类数据,但机器学习模型可以处理真实值和分类数据。然而,陈博士强调机器学习不能完全取代人类交易员,因为金融机器学习需要深厚的领域专业知识来创建特征和正确解释数据。此外,他警告不要盲目崇拜深度学习,并强调如果没有足够的相关数据,它就不是一个放之四海而皆准的解决方案。最后,他建议年轻从业者寻找利基市场,避免与资金雄厚的组织直接竞争。

  • 00:50:00 在本节中,Ernest Chan 博士讨论了资本配置以及机器学习如何提供更复杂的预期回报作为资本资产配置模型的输入。他质疑使用过去的表现作为预期回报的矛盾,这并不能保证未来的成功。与仅提供静态分布概率的经典统计不同,机器学习还可以每天以不同的概率提供对市场的细微理解。当谈到像循环卷积神经网络这样的深度学习方法时,Chan 博士认为它们可能对非时间序列输入和特征选择没有用处。

  • 00:55:00 在本节中,Ernest Chan 博士讨论了深度学习在创建需要领域专业知识的成功预测所需的各种横截面特征方面的局限性。他还就强化学习在不同时间尺度的金融模型中的地位发表了自己的看法。他认为强化学习对于高频交易可能在非常高的频率下起作用,因为它可以对人们在订单簿上下订单做出反应,但它在更长的时间范围内会失败。最后,他推荐他的公司 PredictNow.ai 作为无代码金融机器学习的重要资源,供那些对像他这样的人的专业知识感兴趣的人使用。
Financial Machine Learning - A Practitioner’s Perspective by Dr. Ernest Chan
Financial Machine Learning - A Practitioner’s Perspective by Dr. Ernest Chan
  • 2020.11.12
  • www.youtube.com
QUANTT and QMIND came together to offer a unique experience for those interested in Financial Machine Learning (ML). Unifying these two clubs is Dr. Ernest C...
 

使用深度强化学习进行交易 |托马斯·斯塔克博士


使用深度强化学习进行交易 |托马斯·斯塔克博士

交易深度强化学习领域的专家 Thomas Starke 博士发表了富有洞察力的演讲,并与观众进行了问答环节。以下是他演讲的扩展摘要:

Starke 博士首先介绍了用于交易的深度强化学习,强调了它使机器能够在没有直接监督的情况下解决任务的能力。他用机器学习来类比玩电脑游戏,它学会根据屏幕上看到的内容做出决定,并根据其决策链决定成败。

然后,他讨论了交易中马尔可夫决策过程的概念,其中状态与市场参数相关联,而行动将过程从一种状态转变为另一种状态。目标是在给定特定策略和状态的情况下最大化预期奖励。市场参数对于帮助机器做出有关要采取的行动的明智决策至关重要。

交易中的决策过程涉及根据通知系统状态的各种指标来确定是买入、卖出还是持有。 Starke 博士强调了不要仅仅依赖每个州的即时利润或损失标签的重要性,因为它可能导致不正确的预测。相反,机器需要了解何时留在交易中,即使它最初与交易相反,等待交易在退出前恢复到平均线。

为了解决标记交易损益中每一步的困难,Starke 博士引入了追溯标记。这种方法使用贝尔曼方程为每个动作和状态分配一个非零值,即使它不会立即产生利润。这允许回归均值和最终利润的可能性。

深度强化学习可以帮助根据未来结果做出交易决策。传统的强化学习方法根据过去的经验构建表格,但在交易中,状态和影响的数量是巨大的。为了处理这种复杂性,深度强化学习利用神经网络来近似这些表格,从而无需创建庞大的表格即可实现。 Starke 博士讨论了找到正确的奖励函数和输入来定义状态的重要性,最终实现更好的交易决策。

强调了输入在交易中的重要性,强调它们需要具有预测价值。 Starke 博士强调了针对已知行为测试系统并根据所选奖励函数选择神经网络的适当类型、大小和成本函数的重要性。他解释了交易中如何采用游戏化,其中历史和当前价格、技术守卫数据和替代数据源构成状态,而奖励是交易的盈亏 (P&L)。该机器使用贝尔曼方程追溯标记观察结果,并不断更新神经网络近似的表格以改进决策。

关于强化学习训练,Starke 博士讨论了构造价格序列的不同方法,包括在不同点随机进入和退出。他还解决了设计奖励函数的挑战,并提供了示例,例如纯百分比损益、每笔报价的利润和夏普比率,以及避免长时间拖延或回撤的方法。

在交易输入方面,Starke 博士提到了许多选项,包括开盘价-高-低-收盘价和成交量值、烛台形态、技术指标(例如相对强弱指数、日/周/年时间)以及输入价格和技术指标其他工具的指标。还可以考虑替代数据源,例如情绪或卫星图像。关键是将这些输入构造成一个复杂的状态,类似于计算机游戏中如何使用输入特征来做出决定。

Starke 博士解释了强化学习器在用于交易之前必须经历的测试阶段。他概述了各种测试,包括干净的正弦波、趋势曲线、没有结构的随机序列、不同类型的顺序相关性、干净的测试曲线中的噪音和重复出现的模式。这些测试有助于确定机器是否持续产生利润并识别编码中的任何缺陷。 Starke 博士还讨论了所使用的不同类型的神经网络,例如标准、卷积和长短期记忆 (LSTM)。他表达了对更简单的神经网络的偏爱,这些神经网络可以满足他的需求,而无需过多的计算工作。

Starke 博士随后深入研究了使用强化学习进行交易的挑战。他承认很难区分信号和噪音,尤其是在嘈杂的金融时间序列中。他还强调了强化学习在适应市场行为变化方面的努力,这使得学习新行为具有挑战性。此外,他提到虽然强化学习需要大量的训练数据,但市场数据往往很少。过度拟合是另一个问题,因为强化学习倾向于作用于基本的市场模式并且很容易过度拟合。构建更复杂的神经网络可以缓解这个问题,但这是一项耗时的任务。总的来说,Starke 博士强调,强化学习并不是保证盈利结果的解决方案,拥有市场经验和特定领域的知识对于在交易中取得成功至关重要。

在问答环节,Starke 博士回答了与深度强化学习交易相关的各种问题。他澄清说,贝尔曼方程不会引入前瞻性偏差,并在仔细分析后讨论了技术指标作为输入的潜在用途。他还探讨了利用卫星图像预测股票价格的可能性,并解释说可以根据神经网络计算时间在小时间范围内进行强化交易。他警告说,强化交易算法对市场异常很敏感,并解释了为什么使用强化学习训练随机决策树不会产生有意义的结果。

Starke 博士建议使用神经网络代替决策树或支持向量机进行交易,因为它们对问题的适用性。他强调了根据使用的奖励函数调整损失函数的重要性。虽然已经尝试将强化学习应用于高频交易,但 Starke 博士强调了慢速神经网络在实时市场中缺乏响应能力的挑战。他建议有兴趣在金融行业从事交易职业的个人获取市场知识、参与实际交易并从中学习经验。最后,他讨论了结合神经网络和期权交易的挑战,认识到任务的复杂性。

总之,Thomas Starke 博士提供了有关使用深度强化学习进行交易的宝贵见解。他涵盖的主题包括交易中的决策过程、追溯标签、贝尔曼方程、输入的重要性、测试阶段以及与交易强化学习相关的挑战。通过他的演讲和问答环节,Starke 博士提供了在金融市场中利用深度强化学习的指导和实际考虑。

  • 00:00:00 Thomas Stark 博士介绍了交易的深度强化学习,这是他多年来一直感兴趣的话题。强化学习 (RL) 是一种允许机器在没有监督的情况下解决任务的技术,它会自行学习如何做才能产生有利的结果。他解释了一台想要学习如何玩电脑游戏的机器如何从游戏场景开始,然后从一个步骤移动到下一个步骤,同时响应它在屏幕上看到的内容。最后,游戏结束,机器根据其做出的决策链决定成败。

  • 00:05:00 Thomas Starke 博士讨论了使用深度强化学习进行交易并解释了马尔可夫决策过程的概念。在这个过程中,一个状态与一个特定的市场参数相关联,一个动作将过程从一个状态转换到下一个状态。根据转换,代理会收到正奖励或负奖励。目标是在给定特定策略和状态的情况下最大化预期奖励。在交易中,市场参数用于识别代理所处的状态,并帮助其决定采取何种行动。

  • 00:10:00 Thomas Starke 博士讨论了交易中涉及的决策过程,其中涉及根据告知系统状态的各种指标来决定是买入、卖出还是持有。目标是获得最好的回报,即交易的盈利或亏损。然而,如果交易在不久的将来对我们不利,传统的机器学习方法会给一个状态一个特定的标签,比如即时利润或亏损,可能会导致标签不正确。因此,机器必须知道什么时候留在交易中,即使它最初对我们不利,并且有信心等到交易恢复到平均线退出交易。

  • 00:15:00 Thomas Starke 博士讨论了追溯标记以及它如何用于强化学习以解决标记交易损益中每一步的困难。他解释说,传统的机器学习会给交易中的每一步都贴上标签,因此很难预测如果交易出现亏损,未来是否会盈利。追溯标签使用贝尔曼方程为每个动作和状态分配一个非零值,即使它不会产生即时利润,也允许回归到均值和最终利润。

  • 00:20:00 Thomas Starke 博士解释了如何使用强化学习来解决交易中的延迟满足问题。贝尔曼方程用于计算一个动作的奖励,“r”代表即时奖励,“q”代表累积奖励。 Gamma 是一个贴现因子,与以前的结果相比,它为未来的结果分配权重。通过使用强化学习,交易决策不仅基于即时回报,还基于持有头寸以获得更高的未来回报。与贪婪的决策相比,这允许做出更明智的决策。

  • 00:25:00 Thomas Starke 博士讨论深度强化学习如何帮助根据未来结果做出交易决策。传统的强化学习涉及根据过去的经验构建表格,但在交易中,由于大量的状态和影响,这变得复杂。因此,解决方案是使用深度强化学习和神经网络来近似这些表,而无需创建庞大的表。他解释了使用交易游戏化并找到正确的奖励函数和输入来定义状态的实现。总的来说,深度强化学习的使用有助于交易决策。

  • 00:30:00 在本节中,Starke 博士讨论了输入在交易中的重要性以及它们如何需要具有某种预测价值,否则系统将无法做出良好的交易决策。他强调需要测试系统的已知行为,并根据所选的奖励函数选择合适的神经网络类型、大小和成本函数。然后他解释了游戏化在交易中的运作方式,其中状态是历史和当前价格、技术保护数据和替代数据源,而奖励是交易的盈亏。强化学习者将使用贝尔曼方程追溯标记观察结果,并通过不断更新神经网络逼近的表格,机器将学习做出越来越好的交易决策。

  • 00:35:00 在本节中,Thomas Starke 博士讨论了如何构建价格序列以使用强化学习进行训练。他解释说,您可以在不同点随机进入和退出,而不是按顺序运行价格系列,由用户决定选择哪种方法。他还讨论了设计奖励函数的困难,并提供了各种示例和方法来构建可用于训练的奖励函数,例如使用纯百分比损益、每笔报价的利润、夏普比率和不同类型的惩罚来避免长途运输或缩编。

  • 00:40:00 根据 Thomas Starke 博士的说法,我们有很多选择,包括高开低收盘价和成交量值、烛台形态、技术指标,例如相对强弱指数、一天/一周/一年的时间、不同的时间粒度、输入其他工具的价格和技术指标,以及情绪或卫星图像等替代数据。然后将这些输入构造成一个复杂的状态,类似于计算机游戏如何使用输入特征来做出决定。最终,关键是找到适合您的交易风格的正确奖励函数,并相应地优化您的系统。

  • 00:45:00 Thomas Starke 博士解释了他的强化学习者在用于金融市场交易之前必须经历的测试阶段。他应用了一系列测试,包括干净的正弦波、趋势曲线、无结构的随机序列、不同类型的顺序相关性、干净测试曲线中的噪声和重复模式,以确定机器是否持续获利并找出编码中的缺陷.他还讨论了他使用的不同类型的神经网络,包括标准、卷积和长短期记忆 (LSTM),以及他对简单神经网络的偏好,因为它们足以满足他的需求并且不需要过多的计算工作。

  • 00:50:00 在本节中,Thomas Starke 博士讨论了使用强化学习进行交易的挑战,包括区分信号和噪声的困难以及局部最小值问题。他展示了强化学习在嘈杂的金融时间序列和不断变化的规则和市场制度下的动态金融系统中挣扎。不过,他还表明,使用简单的移动平均线平滑价格曲线可以显着提高强化学习机的性能,从而深入了解如何构建成功的机器学习系统,从而做出有利可图的交易决策。

  • 00:55:00 在本节中,Thomas Starke 博士讨论了使用强化学习进行交易的挑战。首先,强化学习难以适应市场行为的变化,这使得学习新行为具有挑战性。此外,需要大量的训练数据,但市场数据往往很少。虽然强化学习是有效的,但它很容易过度拟合并且只真正作用于基本的市场模式。构建更复杂的神经网络可以克服这个问题,但这是一项耗时的任务。归根结底,强化学习并不是产生盈利结果的灵丹妙药,拥有良好的市场经验和特定领域的知识对于实现成功的交易结果非常重要。 Starke 博士提供了一个 Quant NC 讲座,并鼓励任何对编写这些系统感兴趣的人在 LinkedIn 上与他联系,并提出精心设计的问题。

  • 01:00:00 Thomas Starke 博士回答了与深度强化学习交易相关的各种问题。他解释说,贝尔曼方程没有引入前瞻性偏差,技术指标有时可以在仔细分析后作为输入。卫星图像可用于预测股票价格,并且可以根据神经网络计算时间在较小的时间范围内进行强化交易。他还讨论了强化交易算法对市场异常的敏感程度,并解释了为什么使用强化学习训练随机决策树没有意义。

  • 01:05:00 在本节中,Thomas Starke 博士建议使用神经网络进行交易,而不是决策树或支持向量机,因为它们对问题的适用性。他解释说,根据使用的奖励函数调整损失函数是必不可少的。他提到人们曾尝试将强化学习用于高频交易,但最终得到的是速度较慢的神经网络,在实时市场中缺乏响应能力。他建议获得市场知识将大大有助于在金融行业从事交易职业,进行实际交易,并在此过程中学到很多东西。最后,他讨论了是否可以使用神经网络在期权交易中获得良好的结果,并解释了将神经网络与期权交易相结合的挑战。

  • 01:10:00 在本节中,Thomas Starke 博士讨论了如何将期权数据用作交易标的工具的输入,而不是仅依赖技术指标。他还回答了有关使用神经网络来决定买卖手数的问题,以及如何通过构建滑点模型并将这些因素纳入奖励函数,将点差、佣金和滑点纳入算法。他建议在使用神经网络决定交易量时要谨慎,并建议使用输出值来相应地调整投资组合权重。最后,他感谢听众提出问题和参加他的演讲。
Machine Learning Trading | Trading with Deep Reinforcement Learning | Dr Thomas Starke
Machine Learning Trading | Trading with Deep Reinforcement Learning | Dr Thomas Starke
  • 2020.09.23
  • www.youtube.com
Dr. Thomas Starke Speaks on Machine Learning Trading with Deep Reinforcement Learning (DRL). In this captivating video, join Dr. Thomas Starke as he unravels...
 

Harrison Waldon(德克萨斯大学奥斯汀分校):“算法学习方程式”


Harrison Waldon(德克萨斯大学奥斯汀分校):“算法学习方程式”

来自 UT Austin 的研究员 Harrison Waldon 介绍了他在金融市场算法合谋方面的工作,重点关注强化学习 (RL) 算法的交互和潜在合谋。他解决了监管机构对自主算法交易及其在没有明确沟通的情况下通过串通抬高价格的可能性的担忧。

Waldon 的研究旨在了解 RL 算法在金融环境中的行为,并确定它们是否可以学会串通。他利用算法学习方程 (ALE) 推导出常微分方程 (ODE) 系统,该系统近似于特定条件下算法的演化。这些 ALE 能够验证 Q-learning 算法中的合谋行为,并提供了算法演化的良好近似,展示了合谋结果的巨大吸引力。

然而,在计算平稳分布和区分真正的共谋与理性的自我保护行为方面存在挑战。在确定平稳分布时出现了数值上的困难,并且将真正的共谋与由自身利益驱动的行为区分开来仍然是一个挑战。

Waldon 强调了将静态博弈均衡应用于动态交互时的局限性,强调需要采用综合方法来调节行为。在各方之间没有直接通信的情况下由算法促进的串通行为需要仔细考虑。谈话结束时,沃尔登向与会者表示感谢,标志着春季学期系列的结束。

  • 00:00:00 在本节中,UT Austin 的 Harrison Walden 讨论了他最近在金融行业的算法合谋方面的工作。他指出,电子市场中的大部分交易都是由算法执行的,其中许多算法使用强化学习 (RL) 等机器学习技术来学习交易策略。虽然 RL 在深度对冲和最佳执行方面取得了实际成功,但监管机构对依赖完全自主算法交易的公司表示担忧,因为它可能导致任务串通并在没有明确沟通的情况下抬高市场价格。 Walden 的工作旨在为研究算法合谋及其对金融业的潜在影响提供工具。

  • 00:05:00 在本节中,Harrison Waldon 讨论了现有研究对金融环境中强化学习算法行为的局限性。虽然一些实验证据表明某些强化学习算法可以在某些场景下学习复杂的合谋策略,但此类实验缺乏理论严谨性。此外,强化学习算法缺乏可解释性是 AFM 等组织关注的问题,尤其是在金融市场等多代理和非平稳环境中。推动 Waldon 工作的主要问题是:我们如何理解金融环境中交互强化学习算法的行为,以及这些算法是否可以证明学会串通?

  • 00:10:00 在本节中,Harrison Waldon 解释说,在强化学习 (RL) 中,函数 F 或学习规则采用旧参数值、当前状态、当前动作以及可能的后续状态,将信息合并到一组新的参数。目标是找到一组近似最优策略的参数。 RL 中一种流行的算法是异步表格 Q 学习,它将一个参数值关联到每个状态-动作对,并以异步方式更新它们。 Q-learning 在单代理设置中运行良好,但在市场上常见的多代理和非固定设置中变得更具挑战性。金融中的状态空间被定义为其他代理人公布价格的向量,其中行动空间可能包括买入、卖出或持有。

  • 00:15:00 在本节中,我们了解到团队工作中的一个有趣发现是,如果算法开始以不相关的市场因素为条件,则它们可以学习黑子交易。演讲者解释了 Q 学习如何与其他 Q 学习器交互,并将马尔可夫决策过程的多代理模拟定义为随机游戏。他们讨论了代理如何随着时间学习和调整他们的策略,使状态过程的真实动态变得不稳定,即使转换函数可能是固定的。演讲中使用的主要示例是囚徒困境,它被解释为具有两个相互竞争的流动性提供者的程式化市场。

  • 00:20:00了解算法学习与其他配备算法的玩家重复玩囚徒困境游戏的行为。为实现这一点,必须给状态过程一个状态概念,我们得到的系统称为算法学习方程。为了推导这个系统,他们使用来自随机近似的 ode 方法来近似参数的演变,从而允许对策略进行直接分析。虽然此模型存在局限性,但所提供的工具是通用的,可以解决这些局限性。

  • 00:25:00 在本节中,Harrison Waldon 讨论了算法学习方程,该方程利用经典随机逼近和 ODE 来逼近参数的演化。通过针对平稳分布调节学习规则并引入固定参数,他们推导出了一个模仿学习算法的 ODE 系统。这些算法学习方程可以在给定特定条件(例如非退化学习率和参数紧凑性)的情况下近似算法的演化。平稳分布和策略是 Lipschitz 连续的,这也被证明是至关重要的。由于动态变化的非平稳过程,使用随机近似是必要的。

  • 00:30:00 在本节中,Harrison Waldon 讨论了算法学习方程及其属性。视频中讨论的 Q-learning 示例满足这些方程的所有属性,包括在紧集中保持参数、遍历马尔可夫链、策略和学习规则中的 Lipschitz 连续性。 Waldon 表明,在适当的时间尺度下,如果学习率衰减得足够快,该算法将以高概率接近任何有限时间范围内的 ODE 解,并且几乎肯定会收敛到局部渐近稳定的解。 Waldon 最后通过使用带有 softmax 动作选择的 Q 学习将它们应用于重复的囚徒困境来验证这些方程。

  • 00:35:00 在本节中,讨论了算法学习方程逼近算法演化的必要条件。对于这种情况,遍历性的状态过程条件立即得到满足,因为只有一个状态。学习算法的轨迹在大学习率和小学习率下都被模拟,这表明算法学习方程的近似在小学习率下是好的。 ALE 也可用于分析获得共谋结果的概率,其中有一个大的吸引盆地导致这样的结果。在视频的下一部分中,每个代理人都可以根据前一时期对手的价差调整自己的价差。

  • 00:40:00 在这部分视频中,Harrison Waldon 解释了他们正在分析的模拟中执行特定动作的概率和噪声源。他讨论了因果状态过程、政策的平稳分布,以及如何从惩罚的角度解释每个代理人政策的组成部分,以检查一组政策导致共谋结果的频率。他还提供了在一系列初始条件下状态相关 Q 学习的算法学习方程图,直到轨迹在数值上收敛。

  • 00:45:00 在视频的这一部分,Harrison Waldon 讨论了使用 Q-learning 和算法学习方程来学习随机游戏中的合谋行为的结果。代理人几乎可以在 100% 的时间里学习串通传播,即使他们不是以高串通概率开始的。结果还表明,共谋结果有很大的吸引力,但也有意想不到的行为,例如在相互串通和相互竞争的结果之间来回翻转。本研究中使用的方法提供了最低限度的限制性充分条件,允许对广泛的状态依赖强化学习算法的行为进行近似。然而,由于计算平稳分布的数值困难,存在一些局限性。总的来说,Q-learning 在学习这些随机游戏中的串通行为方面是成功的。

  • 00:50:00 在本节中,Harrison Waldon 解释了如何通过显示 Lyapunov 函数的存在来保证算法学习方程逼近算法的渐近行为,由于需要处理平稳分布,这很困难。为解决这个问题,Waldon 引入了一种新算法,它是经典虚拟游戏的泛化,称为 State Dependent Smooth Fictitious Play。该算法假设系统中的所有代理都根据固定策略进行游戏,并且这些策略的信念是通过游戏的经验频率形成的。该算法将一些随机性添加到系统中,并根据 soft-max 分布采取行动,以解决确定性学习规则的问题。

  • 00:55:00 在本节中,Harrison Waldon 解释了算法学习方程可用于分析连续时间系统并保证平滑的虚拟播放算法将收敛到系统的休息点,其中一些可能是合谋策略.随着折扣因子的增加,学习共谋结果的可能性增加。 Waldon 还讨论了对更现实的市场动态的需求,以及将算法学习方程应用于深度强化学习算法以研究均衡和价格的可能性。最后,他承认串通检测的难度以及区分真正串通和理性自我保护行为的挑战。

  • 01:00:00 在本节中,Harrison Waldon 讨论了静态游戏的均衡如何狭隘地反映人与人之间动态互动的现实。他强调在考虑要规范的均衡行为时需要采用整体方法,尤其是在可能被视为理性的串通行为方面,这些串通行为可以通过算法实现,而无需各方之间的直接沟通。会议以沃尔登感谢与会者并结束春季学期系列结束。
Harrison Waldon (UT Austin): "The Algorithmic Learning Equations"
Harrison Waldon (UT Austin): "The Algorithmic Learning Equations"
  • 2023.04.26
  • www.youtube.com
Abstract: Recently there has been concern among regulators and legal theorists about the possibility that pricing algorithms can learn to collude with one a...
 

Irene Aldridge(AbleBlox 和 AbleMarkets):“加密生态系统和 AMM 设计”



Irene Aldridge(AbleBlox 和 AbleMarkets):“加密生态系统和 AMM 设计”

AbleMarkets 的创始人兼董事总经理 Irene Aldridge 深入研究了区块链技术、自动化做市 (AMM) 以及传统市场与 AMM 世界融合的各个方面。她强调了这些主题在金融领域的重要性,并探讨了与它们相关的潜在挑战和解决方案。

Aldridge 首先概述了她在金融行业的背景以及她在微观结构方面的专业知识,重点是了解市场运作。她强调了越来越多地采用自动化做市模型,这些模型最初在加密货币市场上很突出,但现在扩展到了传统市场。她概述了她的演讲结构,其中包括介绍性区块链概念、区块链在金融和编程中的应用,以及做市的真实案例研究及其对传统市场的影响。

Aldridge 探索区块链技术,将其描述为一个高级数据库,其中每一行都包含前一行的加密摘要,以确保数据完整性。她解释了区块链中涉及的挖掘过程,其中提议的内容被验证并添加到链中,从而提高文书工作和支付系统的透明度和去中心化。

Aldridge 讨论了加密生态系统向分散化的转变,强调了隐私与在服务器上拥有多个数据库副本的稳健性之间的权衡。她解释了区块链流程,从定义区块和创建加密签名到工作量证明和挖掘的核心创新,这些都确保了安全性以抵御黑客攻击。

然而,Aldridge 承认与工作量证明挖矿系统相关的挑战,包括挖矿成本增加、矿工数量减少以及潜在漏洞。她重点介绍了替代解决方案,例如以太坊的区块聚合和 Coinbase 的消除挖矿谜题。

演讲者继续探讨加密生态系统中的质押,利益相关者在其中投入资金以支持网络的运营。她承认加密寡头操纵市场的潜在问题,并解释了如何实施链下验证和自动化做市来解决这个问题。 Aldridge 强调理解这些概念对于掌握自动做市在防止加密货币市场操纵方面的重要性的重要性。

Aldridge 深入探讨了自动做市商 (AMM) 背后的原则,强调了它们对加密货币交易的革命性影响。她解释了由与流动性相关的不变量塑造的 AMM 曲线如何根据流动性池中的剩余库存确定价格。她强调了 AMM 的好处,包括 24/7 流动性、公式滑点估计和通过凸曲线确定公允价值。然而,她也提到 AMM 在波动的情况下可能会面临损失,从而导致引入交易费用。

将 AMM 与传统市场进行比较,Aldridge 讨论了自动做市的优势,例如持续的流动性、可预测的滑点和公允价值确定。她解释了 UniSwap 采用的恒定产品做市方法,说明执行经纪人如何根据参数化数据选择流动性和执行平台。

演讲者讨论了交易量变化的计算以及公共和私人流动资金池之间的区别。她使用来自不同交易所的比特币和以太坊展示了实证示例,指出了它们曲线的差异并提出了对某些平台的潜在担忧。

Aldridge 强调了使用凸形设计 AMM 曲线以确保市场稳定的重要性。她解释了流动性提供者和交易者在系统中的角色,以及他们如何从交易费用中获益。她还提出了 AMM 系统在传统市场中使用的可能性,促使人们考虑将其应用于 IBM 股票等资产。

Aldridge 探索了传统市场与自动化做市的融合,并指出传统做市商已经在实施类似的系统。她强调了市场互动、交易策略、执行方法和透明度方面的预期变化。还讨论了自动化做市商对市场微观结构的影响。

解决在加密市场等 24/7 交易环境中实施自动流动性的可行性时,Aldridge 解释说,自动做市可以消除与传统做市方法相关的风险,并且该技术很容易获得。然而,她警告说,并非所有加密货币交易所都使用自动做市,强调需要进行研究以解决风险管理和外部性问题。 Aldridge 指出,2002 年,自动化做市技术与比特币等加密货币同时出现。

当被问及自动做市商获得私人信息的潜在不公平优势时,Aldridge 承认这会带来问题。然而,她建议货比三家并量化不同平台的自动做市曲线可以帮助缓解这个问题。她指出,矿工受到激励继续他们的工作,因为他们是从访问和验证订单块中受益的人。然而,除非有私人激励,否则在这个领域产生利润越来越具有挑战性,从而导致寡头垄断的形成。奥尔德里奇提议,保险可以作为矿工几乎免费工作的自然激励。然而,保险公司将区块链视为对其行业的主要威胁,从而抵制此类系统设计。她还谈到了欺诈计划的可能性,强调了 IBM 曲线中的潜在操纵。

在集中式限价订单簿的背景下,Aldridge 解释了市场参与者如何利用自动做市商模型(例如 AMM),这些模型以具有成本效益的自动化方式提供流动性,并可能带来利润。然而,区分使用 AMM 的交易者和手动下达限价单的交易者仍然是一个挑战。 Aldridge 建议通过微观结构数据分析识别恶意用户可以提供一个潜在的解决方案。她认为,如果自动做市商继续主导市场,将会出现一种更高效、更精简的模式。

总之,Irene Aldridge 的讨论涵盖了区块链技术、自动化做市以及传统市场与 AMM 世界融合的各个方面。她探讨了区块链的基础知识,讨论了与工作证明挖矿系统相关的挑战和潜在解决方案,并强调了 AMM 相对于传统市场的优势。 Aldridge 还解决了有关实施自动流动性的可行性、自动做市交易商可以访问私人信息的问题,以及保险作为矿工激励的潜在作用的问题。通过她的见解,她就金融和自动化做市的当前格局和未来可能性提供了宝贵的观点。

  • 00:00:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了她在金融行业的背景以及她对微观结构的兴趣,微观结构侧重于市场的运作方式。然后,她介绍了自动化做市的主题,以及它如何起源于加密货币市场,但现在正在传统市场中部署。她提供了演讲大纲,其中包括区块链 101 介绍、区块链在金融中的应用、编程以及实践中的做市案例研究及其对传统市场的溢出效应。 Aldridge 拥有电气工程背景,曾在金融行业的多个领域工作,包括交易、风险管理和研究。

  • 00:05:00 在本节中,Irene Aldridge 解释了区块链技术的基础知识。她将其描述为一个奇特的数据库,其中每一行都包含前一行的加密摘要,这使得更改任何以前的数据在计算上变得困难。此外,她还讨论了区块链的挖掘过程以及它如何涉及检查块的建议内容并将其提交到内存中。 Aldridge 认为区块链可以帮助将文书工作和支付转移到区块链上,从而实现更高的透明度和去中心化。

  • 00:10:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了在加密生态系统中向分散模型的转变,其中交易是公开的并存储在多个服务器上,而不是集中在 Oracle 服务器上。虽然这意味着牺牲了隐私,但在服务器上拥有多个数据库副本可提高稳健性,这被视为一种公平的权衡。 Aldridge 解释说,区块链过程相对简单,从定义一个块开始,创建一个加密签名或哈希,然后将其编码到下一个块中。然后讨论了工作量证明和挖掘程序的核心创新,目的是通过使重新计算链的计算复杂性太大来确保安全性以防止黑客攻击。

  • 00:15:00 在本节中,Irene Aldridge 讨论了困扰加密货币工作挖掘系统证明的问题。她解释说,挖矿的成本对大多数人来说变得太贵了,这导致了一种平衡,即只有特定的一群人能够负担得起成本,而其他人则无法挖矿。此外,随着时间的推移,矿工的数量正在减少,使系统容易受到潜在黑客的攻击。去中心化模型的优势在于,最长的链由核心引擎自动选择,防止共谋者赶上来并将被黑的区块引入系统。然而,人们越来越关注工作量证明系统,包括交易和挖矿的矿工之间的利益问题,以及开采区块所需的时间。现在有新的解决方案正在开发中,例如以太坊每 12 秒聚合一次区块,以及 Coinbase 决定不再要求人们解决谜语才能挖矿。

  • 00:20:00 在本节中,演讲者讨论了在加密生态系统中质押的过程,其中涉及将资金投入系统进行挖矿。利益相关者可以在特定时期内锁定他们的股份或抵押品,如果存在欺诈活动,他们会用他们的股份支付费用。然而,这造成了操纵市场的加密货币寡头的寡头垄断。为了解决这个问题,已经使用了链下验证和自动做市。后者在加密生态系统中变得越来越流行,并且拥有各种任何人都可以访问的开源产品,使其更容易理解。演讲者强调,了解背景信息(例如质押和链下验证)对于理解自动做市的重要性以及它如何防止加密货币市场被操纵至关重要。

  • 00:25:00 本节,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了不同的自动做市商 (AMM) 背后的原则,这些原则彻底改变了加密货币交易的世界。她解释说,曲率和偏移量不同的 AMM 曲线是由与流动性相关的不变量塑造的,价格是流动性池中剩余库存的函数。 AMM 的一个好处是它们可以 24/7 无差价交易,因为没有买卖差价,并且可以自动调整以适应不断变化的市场条件。然而,AMM 在波动的情况下可能会亏损,因此他们收取传统市场没有的交易费。

  • 00:30:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了自动做市 (AMM) 及其相对于传统市场的优势,例如连续 24/7 流动性、可以提前估算的公式化滑点,以及通过使用一条凸曲线。 Aldridge 解释了流行系统 UniSwap 使用的恒定乘积做市方法,该方法遵循数量一和数量二之间的凸曲线。通过从不同的交易所收集数据并根据这种常量乘积方法对其进行参数化,Aldridge 强调了执行经纪人如何确定选择哪些平台进行流动性和执行。

  • 00:35:00 在本节中,Irene Aldridge 讨论了交易量和货币各自变化的计算,并使用微观结构中的 girl tick 规则模拟了一个非常简单的模拟,以确定交易量是买入还是卖出。她还解释了公共和私人两种类型的流动性池,以及它们之间进行的套利,强调在流动性充足的平台上它们之间应该没有区别。 Aldridge 随后展示了使用来自各种交易所(例如 Bitfinex 和 Bitstamp)的比特币和以太坊的经验示例,并强调了它们的曲线,指出 FTX 与我们从自动化做市的角度所期望的完全不同,并暗示它可能是一个庞氏骗局计划一直。

  • 00:40:00 在本节中,Irene Aldridge 讨论了自动做市 (AMM) 曲线的设计,并将它们与来自各种加密货币交易所的示例进行了比较。她强调了在 AMM 设计中使用凸曲线以确保市场稳定并避免在库存被买断时价格大幅上涨的重要性。此外,她还解释了流动性提供者和交易者在系统中的角色,以及他们如何从交易费用中获益。 Aldridge 还提到了传统市场正在使用 AMM 系统的传闻,并强调需要考虑这种设计如何适用于 IBM 股票等产品。

  • 00:45:00 在本节中,Irene Aldridge 讨论了传统市场和自动化做市商世界的融合,传统做市商已经在其中部署了类似的系统。她指出,在个人与市场互动的方式、培训策略的制定方式、执行方式的执行方式以及一切变得多么透明方面,预计会发生很多变化。她还指出,由于自动化做市商的影响,市场的微观结构正在发生变化。 Irene 基本了解了如何使用 IBM 日常数据来估算 AMM 曲线,以及更精细的数据如何更容易获得更清晰的估算。

  • 00:50:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了在 24/7 交易环境(如加密市场)中实施自动流动性的可行性,传统的做市方法在这些环境中可能效果不佳。她解释说,自动化做市可以消除与传统做市方法相关的风险,而且该技术可以广泛使用。然而,她警告说,并非所有的加密货币交易所都使用自动做市,需要进行研究来解决风险管理和外部性问题。她还指出,这项技术自 2002 年以来一直存在,恰逢比特币等加密货币的出现。当被问及自动做市商获得私人信息的潜在不公平优势时,奥尔德里奇指出,这是一个需要进一步研究的开放性问题。

  • 00:55:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了 AMM 交易商或那些接受硬币并使用自动做市系统 (AMM) 的人如何在其他人之前看到订单流,这提出了一个问题。然而,由于有许多平台可用,货比三家并量化自动做市曲线可以帮助缓解这个问题。 Irene 还指出,由于这个问题,矿工有动力继续前进,因为他们是唯一受益于调查和验证订单块的人。然而,除非有私人激励,否则在这个领域赚钱变得越来越困难,导致寡头垄断的形成。艾琳建议,保险可能是矿工从中受益并几乎免费工作的自然激励。然而,保险公司将区块链视为对其生存的重大威胁,因此对这种系统设计存在抵触情绪。最后,Irene 回答了一个关于欺诈计划可能性的问题,指出 IBM 曲线中可能存在一个欺诈计划,人们可以在其中争辩说底部正在被操纵。

  • 01:00:00 在本节中,艾琳·奥尔德里奇 (Irene Aldridge) 讨论了在集中式限价订单簿中使用自动做市模型。市场参与者正在使用他们自己的自动做市商,因为它成本低且自动化,为市场提供流动性并有可能获利。尽管如此,目前很难区分使用 AMM 的交易者和手动下达限价单的交易者。 Aldridge 表示,通过微观结构数据识别不良行为者可能是一个悬而未决的问题,但如果 AMM 继续主导市场,将会出现更精简的模型。
Irene Aldridge (AbleBlox and AbleMarkets): "Crypto Ecosystem and AMM Design"
Irene Aldridge (AbleBlox and AbleMarkets): "Crypto Ecosystem and AMM Design"
  • 2023.03.29
  • www.youtube.com
Abstract: Assets on blockchain trade 24x7 with very thin liquidity. This demands new fully automated processes, including Automated Market Making (AMM). We d...
 

Agostino Capponi(哥伦比亚):“私人交易池是否会降低抢先交易风险?”


Agostino Capponi(哥伦比亚):“私人交易池是否会降低抢先交易风险?”

来自哥伦比亚大学的研究员 Agostino Capponi 深入研究了去中心化交易所中的前端运行问题,并提出私有交易池作为一种潜在的解决方案。这些私有池在链下运行并与公共池分开,确保承诺不参与前端运行的验证者处理它们。然而,Capponi 承认使用私有池会带来执行风险,因为并非所有验证者都参与私有池,这意味着交易有可能不被注意并保持未执行状态。需要注意的是,采用私有矿池不一定会降低执行所需的最低优先级费用。此外,Capponi 指出,抢先攻击者之间的竞争通过最大可提取价值 (MEV) 使验证者受益。最终,虽然私人资金池可以降低抢先交易风险,但它们可能会增加执行所需的费用,从而导致分配效率低下。

Capponi 强调了通过私人矿池路由的交易比例与抢先交易概率之间的相关性,这使得优化分配变得复杂。他还探讨了不同类型的抢先交易攻击,包括压制和置换攻击,并提供了显示抢先交易造成的重大损失的数据。为了解决这些风险,Capponi 建议对用户进行交易时间方面的教育,并使交易验证更具确定性,以创建一个更加公平的系统。

讨论涉及私人交易池的动态、采用的挑战以及所涉及的潜在权衡。 Capponi 解释了私有池如何提供防止抢先交易的保护,但警告说它们的有效性取决于参与私有池的验证者的数量。此外,他还解决了由于 MEV 丢失而导致验证者不采用私有矿池的问题,并提出了潜在的解决方案,例如用户补贴以激励他们的采用。

虽然私人交易池可以在一定程度上降低抢先交易风险,但卡波尼强调它们并非万无一失,可能无法实现最佳配置。复杂性源于攻击者之间的竞争、私有池中验证者的采用率以及由此产生的对执行费用的影响等因素。讨论提出了区块链社区在解决抢先交易风险和确保公平高效的去中心化交易环境方面的重要考虑。

  • 00:00:00 在本节中,Agostino Capponi 介绍了去中心化交易所的主题及其面临的前端运行风险。他解释说,区块链架构的工作原理是将交易提交到内存池,然后由验证者访问,验证者将交易附加到区块并从用户那里收取费用。 Capponi 指出,用户可以通过提供更高的费用来优先处理他们的交易,但这个系统可能会导致抢先交易。他介绍了私人矿池的概念作为该问题的潜在解决方案,并讨论了他的团队如何构建博弈论模型来测试这些矿池在缓解抢先交易方面的有效性。

  • 00:05:00 在本节中,Agostino Capponi 描述了公共开放访问区块链中的前端运行问题,它允许用户查看和提交交易。当用户利用有关未决或已执行交易的可操作信息时,就会发生抢先交易攻击。 Capponi 解释了三明治攻击,攻击者在用户之前收取更高的费用来执行交易,导致价格上涨,然后执行反向交易以获利。尽管如果攻击者的费用不够高则存在失败的风险,但攻击者通常会安排订单时间以增加成功的机会。

  • 00:10:00 在本节中,Agostino Capponi 讨论了几种前端运行攻击,包括抑制攻击和置换攻击,其中攻击者提交多个交易或置换另一个用户的交易以首先执行他们想要的交易。 Capponi 质疑抢先交易是否是限制区块链采用的重大风险,并提供了一张图表,显示从 2020 年 5 月到 2021 年 3 月,抢先交易攻击的数量和由此产生的收入,这表明损失了大约 10,000 个以太币,即 1.25 亿美元,两个到前面跑。

  • 00:15:00 在本节中,Agostino Capponi 讨论了以太坊交易中的抢先交易问题及其相关的直接和间接成本。他解释说,这个问题的一个解决方案是使用私有交易池,这些交易池本质上是链下的、与公共池分开的并行通道,只能由一些验证者监控。只要验证者诚实行事,提交到这些私有池的交易的前端运行风险为零,如果发现它们是前端运行交易,它们将被逐出池。总的来说,私人交易池为那些担心抢先交易并希望在不抢先交易的情况下执行交易的人提供了一个很好的解决方案。

  • 00:20:00 在本节中,Agostino Capponi 讨论了私有交易池的使用以及它们是否可以降低抢先交易的风险。 Capponi 解释说,私有池只对验证者可见,并且是链下的,这意味着攻击者无法访问它们。这消除了抢先交易的可能性并提供了保证,因为验证者承诺不参与抢先交易。 Capponi 还解决了采用问题以及用户是否会将他们的交易提交到池中。此外,他还提到攻击者如何仍可能相互竞争,但私人矿池可以降低套利机器人投资不足的风险。最后,他介绍了一个包含三个代理的简单模型,以讨论是否会观察到私有矿池的采用。

  • 00:25:00 在本节中,Agostino Capponi 讨论了私人交易池的概念以及它们是否可以降低抢先交易风险。他解释说,提交交易有两个可能的地点:私人矿池和公共矿池。在验证者选择了要监控的池之后,用户将击败他们的优先费用并选择他们想要提交交易的地方。然后攻击者将扫描机会,提交交易并决定将它们提交到哪里。 Capponi 强调概率在检测机会和实现成功领先的概率方面的重要性。

  • 00:30:00 在本节中,演讲者解释了私人交易池的概念以及它们是否可以降低领先风险。私有交易池可以防止抢先交易风险,因为只有附加区块的验证者才能看到交易,从而防止其他仲裁员在用户之前发现机会。但是,通过私有池提交会带来执行风险,因为并非所有验证器都会在私有池中,并且交易有可能不可见,因此无法执行。虽然私有池交易优先于公共池交易,但监控私有池的验证器数量会影响执行风险,这使得用户在通过私有池提交交易之前需要考虑。

  • 00:35:00 在本节中,Agostino Capponi 解释说,私有交易池可以在一定程度上降低抢先交易风险,但并非万无一失。攻击者将参与军备竞赛以获得优先执行他们的订单,他们可以使用私人和公共矿池来降低执行风险,但仍会获得优先执行。同时,可以抢先的用户将根据私有池中验证人的采用率和抢先成本来决定将交易提交到私有池还是公共池。如果采用率高,他们会使用私有池来避免被抢先,但如果采用率低,他们可能会选择公共池以避免等待太多块来执行,尽管有被抢先的风险。

  • 00:40:00 在本节中,Agostino Capponi 解释了私有交易池如何潜在地降低前端运行风险。如果用户提交到一个私有池并且所有验证者都加入该池,则消除了抢先交易风险,因为没有套利机会。然而,在前端运行风险较低的情况下,并非所有验证者都会采用私有池,这意味着用户可能会选择公共池,再次将自己暴露在前端运行风险中。

  • 00:45:00 在本节中,Agostino Capponi 讨论了私有交易池是否可以降低抢先交易风险并降低执行所需的最低费用。有人认为,只有在损失较大的情况下,才能消除抢先交易风险,即使如此,也无法消除一些抢先交易的损失。此外,抢先攻击者之间的竞争通过最大可提取价值 (MEV) 使验证者或矿工受益。采用私有池不一定会降低执行所需的最低优先级费用,因为验证者只有在可以获得更高费用的情况下才愿意采用私有池。此外,私有矿池的存在可能会导致对区块空间的需求增加,从而增加执行所需的费用。最终,私人资金池可能并不总能降低抢先交易风险,但会增加执行所需的费用,从而导致分配效率低下。

  • 00:50:00 在本节中,演讲者讨论了区块链中抢先交易风险导致的低效率。第一个效率低下的原因是用户可能会因为抢先交易的风险而决定不提交交易,这可能导致交易分配不理想。第二个低效率来自抢先交易攻击,攻击者在受害者之前执行交易,导致价值转移。为了降低这些风险,私有交易池被提出,它可以增加交易的价值并帮助用户提交而无需担心抢先交易。然而,由于 MEV 不佳以及由此导致的验证者收入损失,并非所有验证者都可以采用私有矿池。

  • 00:55:00 在本节中,Agostino Capponi 讨论了验证者不采用私有矿池的问题,即使这将是社会最优的结果。原因是他们会失去他们的 MEV(最大可提取价值)并且没有给他们带来好处,他们不会转换。解决方案是让可抢先运行的用户通过承诺向他们支付相当于他们在不抢先运行时节省的钱来补贴验证者。数据表明,如果抢先执行竞争激烈,则由于采用flash bot私池,攻击者的成本收益比大幅降低。
  • 01:00:00 在本节中,Agostino Capponi 讨论了他对私人交易池的研究,以及它们是否降低了抢先交易的风险。他解释说,虽然私人矿池可以缓解大量前期运行损失,但它们对运行套利机器人的攻击者不利,因为这会使他们的情况变得更糟。可以通过查看交易将发生的滑点与需要支付给抢先交易的价格相比较来估计抢先交易的概率。 Capponi 指出,抢先交易的概率与通过私人矿池路由的交易比例之间存在正相关关系。他的结论是,私人矿池无法实现最佳分配,因为并非所有验证者都在监控矿池,从而导致效率低下,例如抢先交易风险或区块空间被分配给可抢先交易。

  • 01:05:00 在本节中,哥伦比亚大学的 Agostino Capponi 讨论了使用私有交易池来避免区块链中的抢先交易风险,尤其是在以太坊和 Polygon 中。他还指出,目前,有一个垄断实体获得所有提供者奖励,以太坊正在考虑解决方案,例如燃烧或重新分配次要可提取价值(MEV)以防止这种情况发生。 Capponi 还提出了在区块链交易和价值从不了解公式的人向了解公式的人转移的背景下数学毁灭性武器的争议性问题。

  • 01:10:00 在本节中,演讲者讨论了私人交易池中的抢先交易问题,以及它如何影响家族办公室等不成熟的用户。他们建议,为了使系统更加公平,需要有一种方法来教育这些用户如何更好地安排交易时间,以避免抢先交易。他们还指出,参与抢先交易的机器人极其复杂,使用复杂的算法来确定执行交易的最佳方式,同时产生最大利润。演讲者建议,如果交易验证的时间更具确定性,用户将更容易更好地安排交易时间并降低抢先交易的风险。
Agostino Capponi (Columbia): "Do Private Transaction Pools Mitigate Frontrunning Risk?"
Agostino Capponi (Columbia): "Do Private Transaction Pools Mitigate Frontrunning Risk?"
  • 2023.01.25
  • www.youtube.com
Abstract: Blockchain users who submit transactions through private pools are guaranteed pre-trade privacy but face execution risk. We argue that private poo...
 

Kevin Webster 博士:“少花钱多办事 - 通过因果正则化进行更好的 A/B 测试”



Kevin Webster 博士:“少花钱多办事 - 通过因果正则化进行更好的 A/B 测试”

在本视频中,Kevin Webster 博士深入探讨了与交易实验和因果机器学习相关的挑战,并扩展了各种关键主题。他解决的一个突出问题是交易中的预测偏差,即交易期间观察到的回报是价格影响和预测价格变动的结合。为了减轻这种偏差,Webster 博士提出了两种方法:使用随机交易数据和应用因果正则化。通过将导致交易的交易信号纳入回归模型,可以消除偏差。

Webster 博士引入了因果图的概念,其中涉及三个变量:交易的 alpha、交易的规模和交易期间的收益。他断言,在不观察 alpha 的情况下准确估计价格影响具有挑战性,而传统的计量经济学技术在这方面达不到要求。他强调了由于规模和持续时间有限而导致的随机交易实验的局限性,强调需要使用模拟器进行仔细的实验设计和成本估算。

为了克服传统计量经济学的缺点,韦伯斯特博士提倡因果正则化。这种方法源自亚马逊,利用有偏差的数据进行训练,使用无偏差的数据进行测试,从而产生低偏差、低方差的估计量。它利用大量可用的组织数据并纠正偏差,从而实现更准确的预测。

在不知道其影响的情况下估算 alpha 会带来重大挑战,尤其是在贸易数据缺乏可信度的情况下。韦伯斯特博士建议使用随机提交的交易来获得无偏见的数据,而不依赖定价技术。然而,这种方法需要放弃大部分交易来建立 alpha 的置信区间,这可能不切实际。或者,他建议利用因果机器学习以更少的数据获得类似的结果。因果机器学习在交易应用程序中被证明特别有价值,例如交易成本分析、价格影响评估和 alpha 研究,由于深度、有偏见的交易数据的可用性,它超越了传统的计量经济学。

演讲者还深入探讨了统计分析在 A/B 测试中的重要性,强调需要定义价格影响并附加统计措施来对抗预测偏差。如果不解决这种偏见,分析就会变得主观并依赖于个人解释。韦伯斯特博士承认观察性公共数据带来的挑战,并强调了从干预数据中获得的见解。尽管回答采用哪种方法的问题很复杂,但 A/B 测试仍然是银行和经纪行业的常见做法。

最后,Webster 博士简要讨论了迁移学习和因果正则化之间的关系。虽然两者都涉及在一个数据集上训练模型并将其应用于另一个数据集,但迁移学习缺乏因果解释。两者之间的类比在于它们的验证过程,其中交叉验证起着举足轻重的作用。尽管它们在数学上有相似之处,但韦伯斯特博士强调了该方法中因果解释的新颖性。

  • 00:00:00 Kevin Webster 谈论实时交易实验和因果机器学习。他描述了一个对冲基金通过经纪人进行交易的场景,该经纪人负责执行交易并确保最佳执行,同时证明他们的行为符合客户的最佳利益。经纪商面临困难,因为他们的客户不会根据 Alpha 信号进行随机交易,并且交易期间观察到的回报是价格影响和交易引起的预测价格变动的混合体。 Webster 旨在使用因果正则化来解决这个问题,并提出了一个模型来学习预测的价格变动与订单流的关系。

  • 00:05:00 演讲者讨论了 alpha 信号和价格影响之间的区别,这是回报的两个组成部分。 Alpha 信号预测无论股票是否交易都会发生的价格变动,而价格影响描述由交易引起的价格变动。交易员使用定价反馈来模拟价格如何对其交易做出反应并回答假设情景。然而,很难区分交易者是导致价格变动还是预测价格变动,从而导致预测偏差。 CFM 的专有数据和其他技术可以通过考虑导致交易回归的交易信号来帮助消除偏差并修复预测偏差。

  • 00:10:00 在视频的这一部分,Kevin Webster 博士讨论了交易中的预测偏差问题以及它如何影响经纪人和阿尔法研究人员。他解释说,虽然 alpha 研究人员可能有 alpha 信号,但他们可能没有好的价格影响模型,这会导致高估 alpha。相反,如果经纪商不知道 alpha,他们的交易速度就会对客户来说太慢。韦伯斯特博士建议使用代价高昂的随机交易,或因果正则化,一种以智能方式结合随机交易数据和历史数据的方法,以获得比传统计量经济学更好的性能。他最后表示,他将使用模拟来比较这些方法的性能。

  • 00:15:00 Kevin Webster 博士讨论了三种计量经济学测试方法,强调了因果推理的重要性,并解释了它如何在科技行业,特别是机器学习社区中得到积极应用。他进一步强调了这些企业如何利用因果机器学习来使他们的团队能够根据基本事实快速调整,避免重新调查令人惊讶的发现,避免重新运行错误的实验,并防止对关键决策进行事后猜测。韦伯斯特博士的方法结合了因果检验和计量经济学检验,可以根据少五倍的数据做出更准确的预测。

  • 00:20:00 作者为他的研究提出了一个因果图,其中涉及三个变量:交易的阿尔法、交易规模和交易期间的回报。他假设他的 Alpha 模型的基本特征驱动股票的不同基本价格变动,并且他的交易算法对 Alpha 信号做出反应,从而引发交易。他还假设交易会导致价格变动,称为价格影响。根据 Webster 博士的说法,无论交易员使用何种花哨的回归技术,如果不观察 Alpha,他们将无法估计价格影响。交易者可以通过随机化来估计价格影响,这在金融业中被广泛使用,被称为随机交易费用。然而,它的使用仅限于实质性订单,因为这种随机化非常昂贵。

  • 00:25:00 由于实验规模和持续时间有限,演讲者讨论了与观察数据相比随机交易实验的局限性。对于一组合理的参数,观察数据集可能大于干预数据集,由于犯错的代价,交易者必须在部署之前设计实验。在提交随机交易之前使用模拟器来确定实验的成本和置信区间是至关重要的。在不考虑偏差的情况下,忽略 Alpha 会导致高偏差和低方差。

  • 00:30:00 凯文韦伯斯特博士解释了传统计量经济学的局限性,并介绍了因果正则化的概念,这是一种来自亚马逊的方法,涉及使用偏差数据作为训练数据和无偏差数据作为测试数据来调整元参数。与仅使用少量实验数据的传统方法不同,该方法确保了低偏差、低方差估计量。因果正则化算法允许使用可用的大量组织数据并纠正任何偏差,为交易者提供准确的估计。

  • 00:35:00 在视频的这一部分,Kevin Webster 博士讨论了在不信任贸易数据时在不知道影响的情况下估计 Alpha 的挑战。他提出了一种解决方案,其中随机不提交交易以获得无偏见的数据,这是无模型且不需要定价技术的。然而,缺点是需要放弃大部分交易才能获得 Alpha 的置信区间,这对交易者来说可能不切实际。然后他提出了一种机器学习方法来解决这个问题,并用更少的数据获得相同的结果。因果机器学习适用于交易成本分析、价格影响和 Alpha 研究等交易应用,并且由于深度、有偏见的交易数据的可用性,在交易数据制度方面优于传统计量经济学。

  • 00:40:00 演讲者讨论了 A/B 测试中涉及的基本不确定性,以及统计分析如何在发现具有统计显着性但不是逐个交易级别的基本事实方面发挥关键作用。他强调,定义价格影响并将统计数字附加到该定义可以帮助消除预测偏差。然而,如果没有一些东西来对抗预测偏差,分析就会变得主观并且取决于旁观者的眼睛。韦伯斯特博士还讨论了观察性公共数据所涉及的挑战,以及干预数据如何为分析提供更多见解。他承认,虽然这是一个很难回答的问题,但 A/B 测试是许多银行和经纪商采用的一种常见转换方式。

  • 00:45:00 Kevin Webster 博士简要讨论了迁移学习和因果正则化之间的关系。他指出,两者之间存在类比,因为两者都涉及在一个数据集上训练模型并希望它在另一个数据集上运行良好。虽然迁移学习缺乏因果解释,但由于交叉验证,迁移学习的证明有效,这也适用于因果正则化。尽管在数学上存在相似性,但韦伯斯特博士断言,该方法的因果解释非常新颖。
Dr. Kevin Webster: "Getting More for Less - Better A/B Testing via Causal Regularization"
Dr. Kevin Webster: "Getting More for Less - Better A/B Testing via Causal Regularization"
  • 2022.11.09
  • www.youtube.com
Abstract: Causal regularization solves several practical problems in live trading applications: estimating price impact when alpha is unknown and estimating...
 

Yuyu Fan(Alliance Bernstein):“利用文本挖掘提取洞察力”



Yuyu Fan(Alliance Bernstein):“利用文本挖掘提取洞察力”

Alliance Bernstein 的研究员 Yuyu Fan 就自然语言处理 (NLP) 和机器学习在分析财报电话会议记录和生成有效交易策略方面的应用提供了宝贵的见解。

Fan 的团队采用了各种技术,包括情绪分析、会计分析和可读性评分,筛选了从财报电话会议记录中提取的 200 多个特征。他们利用 BERT(来自变形金刚的双向编码器表示)等高级模型来评估演讲者的情绪,将 CEO 的情绪与分析师的情绪进行比较。有趣的是,他们发现分析师的情绪往往更可靠。

分析是对成绩单的单独部分和组合部分进行的,团队发现上下文驱动的方法优于基于背景词的朴素方法。情绪信号,尤其是美国小盘股公司,表现良好,得到投资团队的推荐。

在解释该方法时,Fan 描述了他们的团队如何使用分位数筛选和回测来评估不同功能的性能。他们检查了基于字典的方法以及使用 BERT 的基于上下文的方法的情绪分数。该团队还研究了可读性分数,衡量文本的易懂程度,重点关注 CEO 的评论,以确定与公司绩效的潜在相关性。

Fan 提供了对 BERT 工作原理的见解,强调了它的双向编码器表示,可以从给定单词的左右两边捕获上下文信息。该团队通过自标记和外部数据集添加情绪标签,对用于情绪分析的 BERT 模型进行了微调。他们的发现表明,基于 BERT 的情绪分析优于基于字典的情绪分析,正如财报电话会议记录中的例子所证明的那样。

此外,Fan 讨论了为情感分析设置准确度阈值的挑战,并强调准确度级别之间的实际性能可能没有显着差异。她强调了他们对美国小型公司的情绪信号的成功,这导致了投资团队的推荐。 Fan 还提到了一篇详细介绍 NLP 特征的论文的发表,这些特征可以作为量化信号来创建有效的交易策略,并不断努力通过数据扩充来增强模型。

讨论扩展到涵盖 NLP 特征与传统基本面和定量特征之间的相关性,强调观察到的可读性和情绪计算的适度相关性。范阐明了他们的回报方法,包括根据重新调整前的最新可用信息选择公司。

最后,Fan 谈到了 CO2 套利、BERT 和 FinBERT 之间的区别以及专为金融相关文件、收益和新闻量身定制的 BERT 金融使用模型的开发等主题。还提到了使用转录服务和供应商解决方案将音频数据转换为转录本以供分析的过程。

总之,Yuyu Fan 的研究展示了 NLP 和机器学习技术在分析财报电话会议记录方面的力量。情绪分析、会计分析和可读性评分的应用,以及 BERT 等高级模型的使用,可以生成高效的交易策略。正如 Alliance Bernstein 的投资团队所推荐的那样,情境驱动的方法优于单纯的方法,而且情绪信号被证明是有价值的,特别是对于美国小型公司而言。

  • 00:00:00 Yuyu Fan 谈到使用自然语言处理 (NLP) 分析财务电话会议记录。公司使用财报电话会议与投资界分享财务和商业信息,分析师通常分析成绩单以寻找可能影响公司业绩和股价的信息。然而,手动分析大量公司的成绩单是一项劳动密集型工作,这正是 NLP 和机器学习技术的用武之地。这些技术已被证明在分析财务文件和制定有效交易策略方面非常有效。 Yuyu Fan 的研究超越了对美国大盘股的典型测试,涵盖了不同的宇宙大盘股,包括美国小盘股和新兴市场。此外,分析是对单个部分以及成绩单的组合部分进行的,系统比较表明上下文驱动方法优于背景词朴素方法。

  • 00:05:00 Yuyu Fan 讨论了用于文本挖掘分析的数据,并解释了财报电话会议记录的结构,该结构由两部分组成 - 演示和问答部分。他们在每个单独的部分以及组合的部分上生成了 NLP 特征。生成的三类 NLP 特征是情感、会计和可读性分数。他们还为他们的分析提供了一种简单的回溯测试方法。情感特征进一步分为两类,一类基于字典,另一类基于上下文。

  • 00:10:00 来自 Alliance Bernstein 的 Yuyu Fan 解释了他们如何使用文本挖掘来筛选生成的 200 多个特征,以找到稳健且表现良好的投资信号。他们不仅考虑数据挖掘,还考虑基本面分析和经济直觉,以及先前的研究。他们按特征值对组件进行排名,并跟踪每个分位数的月度回报以评估性能。第一类是简单的字数统计,其中一个特征是分析师问题字数统计,除了新兴市场有不同的行为外,它的表现通常与他们之前的预期一致。他们使用年化回报率和壁垒等基本指标评估业绩,发现这个信号还可以,但不是很好。

  • 00:15:00 演讲者解释了可读性分数的概念以及她的团队如何使用它们来分析 CEO 评论。可读性分数是一种指标,用于衡量阅读和理解文本的难度,同时考虑到困难单词的数量和句子长度。分数越高表示文本越难理解,分数越低表示文本越容易理解。 Fan 的团队使用一个名为“text stats”的开源 Python 包来计算 CEO 评论的可读性分数,假设更容易理解的评论更有可能带来公司透明和良好的绩效。然后,该团队使用分位数筛选来评估不同的特征,并将表现最佳的特征推荐给投资团队。

  • 00:20:00 Alliance Bernstein 的 Yuyu Fan 讨论了如何使用情绪分析从 CEO 演讲记录中提取见解。 Fan 解释说,可以使用基于字典的方法来计算情绪分数,例如使用专门为金融研究设计的通用或专有字典。结果表明,基于 LM 词典的情绪分析携带了更多的投资信号,尤其是对美国小盘股公司。使用每月重新平衡,公司按行业中性五分位数排名。使用情绪分析时,每个五分位数的结果更加可区分,表明更高的情绪会带来更好的表现。

  • 00:25:00 来自 Alliance Bernstein 的 Yuyu Fan 解释了他们的团队如何利用文本挖掘来提取见解和评估演讲者的情绪。他们分析了 CEO 情绪和分析师情绪之间的差异,发现分析师情绪可能是一个更可靠的指标,因为 CEO 可能会扭曲分析结果对他们讲话的影响。他们还深入研究了自然语言理解,特别是利用了称为 BERT 的 Transformer 模型。 BERT 利用双向编码器表示,这意味着它会考虑左右两侧的周围信息,以更好地预测特定单词在其上下文中的含义。

  • 00:30:00 Yuyu Fan 解释了 BERT(来自变形金刚的双向编码器表示)模型如何用于情感分析。模型的编码器部分用于横向语言理解(不需要翻译的语言理解)。来自模型这一部分的嵌入可以表示来自整个句子的信息,并且可以进行微调以创建情感分类模型。通过使用预训练的 BERT 模型并添加下游情感分类任务,微调变得更加容易。通过自标注添加情感标签,通过外部数据集给定标签,训练模型预测-1到1范围内的情感分数。最后,Fan表明基于BERT的情感分析优于基于字典的情感分析以收益电话会议记录为例的情绪分析。

  • 00:35:00 来自 Alliance Bernstein 的 Yuyu Fan 讨论了文本挖掘以及如何使用特定的标签句子对预训练的 BERT 模型进行微调以改进金融文本的分类。预训练模型对英语标记的大量词汇覆盖允许捕获组合和生成单词,但它可能无法捕获特定的金融语言。当被问及正面和负面词的句子表现时,Yuyu Fan 解释说,分类可能取决于分析师的解释和预期,但如果句子本身报告收入增加 10%,则可以归类为正面。

  • 00:40:00 来自 Alliance Bernstein 的 Yuyu Fan 解释说,情绪分析的准确性很难有一个硬性阈值。虽然它在学术界可能会产生很大差异,但在实际应用中,它可能不会产生太大差异,因为当使用均值或标准差聚合到部分级别时,90% 的准确度和 92% 的准确度可能会导致相似的性能。 Fan 解释说,他们的模型对所有句子的准确率都在 90% 左右,而且他们的情绪信号在美国小型公司中表现良好,这使其成为他们的投资团队推荐使用的信号。 Fan 还分享说,他们发表了一篇论文,详细介绍了 NLP 功能,这些功能可以用作量化信号以形成有效的交易策略,他们目前正在研究数据扩充以改进模型。

  • 00:45:00 Alliance Bernstein 的数据科学家 Yuyu Fan 讨论了他们的 NLP 特征如何与传统的基本特征和定量特征相关联。他们发现相关性通常很低,可读性和情绪账户与大盘股动量的中等相关性约为 0.54。她还解释了他们如何使用税收统计等包来衡量可读性,并针对它们的使用进行定制。 Fan 进一步阐明了他们的回报方法,他们跟踪一个月的回报,并且只包括在重新平衡日之前提供最新信息的公司,通常是在大盘股的季度收益要求之后。最后,她解决了一个关于 CO2 套利的问题,并阐明了他们在方法中使用的 BERT 和 FinBERT 之间的区别。

  • 00:50:00 Yuyu Fan 讨论了使用文本挖掘来提取见解。她提到了 BERT 模型的金融使用模型的开发,特别关注与金融相关的备案、收益和新闻。该模型区分预训练版本和微调版本,并带有正、负和中性输出概率的标签。 Fan 指出,模型的准确性因不同行业而异,他们正在探索数据增强的途径,以改进特定主题的情感分类。本节最后讨论了将音频数据转换为转录本以供分析的过程。

  • 00:55:00 来自 Alliance Bernstein 的 Yuyu Fan 讨论了使用文本挖掘来提取见解。该公司使用 SMT 获取高质量的供应商数据,并使用转录服务和供应商解决方案进行协作。他们还在试验一种来自 Open AI 的名为 Whisper 的模型,该模型使用大规模转换器模型进行音频转录,包括多语言转录。但由于时间关系,问答环节到此结束。
Yuyu Fan (Alliance Bernstein): "Leveraging Text Mining to Extract Insights"
Yuyu Fan (Alliance Bernstein): "Leveraging Text Mining to Extract Insights"
  • 2022.10.26
  • www.youtube.com
Welcome to the first of the UBS and CFEM AI, Data and Analytics Speaker Series!Yuyu Fan of Alliance Bernstein spoke about "Leveraging Text Mining to Extract ...
 

Ciamac Moallemi(哥伦比亚):“流动性供应和自动做市”



Ciamac Moallemi(哥伦比亚):“流动性供应和自动做市”

在这次全面的讨论中,哥伦比亚大学教授 Ciamac Moallemi 从多个角度深入探讨了流动性提供和自动做市 (AMM) 的复杂性。他强调了 AMM 在解决区块链平台面临的计算和存储挑战方面的相关性,以及它们为流动性提供者产生积极回报的能力。为了说明这个概念,Moallemi 提出了 UniSwap V2 中波动性的逆向选择成本,揭示了 1.25 亿美元资金池的年成本约为 39,000 美元。他强调了波动性和交易量在确定流动性提供者回报方面的重要性,并阐明了 AMM 如何处理套利者和知情交易者。

Moallemi 强调了在区块链上使用 AMM 的优势,并探讨了合并价值函数和绑定函数的作用。他强调了对冲与再平衡策略相关的风险和成本的重要性。此外,Moallemi 介绍了他自己的流动性供应和自动做市模型,并将其与以太坊区块链的实际数据进行了比较。他讨论了他的模型如何通过降低支付给中介机构的成本来潜在地增强 AMM。 Moallemi 提出了各种方法来减轻由次优价格引起的低效率,例如利用预言机作为数据源并将套利权出售给授权参与者,使他们能够免费与矿池进行交易。

此外,Moallemi 阐明了 AMM 相对于传统限价订单簿的优势,特别是在简单性和可访问性方面。他强调了 AMM 如何通过消除对复杂算法和大量资源的需求,为不太成熟的参与者创造公平的竞争环境。 Moallemi 最后表达了对更好结构的潜力的乐观态度,这种结构有利于更广泛的参与者,将 AMM 定位为朝着正确方向迈出的一步。

  • 00:00:00 在本节中,哥伦比亚大学的 Ciamac Moallemi 讨论了流动性提供和自动化做市商,主要关注加密世界中的自动化做市商。他解释说,交易问题在很大程度上由传统金融中的电子限价订单簿解决,但在加密货币中大量采用这种结构存在几个问题。 Moallemi 讨论了使用区块链进行交易的计算和存储成本,以及自动化做市商如何通过使用定价算法为资产提供买卖价格报价来解决这些问题,从而为市场提供流动性。

  • 00:05:00 在本节中,演讲者讨论了在更新率高且计算和存储有限的环境中使用限价订单簿进行交易的挑战。做市需要活跃的做市商的参与,并且在加密货币世界中很难引导,特别是对于新代币。为了应对这些挑战,人们开发了自动化做市商(AMM),它使用流动性提供者将 ETH 和美元等资产池放入一个池中。这些 AMM 的计算效率很高,不需要排序或比较,因此非常适合区块链环境。流动性提供者因在池中进行交易而获得费用,价格根据池中的内容而定。

  • 00:10:00 在本节中,Ciamac Moallemi 从流动性提供者的角度讨论了流动性提供和自动做市 (AMM),概述了使用 UniSwap 等 AMM 系统的成本和收益。 Moallemi 解释说,虽然被动流动性提供者可以通过 AMM 系统赚取费用,但做市总是有成本的,例如逆向选择。 Moallemi 使用 UniSwap V2 的具体示例表明,波动性的逆向选择成本通常为三个基点,导致价值 1.25 亿美元的资金池的年化成本约为 39k。尽管有成本,Moallemi 指出 AMM 系统可以为流动性提供者带来积极的回报,但准确评估所涉及的风险和成本至关重要。

  • 00:15:00 在本节中,哥伦比亚大学的 Ciamac Moallemi 讨论了流动性供应和自动做市。 Moallemi 强调了流动性提供者回报背后的驱动因素,特别是波动性和交易量的重要性。他还描述了 LP 回报分解的粗略计算,其中包括对冲回报、交易费用和杠杆成本。 Moallemi 解释说,杠杆成本是一种逆向选择成本,其原因是价格在中心化交易所设定,而 AMM 以不准确的价格进行交易,从而导致滑点。这导致套利机会,套利者从池中获利,从而导致零和博弈。还讨论了知情交易者和套利者之间的区别。

  • 00:20:00 在本节中,Ciamac Moallemi 使用经典的逆向选择模型讨论了衡量知情交易的困难以及波动性是如何产生的。他还谈到了期权定价解释以及使用封闭论坛公式在连续时间内工作的便利性。 Moallemi 提到了做市商领域的其他热门话题,例如预测市场和自动化做市商。然后他解释了区块链如何作为一台计算机工作,跟踪交易和支付,而以太坊是该系统的一个更复杂和昂贵的版本。尽管速度缓慢且成本高昂,但区块链仍然是交易和预测市场的重要组成部分。

  • 00:25:00 在本节中,Ciamac Moallemi 讨论了金融在使用慢速计算机方面的重要性,尤其是在需要小额交易或简单计算任务的场景中。他展示了一张图表,反映了以太坊系统在金融相关应用程序上花费的资源百分比,交易是最大的子类别,而 Uniswap 是最重要的协议或智能合约。尽管大多数加密交易发生在交易所,但像 Uniswap 这样的去中心化交易所也很重要,交易总额约为 1 万亿美元。 Moallemi 提出了一个具有随机波动率的连续时间 Black-Scholes 设置作为交易两种资产的模型,一种是用“x”表示的风险资产,另一种是称为“y”的无风险资产,市场价格是价格风险资产的分子。

  • 00:30:00 在视频的这一部分,Ciamac Moallemi 解释了金融行业流动性供应和自动化做市的概念,以及它们的工作原理。他谈到了这个过程的回报是如何随机游走的,以及这个概念是如何在金融领域成为一个非常标准的模型。然后,他继续解释了自动做市商作为恒定函数做市商的概念,其中函数通过绑定函数保持不变。流动性提供者提供准备金,交易者只能移动到曲线上的另一个点,从而保持函数不变。对角线的斜率给出了瞬时价格。该机制知道它有什么库存以满足不变量并对交易说是或否。

  • 00:35:00 在本节中,Ciamac Moallemi 讨论了在区块链上使用自动做市 (AMM) 相对于 Binance 等传统交易所的优势。在区块链上允许不同的服务,例如抵押贷款或投资组合优化,这在传统交易所是不可能的。此外,区块链上的交易可以是计算机程序的子程序,这是传统交易所不具备的功能。虽然 AMM 的费用与数量成正比,但流动性提供者的水平会随时间变化,从而影响费用分配。市场模型涉及两类交易者:持续监控中心化交易所和外部市场的套利者,以及从区块链上获得效用的噪声交易者。该分析假设恒定的流动性提供者、现金支付费用,并忽略区块链中的离散时间与连续时间。

  • 00:40:00 在本节中,Ciamac Moallemi 解释了流动性供应和自动做市的概念。他以用 x 换 y 为例,最慢的部分是它可以交易的速度。他描述了如何通过转移到支持超平面的价格的双变量来更好地描述问题。他解释说,池值函数是一个关键对象,并假设该函数是平滑的并且是两次连续可微的。 Moallemi 还讨论了常数乘积情况和绑定函数的属性,套利者被激励去平衡它们。套利者不断地监视市场,在池中留下最少的价值以赚取最多的钱。

  • 00:45:00 在本节中,哥伦比亚大学的 Ciamac Moallemi 讨论了流动性供应和自动做市所需的关键要素,包括再平衡策略和套利的使用。再平衡策略涉及以与套利者相同的方式买卖风险资产,但在中心化交易所进行交易以获得公平的市场价格。杠杆损失与再平衡定理将该过程描述为非负、非递减和可预测的,表明与交易所交易相比,池准备金价值系统性地亏损。这些关键要素对于有效的流动性供应和做市非常重要。

  • 00:50:00 在本节中,Ciamac Moallemi 讨论了与再平衡策略相关的风险和成本,以及如何对冲这些风险和成本。他解释说,投资组合价值的瞬时变化有两个组成部分:第一个组成部分是市场风险,这意味着它暴露在市场中,而第二个组成部分是局部无风险和可预测的,但它有系统的运行成本。 Moallemi 进一步分解了瞬时杠杆的公式,以及它如何受到瞬时方差和当前价格水平下可用流动性的影响。他还演示了如何将该公式应用于恒定乘积做市商。

  • 00:55:00 在本节中,Moallemi 解释说,矿池的价值永远不会归零,但它的价值可能会低于替代方案。随着时间的推移,再平衡策略可能会系统地赚钱,因为它在价格上涨时卖出,在价格下跌时买入。此外,Moallemi 讨论了模型的假设,指出对于流动性最强的池来说,假设外部市场是合理的,但对于长尾来说,这不是一个好的假设。但是,该模型作为预测模型仍然有用,并提供一致的定价。 Moallemi 然后解释了一种使用该模型作为预测模型的方法,查看 LP 收取的费用和池值的变化,并通过负再平衡金融交易来对冲市场风险。

  • 01:00:00 在本节中,哥伦比亚大学的 Ciamac Moallemi 讨论了他的流动性供应和自动做市模型的实证结果。他将使用他的公式得出的对冲损益 (P&L) 与以太坊区块链的实际数据进行了比较,发现它们很接近,表明他的模型是正确的。然后,他查看了一个包含 2 亿美元代币的示例 Uniswap 池的每日波动率和损益波动。损益波动是由市场风险引起的,Moallemi 证明可以使用他的公式对其进行对冲,从而获得正回报和高夏普比率,尽管由于交易和融资成本,这不一定是一种赚钱策略。他建议,该工具可用于通过降低支付给中介机构的成本来改进自动化做市商。

  • 01:05:00 在本节中,Ciamac Moallemi 讨论了减轻流动性供应和自动做市中因价格不佳而导致的低效率的方法。他建议使用预言机作为数据源,从币安等交易所获取价格,将外部价格纳入智能合约并防止场外交易。此外,Moallemi 提出了向授权参与者出售套利权的想法,他们可以在不支付费用的情况下与池进行交易,让他们优先利用较小的价格差异并赚钱。这些参与者会将他们的部分利润返还给 LPS,以帮助缓解不良价格并确保 LP 和噪声交易者都能从该策略中受益。 Moallemi 还解决了有关实施 AMM 以在 Binance 上进行交易和在加密市场做空的问题。他指出,由于融资成本,做空可能代价高昂,而且交易量和波动率高度相关,这可能使做多交易量但做空波动率的策略存在风险。

  • 01:10:00 在本节中,Moallemi 解释了智能合约中请求报价 (RFQ) 协议的问题,因为它需要等待其他人响应,这打破了智能合约的原子性。然而,一种流行的间接替代方案,称为即时流动性,可用于在大订单被处理之前预先运行并为其提供流动性。 Moallemi 还解释了传统做市商如何对冲风险并在卖出前短期持有股票,而流动性提供者也应该对冲以管理市场风险。流动资金池模型在加密货币中效果最好,因为它们的计算机速度较慢且可用的硬币数量很多。

  • 01:15:00 在本节中,演讲者讨论了自动做市商 (AMM) 相对于限价订单簿的优势,特别是在简单性和可访问性方面。他们解释说,限价订单簿的复杂性使做市商甚至交易员在没有算法和 PHD 大军的情况下难以使用,从而为也使用算法的机构投资者创造了更公平的竞争环境。但是,AMM 简化了流程,使普通参与者无需大量知识或资源即可受益。演讲者看到了更好的结构有利于不太成熟的参与者的潜力,使 AMM 朝着正确的方向迈出了一步。
Ciamac Moallemi (Columbia): "Liquidity Provision and Automated Market Making"
Ciamac Moallemi (Columbia): "Liquidity Provision and Automated Market Making"
  • 2022.09.14
  • www.youtube.com
Abstract: In recent years, automated market makers (AMMs) and, more specifically, constant function market makers (CFMMs) such as Uniswap, have emerged as t...
 

Andreea Minca (Cornell ORIE):聚类异构金融网络



Andreea Minca (Cornell ORIE):聚类异构金融网络

Andreea Minca 教授是 Cornell ORIE 金融网络领域的著名专家,她的研究致力于探索集群异构金融网络的复杂性。她引入了一个创新的正则化术语来应对这些网络带来的独特挑战,尤其是存在具有任意连接模式的异常值。这些异常值阻碍了谱聚类算法的性能,并将聚类转化为一个计算上具有挑战性的问题,称为 NP-hard 组合问题。

为了根据它们的连接模式识别这些异常值,Minca 使用随机块模型和度校正随机块模型。这些模型为精确恢复提供了理论保证,无需对异常节点做出假设,除了知道它们的数量。金融网络固有的异质性进一步复杂化了仅基于节点度的异常值检测。

Minca 通过构建分区矩阵和节点排列,深入研究了将网络划分为集群和异常值的过程。她通过将其应用于分析韩国银行系统来举例说明这种方法。此外,Minca 使用 Gibbs 采样器来填补网络中的空白,通过根据重叠投资组合的强度和重叠程度对重叠投资组合进行聚类,从而实现有效的风险分配和投资多样化。

在她的工作中,Minca 强调了生成具有有意义的互连性的集群而不是没有连接性的集群的重要性。她提出了一种方法,在集群风险平价框架下提供五种多样化选择,强调在使用集群算法实现金融网络多样化时需要仔细考虑。 Minca 建议使用标准投资类别量化聚类算法的性能,并强调在使用这些技术时做出明智决策的重要性。

总的来说,Andreea Minca 教授的研究为异构金融网络集群的复杂性提供了宝贵的见解,提供了创新的方法和实用的解决方案来应对与这些网络相关的挑战。她的工作有助于推进风险分析、投资组合选择和理解金融系统的结构动态。

  • 00:00:00 Andreea Minca 教授基于两个不同的例子讨论了她在开发算法以聚集金融网络方面的工作。第一个例子是关于重叠投资组合网络及其在投资组合选择中的应用,第二个例子是关于风险敞口网络,这与系统风险分析和了解网络中的风险水平有关。目标是将聚类算法与金融网络相匹配,并创建有意义的集群,这些集群容易受到一个机构流动性不足或违约的影响。集群越大,压力对该集群成员的潜在影响就越大,这凸显了理解金融网络结构的重要性。

  • 00:05:00 Andreea Minca 讨论了集群金融网络的挑战,这在所有现实世界的网络中都很常见。存在聚类问题是因为节点倾向于形成组内连接性大于组间连接性的组。聚类算法多种多样,但金融网络的异质性带来了挑战,因为金融网络在度、权重和不同的社区间连接方面表现出异质性。此外,异常值的存在使得应用现成算法具有挑战性,因为它们可能具有与内联节点相同的连接模式,但它们本身不能被视为一个集群。有几个问题影响金融网络的聚类,使得现有算法难以应用。

  • 00:10:00 来自 Cornell ORIE 的 Andreea Minca 讨论了聚类异构金融网络时面临的挑战,以及引入新的正则化项来克服这些挑战。主要挑战之一是存在具有任意连接模式并表现为对手的异常值,这阻碍了聚类算法(如谱聚类)的性能。聚类问题本身是一个 NP-hard 组合问题,对于具有易处理算法的半定程序可以放宽。目标是证明某些条件适用于恢复真正的集群,并且引入的正则化项会惩罚具有异常连接模式的异常值。

  • 00:15:00 Andreea Minca 讨论了随机块模型和度校正随机块模型在异构金融网络中检测聚类模式的应用。目标是根据异常值的连接模式检测异常值。提供的理论保证确保准确恢复,而无需对异常节点做出假设,除了知道它们的数量。密度间隙条件基于簇间和簇内边缘密度之间的差异。结果比以前的文献更稳健,因为它们独立于离群值的数量,并且仅取决于离群值的数量。金融网络中的异质性使得很难基于度来检测异常值,因为由于同一集群中节点的结构,节点可能具有很高的度。

  • 00:20:00 Andreea Minca 解释了金融网络中异质性的概念及其对聚类算法的影响。她以韩国银行系统为例,说明同一行业的银行和保险公司如何表现出异质性,不应被归类为异常值。 Minca 指出,金融网络中的重尾度分布需要仔细查看连接模式和对每个节点度范围边界的贡献。她还强调了算法中需要考虑程度的惩罚项,因为不能对所有节点使用同质惩罚。最后,Minca 概述了聚类模型的基础知识,其中包括为每个聚类指定异质性参数和连接矩阵。

  • 00:25:00 Andreea Minca 讨论了在使用现成的聚类方法时在存在异常值的情况下进行聚类的挑战。检测异常值的目的是在不妨碍聚类本身或错误地妨碍层内笔记分类的情况下发出红色警报。通过异质性参数调整连通性,可以将邻接矩阵写成与第一个异常值的邻接矩阵相对应的方式,以找到从观察到的图片映射到簇和异常值的底层结构的置换矩阵。这些调整有助于适应金融网络中的大量建模选择。

  • 00:30:00 在视频的这一部分,Andreea Minca 解释了寻找分区矩阵和节点排列以识别金融网络中集群和异常值结构的过程。该算法基于找到一个分区矩阵,该矩阵指示哪些节点属于同一集群,而任意条目表示异常值。为了说明这个概念,Minca 展示了一个韩国金融网络的示例,其中算法的目标是确定网络中存在的每个部门的正确标识。

  • 00:35:00 康奈尔大学 ORIE 教授 Andreea Minca 讨论了她在创建半合成网络和测试算法方面的工作。她解释说,她根据韩国银行发布的有关所有金融机构资产和负债规模的数据创建了一个网络,并根据从任何保险公司到任何银行的总流量将它们连接起来。然后,她使用模块化最大化算法根据观察到的连接模式识别哪些金融机构属于哪个部门。该算法还引入了调整参数和分区矩阵约束以最小化模块化差异。

  • 00:40:00 Andreea Minca 解释了在聚类异构金融网络中搜索分区矩阵的挑战,由于特定的约束,这是一个棘手的问题。为了克服这个问题,在矩阵的条目介于 0 和 1 之间并且是正半定的情况下引入了问题的松弛。问题的异质性通过惩罚项解决,其中对角项的惩罚惩罚程度超出正常变化的潜在异常值。两个调整参数控制对角线惩罚的强度,并由节点的观察程度决定,允许识别异常值和具有强大社区成员资格的节点。视频中使用的韩国行业示例是韩国网络曝光的快照,没有时间序列成分。

  • 00:45:00 来自 Cornell ORIE 的 Andreea Minca 讨论了异构金融网络的聚类,以及如何通过使用 Gibbs 采样器来填补空白来重新创建与聚合值一致的样本网络。算法的性能可以通过误分类率和恢复概率来测试,随着样本量变大,误分类率和恢复概率以一定的速度趋于1。 Minca 以韩国行业为例,演示了连接矩阵如何表示不同行业之间连接的概率,以及如何从矩阵中获得聚类结果。

  • 00:50:00 Andreea Minca 讨论了根据其连接模式为网络中的每个机构识别正确金融部门的挑战。她解释说,算法必须对连通性的异质性具有鲁棒性,并且错误分类率被用作性能标准。 Minca 比较了她提出的算法和其他现有算法的误分类率,强调基于谱聚类的算法表现最差。这强调了调整现有算法以解决金融网络遇到的问题的必要性。此外,Minca 简要介绍了该算法在投资组合管理中的应用。通过重建重叠投资组合网络,可以根据机构持有的投资组合来衡量机构的互动强度,这可能有助于投资决策。

  • 00:55:00 Andreea Minca 讨论了聚类算法以及如何将其应用于重叠的金融投资组合以有效分配风险和分散投资。通过根据投资组合的强度和重叠程度对投资组合进行聚类,该算法能够恢复五个在过去十年中变大的聚类,表明重叠增加。这提供了一种用于生成比其他现有聚类方法更有效的聚类的工具。此外,Minca 还讨论了额外的算法如何填补韩国示例的空白,并创建与政府汇总数据一致的个人网络。

  • 01:00:00 Andreea Minca 讨论了通过金融网络的聚类算法实现多样化的问题。她表明,拥有一个具有极高集群间连接性的集群和另一个没有连接性的集群不会实现多样化。相反,她提出了一种方法,该方法在集群风险平价方法下确定了五种多样化的选择。她还回答了关于她的工作的预印本、工具的可用性以及算法对聚类数量的敏感性的问题,同时还建议使用标准投资类别来量化聚类算法的性能。

  • 01:05:00 Andreea Minca 以从五个投资策略中恢复五个集群为例,讨论了聚类算法和集群恢复的主题。她还指出,如果没有良好的领域知识或对聚类数量的假设,可能很难比较不同选择的聚类结果。然而,在这个问题上没有理论结果,这凸显了在使用聚类算法时做出明智决策的重要性。
Andreea Minca (Cornell ORIE): Clustering Heterogeneous Financial Networks
Andreea Minca (Cornell ORIE): Clustering Heterogeneous Financial Networks
  • 2022.04.27
  • www.youtube.com
Abstract: For the degree corrected stochastic block model in the presence of arbitrary or even adversarial outliers, we develop a convex-optimization-based c...