Ernest Chan 博士解释了传统投资组合优化方法在制度变化的情况下所面临的挑战,并强调了机器学习在解决这一问题中的作用。他讨论了机器学习技术的应用、时间序列特征的重要性以及排名在实现最佳投资组合优化方面的重要性。他分享了具体结果和客户成功案例,强调了机器学习模型对不断变化的市场条件的适应性。 Chan 还提供了使用机器学习算法计算回报的见解,并阐明了他们的集成方法和独特的方法。
Abstract: Conditional Portfolio Optimization is a portfolio optimization technique that adapts to market regimes via machine learning. Traditional portfolio...
QUANTT and QMIND came together to offer a unique experience for those interested in Financial Machine Learning (ML). Unifying these two clubs is Dr. Ernest C...
00:00:00 Thomas Stark 博士介绍了交易的深度强化学习,这是他多年来一直感兴趣的话题。强化学习 (RL) 是一种允许机器在没有监督的情况下解决任务的技术,它会自行学习如何做才能产生有利的结果。他解释了一台想要学习如何玩电脑游戏的机器如何从游戏场景开始,然后从一个步骤移动到下一个步骤,同时响应它在屏幕上看到的内容。最后,游戏结束,机器根据其做出的决策链决定成败。
00:05:00 Thomas Starke 博士讨论了使用深度强化学习进行交易并解释了马尔可夫决策过程的概念。在这个过程中,一个状态与一个特定的市场参数相关联,一个动作将过程从一个状态转换到下一个状态。根据转换,代理会收到正奖励或负奖励。目标是在给定特定策略和状态的情况下最大化预期奖励。在交易中,市场参数用于识别代理所处的状态,并帮助其决定采取何种行动。
00:10:00 Thomas Starke 博士讨论了交易中涉及的决策过程,其中涉及根据告知系统状态的各种指标来决定是买入、卖出还是持有。目标是获得最好的回报,即交易的盈利或亏损。然而,如果交易在不久的将来对我们不利,传统的机器学习方法会给一个状态一个特定的标签,比如即时利润或亏损,可能会导致标签不正确。因此,机器必须知道什么时候留在交易中,即使它最初对我们不利,并且有信心等到交易恢复到平均线退出交易。
00:15:00 Thomas Starke 博士讨论了追溯标记以及它如何用于强化学习以解决标记交易损益中每一步的困难。他解释说,传统的机器学习会给交易中的每一步都贴上标签,因此很难预测如果交易出现亏损,未来是否会盈利。追溯标签使用贝尔曼方程为每个动作和状态分配一个非零值,即使它不会产生即时利润,也允许回归到均值和最终利润。
00:20:00 Thomas Starke 博士解释了如何使用强化学习来解决交易中的延迟满足问题。贝尔曼方程用于计算一个动作的奖励,“r”代表即时奖励,“q”代表累积奖励。 Gamma 是一个贴现因子,与以前的结果相比,它为未来的结果分配权重。通过使用强化学习,交易决策不仅基于即时回报,还基于持有头寸以获得更高的未来回报。与贪婪的决策相比,这允许做出更明智的决策。
00:25:00 Thomas Starke 博士讨论深度强化学习如何帮助根据未来结果做出交易决策。传统的强化学习涉及根据过去的经验构建表格,但在交易中,由于大量的状态和影响,这变得复杂。因此,解决方案是使用深度强化学习和神经网络来近似这些表,而无需创建庞大的表。他解释了使用交易游戏化并找到正确的奖励函数和输入来定义状态的实现。总的来说,深度强化学习的使用有助于交易决策。
00:40:00 根据 Thomas Starke 博士的说法,我们有很多选择,包括高开低收盘价和成交量值、烛台形态、技术指标,例如相对强弱指数、一天/一周/一年的时间、不同的时间粒度、输入其他工具的价格和技术指标,以及情绪或卫星图像等替代数据。然后将这些输入构造成一个复杂的状态,类似于计算机游戏如何使用输入特征来做出决定。最终,关键是找到适合您的交易风格的正确奖励函数,并相应地优化您的系统。
00:45:00 Thomas Starke 博士解释了他的强化学习者在用于金融市场交易之前必须经历的测试阶段。他应用了一系列测试,包括干净的正弦波、趋势曲线、无结构的随机序列、不同类型的顺序相关性、干净测试曲线中的噪声和重复模式,以确定机器是否持续获利并找出编码中的缺陷.他还讨论了他使用的不同类型的神经网络,包括标准、卷积和长短期记忆 (LSTM),以及他对简单神经网络的偏好,因为它们足以满足他的需求并且不需要过多的计算工作。
01:00:00 Thomas Starke 博士回答了与深度强化学习交易相关的各种问题。他解释说,贝尔曼方程没有引入前瞻性偏差,技术指标有时可以在仔细分析后作为输入。卫星图像可用于预测股票价格,并且可以根据神经网络计算时间在较小的时间范围内进行强化交易。他还讨论了强化交易算法对市场异常的敏感程度,并解释了为什么使用强化学习训练随机决策树没有意义。
Dr. Thomas Starke Speaks on Machine Learning Trading with Deep Reinforcement Learning (DRL). In this captivating video, join Dr. Thomas Starke as he unravels...
00:35:00 在本节中,讨论了算法学习方程逼近算法演化的必要条件。对于这种情况,遍历性的状态过程条件立即得到满足,因为只有一个状态。学习算法的轨迹在大学习率和小学习率下都被模拟,这表明算法学习方程的近似在小学习率下是好的。 ALE 也可用于分析获得共谋结果的概率,其中有一个大的吸引盆地导致这样的结果。在视频的下一部分中,每个代理人都可以根据前一时期对手的价差调整自己的价差。
Abstract: Recently there has been concern among regulators and legal theorists about the possibility that pricing algorithms can learn to collude with one a...
当被问及自动做市商获得私人信息的潜在不公平优势时,Aldridge 承认这会带来问题。然而,她建议货比三家并量化不同平台的自动做市曲线可以帮助缓解这个问题。她指出,矿工受到激励继续他们的工作,因为他们是从访问和验证订单块中受益的人。然而,除非有私人激励,否则在这个领域产生利润越来越具有挑战性,从而导致寡头垄断的形成。奥尔德里奇提议,保险可以作为矿工几乎免费工作的自然激励。然而,保险公司将区块链视为对其行业的主要威胁,从而抵制此类系统设计。她还谈到了欺诈计划的可能性,强调了 IBM 曲线中的潜在操纵。
Abstract: Assets on blockchain trade 24x7 with very thin liquidity. This demands new fully automated processes, including Automated Market Making (AMM). We d...
Abstract: Blockchain users who submit transactions through private pools are guaranteed pre-trade privacy but face execution risk. We argue that private poo...
00:15:00 Kevin Webster 博士讨论了三种计量经济学测试方法,强调了因果推理的重要性,并解释了它如何在科技行业,特别是机器学习社区中得到积极应用。他进一步强调了这些企业如何利用因果机器学习来使他们的团队能够根据基本事实快速调整,避免重新调查令人惊讶的发现,避免重新运行错误的实验,并防止对关键决策进行事后猜测。韦伯斯特博士的方法结合了因果检验和计量经济学检验,可以根据少五倍的数据做出更准确的预测。
00:45:00 Kevin Webster 博士简要讨论了迁移学习和因果正则化之间的关系。他指出,两者之间存在类比,因为两者都涉及在一个数据集上训练模型并希望它在另一个数据集上运行良好。虽然迁移学习缺乏因果解释,但由于交叉验证,迁移学习的证明有效,这也适用于因果正则化。尽管在数学上存在相似性,但韦伯斯特博士断言,该方法的因果解释非常新颖。
Abstract: Causal regularization solves several practical problems in live trading applications: estimating price impact when alpha is unknown and estimating...
最后,Fan 谈到了 CO2 套利、BERT 和 FinBERT 之间的区别以及专为金融相关文件、收益和新闻量身定制的 BERT 金融使用模型的开发等主题。还提到了使用转录服务和供应商解决方案将音频数据转换为转录本以供分析的过程。
总之,Yuyu Fan 的研究展示了 NLP 和机器学习技术在分析财报电话会议记录方面的力量。情绪分析、会计分析和可读性评分的应用,以及 BERT 等高级模型的使用,可以生成高效的交易策略。正如 Alliance Bernstein 的投资团队所推荐的那样,情境驱动的方法优于单纯的方法,而且情绪信号被证明是有价值的,特别是对于美国小型公司而言。
00:00:00 Yuyu Fan 谈到使用自然语言处理 (NLP) 分析财务电话会议记录。公司使用财报电话会议与投资界分享财务和商业信息,分析师通常分析成绩单以寻找可能影响公司业绩和股价的信息。然而,手动分析大量公司的成绩单是一项劳动密集型工作,这正是 NLP 和机器学习技术的用武之地。这些技术已被证明在分析财务文件和制定有效交易策略方面非常有效。 Yuyu Fan 的研究超越了对美国大盘股的典型测试,涵盖了不同的宇宙大盘股,包括美国小盘股和新兴市场。此外,分析是对单个部分以及成绩单的组合部分进行的,系统比较表明上下文驱动方法优于背景词朴素方法。
00:05:00 Yuyu Fan 讨论了用于文本挖掘分析的数据,并解释了财报电话会议记录的结构,该结构由两部分组成 - 演示和问答部分。他们在每个单独的部分以及组合的部分上生成了 NLP 特征。生成的三类 NLP 特征是情感、会计和可读性分数。他们还为他们的分析提供了一种简单的回溯测试方法。情感特征进一步分为两类,一类基于字典,另一类基于上下文。
00:10:00 来自 Alliance Bernstein 的 Yuyu Fan 解释了他们如何使用文本挖掘来筛选生成的 200 多个特征,以找到稳健且表现良好的投资信号。他们不仅考虑数据挖掘,还考虑基本面分析和经济直觉,以及先前的研究。他们按特征值对组件进行排名,并跟踪每个分位数的月度回报以评估性能。第一类是简单的字数统计,其中一个特征是分析师问题字数统计,除了新兴市场有不同的行为外,它的表现通常与他们之前的预期一致。他们使用年化回报率和壁垒等基本指标评估业绩,发现这个信号还可以,但不是很好。
00:15:00 演讲者解释了可读性分数的概念以及她的团队如何使用它们来分析 CEO 评论。可读性分数是一种指标,用于衡量阅读和理解文本的难度,同时考虑到困难单词的数量和句子长度。分数越高表示文本越难理解,分数越低表示文本越容易理解。 Fan 的团队使用一个名为“text stats”的开源 Python 包来计算 CEO 评论的可读性分数,假设更容易理解的评论更有可能带来公司透明和良好的绩效。然后,该团队使用分位数筛选来评估不同的特征,并将表现最佳的特征推荐给投资团队。
00:20:00 Alliance Bernstein 的 Yuyu Fan 讨论了如何使用情绪分析从 CEO 演讲记录中提取见解。 Fan 解释说,可以使用基于字典的方法来计算情绪分数,例如使用专门为金融研究设计的通用或专有字典。结果表明,基于 LM 词典的情绪分析携带了更多的投资信号,尤其是对美国小盘股公司。使用每月重新平衡,公司按行业中性五分位数排名。使用情绪分析时,每个五分位数的结果更加可区分,表明更高的情绪会带来更好的表现。
00:25:00 来自 Alliance Bernstein 的 Yuyu Fan 解释了他们的团队如何利用文本挖掘来提取见解和评估演讲者的情绪。他们分析了 CEO 情绪和分析师情绪之间的差异,发现分析师情绪可能是一个更可靠的指标,因为 CEO 可能会扭曲分析结果对他们讲话的影响。他们还深入研究了自然语言理解,特别是利用了称为 BERT 的 Transformer 模型。 BERT 利用双向编码器表示,这意味着它会考虑左右两侧的周围信息,以更好地预测特定单词在其上下文中的含义。
00:30:00 Yuyu Fan 解释了 BERT(来自变形金刚的双向编码器表示)模型如何用于情感分析。模型的编码器部分用于横向语言理解(不需要翻译的语言理解)。来自模型这一部分的嵌入可以表示来自整个句子的信息,并且可以进行微调以创建情感分类模型。通过使用预训练的 BERT 模型并添加下游情感分类任务,微调变得更加容易。通过自标注添加情感标签,通过外部数据集给定标签,训练模型预测-1到1范围内的情感分数。最后,Fan表明基于BERT的情感分析优于基于字典的情感分析以收益电话会议记录为例的情绪分析。
00:35:00 来自 Alliance Bernstein 的 Yuyu Fan 讨论了文本挖掘以及如何使用特定的标签句子对预训练的 BERT 模型进行微调以改进金融文本的分类。预训练模型对英语标记的大量词汇覆盖允许捕获组合和生成单词,但它可能无法捕获特定的金融语言。当被问及正面和负面词的句子表现时,Yuyu Fan 解释说,分类可能取决于分析师的解释和预期,但如果句子本身报告收入增加 10%,则可以归类为正面。
00:40:00 来自 Alliance Bernstein 的 Yuyu Fan 解释说,情绪分析的准确性很难有一个硬性阈值。虽然它在学术界可能会产生很大差异,但在实际应用中,它可能不会产生太大差异,因为当使用均值或标准差聚合到部分级别时,90% 的准确度和 92% 的准确度可能会导致相似的性能。 Fan 解释说,他们的模型对所有句子的准确率都在 90% 左右,而且他们的情绪信号在美国小型公司中表现良好,这使其成为他们的投资团队推荐使用的信号。 Fan 还分享说,他们发表了一篇论文,详细介绍了 NLP 功能,这些功能可以用作量化信号以形成有效的交易策略,他们目前正在研究数据扩充以改进模型。
00:45:00 Alliance Bernstein 的数据科学家 Yuyu Fan 讨论了他们的 NLP 特征如何与传统的基本特征和定量特征相关联。他们发现相关性通常很低,可读性和情绪账户与大盘股动量的中等相关性约为 0.54。她还解释了他们如何使用税收统计等包来衡量可读性,并针对它们的使用进行定制。 Fan 进一步阐明了他们的回报方法,他们跟踪一个月的回报,并且只包括在重新平衡日之前提供最新信息的公司,通常是在大盘股的季度收益要求之后。最后,她解决了一个关于 CO2 套利的问题,并阐明了他们在方法中使用的 BERT 和 FinBERT 之间的区别。
00:50:00 Yuyu Fan 讨论了使用文本挖掘来提取见解。她提到了 BERT 模型的金融使用模型的开发,特别关注与金融相关的备案、收益和新闻。该模型区分预训练版本和微调版本,并带有正、负和中性输出概率的标签。 Fan 指出,模型的准确性因不同行业而异,他们正在探索数据增强的途径,以改进特定主题的情感分类。本节最后讨论了将音频数据转换为转录本以供分析的过程。
00:55:00 来自 Alliance Bernstein 的 Yuyu Fan 讨论了使用文本挖掘来提取见解。该公司使用 SMT 获取高质量的供应商数据,并使用转录服务和供应商解决方案进行协作。他们还在试验一种来自 Open AI 的名为 Whisper 的模型,该模型使用大规模转换器模型进行音频转录,包括多语言转录。但由于时间关系,问答环节到此结束。
Welcome to the first of the UBS and CFEM AI, Data and Analytics Speaker Series!Yuyu Fan of Alliance Bernstein spoke about "Leveraging Text Mining to Extract ...
00:40:00 在本节中,Ciamac Moallemi 解释了流动性供应和自动做市的概念。他以用 x 换 y 为例,最慢的部分是它可以交易的速度。他描述了如何通过转移到支持超平面的价格的双变量来更好地描述问题。他解释说,池值函数是一个关键对象,并假设该函数是平滑的并且是两次连续可微的。 Moallemi 还讨论了常数乘积情况和绑定函数的属性,套利者被激励去平衡它们。套利者不断地监视市场,在池中留下最少的价值以赚取最多的钱。
Abstract: In recent years, automated market makers (AMMs) and, more specifically, constant function market makers (CFMMs) such as Uniswap, have emerged as t...
Abstract: For the degree corrected stochastic block model in the presence of arbitrary or even adversarial outliers, we develop a convex-optimization-based c...
Ernest Chan (Predictnow.ai) - “如何使用机器学习进行优化”
Ernest Chan (Predictnow.ai) - “如何使用机器学习进行优化”
Predictnow.ai 的联合创始人 Ernest Chan 深入探讨了传统投资组合优化方法在应对市场状况变化时所面临的挑战。他建议机器学习可以为这个问题提供解决方案。 Chan 解释了他的团队如何将机器学习技术应用于投资组合优化,重点是整合时间序列特征来衡量各种财务方面,如波动性、价格和利率。通过将 Farmer-French 三因素模型与排名比预测更重要的理解相结合,他们旨在实现最佳投资组合优化。
Chan 继续分享了 CBO 模型性能的具体结果,并提供了使用此方法体验到投资组合性能改进的客户示例。他强调,机器学习模型具有适应体制变化的能力,使它们能够有效应对不断变化的市场条件。此外,他还讨论了如何使用利用时间序列特征的机器学习算法来计算标准普尔 500 指数及其成分股的回报。
此外,Chan 强调了他的团队在优化和推测方面采用的集成方法。他提到了他们的“秘方”,可以消除对大量计算能力的需求。他们不是遵循预测制度和以其回报分布为条件的两步过程,而是利用视觉因素直接预测投资组合的表现。此外,Chan 澄清说,通过在他们的算法中包含很大一部分训练样本,预期回报与过去的结果一致。
Ernest Chan 博士解释了传统投资组合优化方法在制度变化的情况下所面临的挑战,并强调了机器学习在解决这一问题中的作用。他讨论了机器学习技术的应用、时间序列特征的重要性以及排名在实现最佳投资组合优化方面的重要性。他分享了具体结果和客户成功案例,强调了机器学习模型对不断变化的市场条件的适应性。 Chan 还提供了使用机器学习算法计算回报的见解,并阐明了他们的集成方法和独特的方法。
金融机器学习 - Ernest Chan 博士的从业者视角
金融机器学习 - Ernest Chan 博士的从业者视角
在这段信息丰富的视频中,Ernest Chan 博士深入研究了金融机器学习领域,探讨了几个关键方面并阐明了重要的考虑因素。他强调了避免过度拟合的重要性,并提倡模型透明。此外,陈博士强调了利用非线性模型预测市场行为的好处。然而,他也讨论了机器学习在金融市场中的局限性,例如自反性和市场不断变化的动态。
陈博士强调的一个关键点是金融数据科学领域专业知识的重要性。他强调需要进行特征选择,以更好地理解影响模型结论的基本变量。通过识别这些重要的输入,投资者和交易者可以深入了解他们的损失并理解为什么做出某些决定。
陈博士还谈到了机器学习在风险管理和资本配置方面的应用。他建议寻找一个利基市场,避免与资金雄厚的组织直接竞争。通过这样做,从业者可以增加他们在这些领域取得成功的机会。
在整个视频中,陈博士强调了与不同模型和策略相关的优势和挑战。他指出,虽然传统的定量策略(例如线性模型)易于理解且不太容易过度拟合,但它们在预测变量之间存在非线性依赖性。相比之下,机器学习模型擅长处理非线性关系,但它们的复杂性和不透明性会给解释其结果和评估统计显着性带来挑战。
陈博士还讨论了使用机器学习预测金融市场的局限性。他强调,市场在不断发展,因此很难准确预测。然而,他建议机器学习可以成功地预测私人信息,例如交易策略,其中不太可能与相同的参数竞争。
此外,Chan 博士还谈到了将基础数据(包括分类数据)纳入机器学习模型。他指出,机器学习模型在处理实值数据和分类数据方面优于线性回归模型。然而,他告诫不要仅仅依赖机器学习,强调深厚的领域专业知识对于创建有效的特征和准确解释数据仍然至关重要。
在资本配置领域,陈博士强调了机器学习如何提供更复杂的预期回报,挑战将过去的表现作为未来成功的唯一指标。他还讨论了机器学习可以提供的市场理解的细微差别,概率每天都在变化,这与经典统计的静态概率分布不同。
Chan 博士最后解决了深度学习在创建需要领域专业知识的不同横截面特征方面的局限性。他分享了他对强化学习在金融模型中的适用性的看法,指出它在高频下的潜在有效性,但在较长时间范围内的局限性。
对于那些有兴趣进一步探索金融机器学习的人,Chan 博士推荐他的公司 PredictNow.ai 作为无代码金融机器学习专业知识的宝贵资源。
使用深度强化学习进行交易 |托马斯·斯塔克博士
使用深度强化学习进行交易 |托马斯·斯塔克博士
交易深度强化学习领域的专家 Thomas Starke 博士发表了富有洞察力的演讲,并与观众进行了问答环节。以下是他演讲的扩展摘要:
Starke 博士首先介绍了用于交易的深度强化学习,强调了它使机器能够在没有直接监督的情况下解决任务的能力。他用机器学习来类比玩电脑游戏,它学会根据屏幕上看到的内容做出决定,并根据其决策链决定成败。
然后,他讨论了交易中马尔可夫决策过程的概念,其中状态与市场参数相关联,而行动将过程从一种状态转变为另一种状态。目标是在给定特定策略和状态的情况下最大化预期奖励。市场参数对于帮助机器做出有关要采取的行动的明智决策至关重要。
交易中的决策过程涉及根据通知系统状态的各种指标来确定是买入、卖出还是持有。 Starke 博士强调了不要仅仅依赖每个州的即时利润或损失标签的重要性,因为它可能导致不正确的预测。相反,机器需要了解何时留在交易中,即使它最初与交易相反,等待交易在退出前恢复到平均线。
为了解决标记交易损益中每一步的困难,Starke 博士引入了追溯标记。这种方法使用贝尔曼方程为每个动作和状态分配一个非零值,即使它不会立即产生利润。这允许回归均值和最终利润的可能性。
深度强化学习可以帮助根据未来结果做出交易决策。传统的强化学习方法根据过去的经验构建表格,但在交易中,状态和影响的数量是巨大的。为了处理这种复杂性,深度强化学习利用神经网络来近似这些表格,从而无需创建庞大的表格即可实现。 Starke 博士讨论了找到正确的奖励函数和输入来定义状态的重要性,最终实现更好的交易决策。
强调了输入在交易中的重要性,强调它们需要具有预测价值。 Starke 博士强调了针对已知行为测试系统并根据所选奖励函数选择神经网络的适当类型、大小和成本函数的重要性。他解释了交易中如何采用游戏化,其中历史和当前价格、技术守卫数据和替代数据源构成状态,而奖励是交易的盈亏 (P&L)。该机器使用贝尔曼方程追溯标记观察结果,并不断更新神经网络近似的表格以改进决策。
关于强化学习训练,Starke 博士讨论了构造价格序列的不同方法,包括在不同点随机进入和退出。他还解决了设计奖励函数的挑战,并提供了示例,例如纯百分比损益、每笔报价的利润和夏普比率,以及避免长时间拖延或回撤的方法。
在交易输入方面,Starke 博士提到了许多选项,包括开盘价-高-低-收盘价和成交量值、烛台形态、技术指标(例如相对强弱指数、日/周/年时间)以及输入价格和技术指标其他工具的指标。还可以考虑替代数据源,例如情绪或卫星图像。关键是将这些输入构造成一个复杂的状态,类似于计算机游戏中如何使用输入特征来做出决定。
Starke 博士解释了强化学习器在用于交易之前必须经历的测试阶段。他概述了各种测试,包括干净的正弦波、趋势曲线、没有结构的随机序列、不同类型的顺序相关性、干净的测试曲线中的噪音和重复出现的模式。这些测试有助于确定机器是否持续产生利润并识别编码中的任何缺陷。 Starke 博士还讨论了所使用的不同类型的神经网络,例如标准、卷积和长短期记忆 (LSTM)。他表达了对更简单的神经网络的偏爱,这些神经网络可以满足他的需求,而无需过多的计算工作。
Starke 博士随后深入研究了使用强化学习进行交易的挑战。他承认很难区分信号和噪音,尤其是在嘈杂的金融时间序列中。他还强调了强化学习在适应市场行为变化方面的努力,这使得学习新行为具有挑战性。此外,他提到虽然强化学习需要大量的训练数据,但市场数据往往很少。过度拟合是另一个问题,因为强化学习倾向于作用于基本的市场模式并且很容易过度拟合。构建更复杂的神经网络可以缓解这个问题,但这是一项耗时的任务。总的来说,Starke 博士强调,强化学习并不是保证盈利结果的解决方案,拥有市场经验和特定领域的知识对于在交易中取得成功至关重要。
在问答环节,Starke 博士回答了与深度强化学习交易相关的各种问题。他澄清说,贝尔曼方程不会引入前瞻性偏差,并在仔细分析后讨论了技术指标作为输入的潜在用途。他还探讨了利用卫星图像预测股票价格的可能性,并解释说可以根据神经网络计算时间在小时间范围内进行强化交易。他警告说,强化交易算法对市场异常很敏感,并解释了为什么使用强化学习训练随机决策树不会产生有意义的结果。
Starke 博士建议使用神经网络代替决策树或支持向量机进行交易,因为它们对问题的适用性。他强调了根据使用的奖励函数调整损失函数的重要性。虽然已经尝试将强化学习应用于高频交易,但 Starke 博士强调了慢速神经网络在实时市场中缺乏响应能力的挑战。他建议有兴趣在金融行业从事交易职业的个人获取市场知识、参与实际交易并从中学习经验。最后,他讨论了结合神经网络和期权交易的挑战,认识到任务的复杂性。
总之,Thomas Starke 博士提供了有关使用深度强化学习进行交易的宝贵见解。他涵盖的主题包括交易中的决策过程、追溯标签、贝尔曼方程、输入的重要性、测试阶段以及与交易强化学习相关的挑战。通过他的演讲和问答环节,Starke 博士提供了在金融市场中利用深度强化学习的指导和实际考虑。
Harrison Waldon(德克萨斯大学奥斯汀分校):“算法学习方程式”
Harrison Waldon(德克萨斯大学奥斯汀分校):“算法学习方程式”
来自 UT Austin 的研究员 Harrison Waldon 介绍了他在金融市场算法合谋方面的工作,重点关注强化学习 (RL) 算法的交互和潜在合谋。他解决了监管机构对自主算法交易及其在没有明确沟通的情况下通过串通抬高价格的可能性的担忧。
Waldon 的研究旨在了解 RL 算法在金融环境中的行为,并确定它们是否可以学会串通。他利用算法学习方程 (ALE) 推导出常微分方程 (ODE) 系统,该系统近似于特定条件下算法的演化。这些 ALE 能够验证 Q-learning 算法中的合谋行为,并提供了算法演化的良好近似,展示了合谋结果的巨大吸引力。
然而,在计算平稳分布和区分真正的共谋与理性的自我保护行为方面存在挑战。在确定平稳分布时出现了数值上的困难,并且将真正的共谋与由自身利益驱动的行为区分开来仍然是一个挑战。
Waldon 强调了将静态博弈均衡应用于动态交互时的局限性,强调需要采用综合方法来调节行为。在各方之间没有直接通信的情况下由算法促进的串通行为需要仔细考虑。谈话结束时,沃尔登向与会者表示感谢,标志着春季学期系列的结束。
Irene Aldridge(AbleBlox 和 AbleMarkets):“加密生态系统和 AMM 设计”
Irene Aldridge(AbleBlox 和 AbleMarkets):“加密生态系统和 AMM 设计”
AbleMarkets 的创始人兼董事总经理 Irene Aldridge 深入研究了区块链技术、自动化做市 (AMM) 以及传统市场与 AMM 世界融合的各个方面。她强调了这些主题在金融领域的重要性,并探讨了与它们相关的潜在挑战和解决方案。
Aldridge 首先概述了她在金融行业的背景以及她在微观结构方面的专业知识,重点是了解市场运作。她强调了越来越多地采用自动化做市模型,这些模型最初在加密货币市场上很突出,但现在扩展到了传统市场。她概述了她的演讲结构,其中包括介绍性区块链概念、区块链在金融和编程中的应用,以及做市的真实案例研究及其对传统市场的影响。
Aldridge 探索区块链技术,将其描述为一个高级数据库,其中每一行都包含前一行的加密摘要,以确保数据完整性。她解释了区块链中涉及的挖掘过程,其中提议的内容被验证并添加到链中,从而提高文书工作和支付系统的透明度和去中心化。
Aldridge 讨论了加密生态系统向分散化的转变,强调了隐私与在服务器上拥有多个数据库副本的稳健性之间的权衡。她解释了区块链流程,从定义区块和创建加密签名到工作量证明和挖掘的核心创新,这些都确保了安全性以抵御黑客攻击。
然而,Aldridge 承认与工作量证明挖矿系统相关的挑战,包括挖矿成本增加、矿工数量减少以及潜在漏洞。她重点介绍了替代解决方案,例如以太坊的区块聚合和 Coinbase 的消除挖矿谜题。
演讲者继续探讨加密生态系统中的质押,利益相关者在其中投入资金以支持网络的运营。她承认加密寡头操纵市场的潜在问题,并解释了如何实施链下验证和自动化做市来解决这个问题。 Aldridge 强调理解这些概念对于掌握自动做市在防止加密货币市场操纵方面的重要性的重要性。
Aldridge 深入探讨了自动做市商 (AMM) 背后的原则,强调了它们对加密货币交易的革命性影响。她解释了由与流动性相关的不变量塑造的 AMM 曲线如何根据流动性池中的剩余库存确定价格。她强调了 AMM 的好处,包括 24/7 流动性、公式滑点估计和通过凸曲线确定公允价值。然而,她也提到 AMM 在波动的情况下可能会面临损失,从而导致引入交易费用。
将 AMM 与传统市场进行比较,Aldridge 讨论了自动做市的优势,例如持续的流动性、可预测的滑点和公允价值确定。她解释了 UniSwap 采用的恒定产品做市方法,说明执行经纪人如何根据参数化数据选择流动性和执行平台。
演讲者讨论了交易量变化的计算以及公共和私人流动资金池之间的区别。她使用来自不同交易所的比特币和以太坊展示了实证示例,指出了它们曲线的差异并提出了对某些平台的潜在担忧。
Aldridge 强调了使用凸形设计 AMM 曲线以确保市场稳定的重要性。她解释了流动性提供者和交易者在系统中的角色,以及他们如何从交易费用中获益。她还提出了 AMM 系统在传统市场中使用的可能性,促使人们考虑将其应用于 IBM 股票等资产。
Aldridge 探索了传统市场与自动化做市的融合,并指出传统做市商已经在实施类似的系统。她强调了市场互动、交易策略、执行方法和透明度方面的预期变化。还讨论了自动化做市商对市场微观结构的影响。
解决在加密市场等 24/7 交易环境中实施自动流动性的可行性时,Aldridge 解释说,自动做市可以消除与传统做市方法相关的风险,并且该技术很容易获得。然而,她警告说,并非所有加密货币交易所都使用自动做市,强调需要进行研究以解决风险管理和外部性问题。 Aldridge 指出,2002 年,自动化做市技术与比特币等加密货币同时出现。
当被问及自动做市商获得私人信息的潜在不公平优势时,Aldridge 承认这会带来问题。然而,她建议货比三家并量化不同平台的自动做市曲线可以帮助缓解这个问题。她指出,矿工受到激励继续他们的工作,因为他们是从访问和验证订单块中受益的人。然而,除非有私人激励,否则在这个领域产生利润越来越具有挑战性,从而导致寡头垄断的形成。奥尔德里奇提议,保险可以作为矿工几乎免费工作的自然激励。然而,保险公司将区块链视为对其行业的主要威胁,从而抵制此类系统设计。她还谈到了欺诈计划的可能性,强调了 IBM 曲线中的潜在操纵。
在集中式限价订单簿的背景下,Aldridge 解释了市场参与者如何利用自动做市商模型(例如 AMM),这些模型以具有成本效益的自动化方式提供流动性,并可能带来利润。然而,区分使用 AMM 的交易者和手动下达限价单的交易者仍然是一个挑战。 Aldridge 建议通过微观结构数据分析识别恶意用户可以提供一个潜在的解决方案。她认为,如果自动做市商继续主导市场,将会出现一种更高效、更精简的模式。
总之,Irene Aldridge 的讨论涵盖了区块链技术、自动化做市以及传统市场与 AMM 世界融合的各个方面。她探讨了区块链的基础知识,讨论了与工作证明挖矿系统相关的挑战和潜在解决方案,并强调了 AMM 相对于传统市场的优势。 Aldridge 还解决了有关实施自动流动性的可行性、自动做市交易商可以访问私人信息的问题,以及保险作为矿工激励的潜在作用的问题。通过她的见解,她就金融和自动化做市的当前格局和未来可能性提供了宝贵的观点。
Agostino Capponi(哥伦比亚):“私人交易池是否会降低抢先交易风险?”
Agostino Capponi(哥伦比亚):“私人交易池是否会降低抢先交易风险?”
来自哥伦比亚大学的研究员 Agostino Capponi 深入研究了去中心化交易所中的前端运行问题,并提出私有交易池作为一种潜在的解决方案。这些私有池在链下运行并与公共池分开,确保承诺不参与前端运行的验证者处理它们。然而,Capponi 承认使用私有池会带来执行风险,因为并非所有验证者都参与私有池,这意味着交易有可能不被注意并保持未执行状态。需要注意的是,采用私有矿池不一定会降低执行所需的最低优先级费用。此外,Capponi 指出,抢先攻击者之间的竞争通过最大可提取价值 (MEV) 使验证者受益。最终,虽然私人资金池可以降低抢先交易风险,但它们可能会增加执行所需的费用,从而导致分配效率低下。
Capponi 强调了通过私人矿池路由的交易比例与抢先交易概率之间的相关性,这使得优化分配变得复杂。他还探讨了不同类型的抢先交易攻击,包括压制和置换攻击,并提供了显示抢先交易造成的重大损失的数据。为了解决这些风险,Capponi 建议对用户进行交易时间方面的教育,并使交易验证更具确定性,以创建一个更加公平的系统。
讨论涉及私人交易池的动态、采用的挑战以及所涉及的潜在权衡。 Capponi 解释了私有池如何提供防止抢先交易的保护,但警告说它们的有效性取决于参与私有池的验证者的数量。此外,他还解决了由于 MEV 丢失而导致验证者不采用私有矿池的问题,并提出了潜在的解决方案,例如用户补贴以激励他们的采用。
虽然私人交易池可以在一定程度上降低抢先交易风险,但卡波尼强调它们并非万无一失,可能无法实现最佳配置。复杂性源于攻击者之间的竞争、私有池中验证者的采用率以及由此产生的对执行费用的影响等因素。讨论提出了区块链社区在解决抢先交易风险和确保公平高效的去中心化交易环境方面的重要考虑。
Kevin Webster 博士:“少花钱多办事 - 通过因果正则化进行更好的 A/B 测试”
Kevin Webster 博士:“少花钱多办事 - 通过因果正则化进行更好的 A/B 测试”
在本视频中,Kevin Webster 博士深入探讨了与交易实验和因果机器学习相关的挑战,并扩展了各种关键主题。他解决的一个突出问题是交易中的预测偏差,即交易期间观察到的回报是价格影响和预测价格变动的结合。为了减轻这种偏差,Webster 博士提出了两种方法:使用随机交易数据和应用因果正则化。通过将导致交易的交易信号纳入回归模型,可以消除偏差。
Webster 博士引入了因果图的概念,其中涉及三个变量:交易的 alpha、交易的规模和交易期间的收益。他断言,在不观察 alpha 的情况下准确估计价格影响具有挑战性,而传统的计量经济学技术在这方面达不到要求。他强调了由于规模和持续时间有限而导致的随机交易实验的局限性,强调需要使用模拟器进行仔细的实验设计和成本估算。
为了克服传统计量经济学的缺点,韦伯斯特博士提倡因果正则化。这种方法源自亚马逊,利用有偏差的数据进行训练,使用无偏差的数据进行测试,从而产生低偏差、低方差的估计量。它利用大量可用的组织数据并纠正偏差,从而实现更准确的预测。
在不知道其影响的情况下估算 alpha 会带来重大挑战,尤其是在贸易数据缺乏可信度的情况下。韦伯斯特博士建议使用随机提交的交易来获得无偏见的数据,而不依赖定价技术。然而,这种方法需要放弃大部分交易来建立 alpha 的置信区间,这可能不切实际。或者,他建议利用因果机器学习以更少的数据获得类似的结果。因果机器学习在交易应用程序中被证明特别有价值,例如交易成本分析、价格影响评估和 alpha 研究,由于深度、有偏见的交易数据的可用性,它超越了传统的计量经济学。
演讲者还深入探讨了统计分析在 A/B 测试中的重要性,强调需要定义价格影响并附加统计措施来对抗预测偏差。如果不解决这种偏见,分析就会变得主观并依赖于个人解释。韦伯斯特博士承认观察性公共数据带来的挑战,并强调了从干预数据中获得的见解。尽管回答采用哪种方法的问题很复杂,但 A/B 测试仍然是银行和经纪行业的常见做法。
最后,Webster 博士简要讨论了迁移学习和因果正则化之间的关系。虽然两者都涉及在一个数据集上训练模型并将其应用于另一个数据集,但迁移学习缺乏因果解释。两者之间的类比在于它们的验证过程,其中交叉验证起着举足轻重的作用。尽管它们在数学上有相似之处,但韦伯斯特博士强调了该方法中因果解释的新颖性。
Yuyu Fan(Alliance Bernstein):“利用文本挖掘提取洞察力”
Yuyu Fan(Alliance Bernstein):“利用文本挖掘提取洞察力”
Alliance Bernstein 的研究员 Yuyu Fan 就自然语言处理 (NLP) 和机器学习在分析财报电话会议记录和生成有效交易策略方面的应用提供了宝贵的见解。
Fan 的团队采用了各种技术,包括情绪分析、会计分析和可读性评分,筛选了从财报电话会议记录中提取的 200 多个特征。他们利用 BERT(来自变形金刚的双向编码器表示)等高级模型来评估演讲者的情绪,将 CEO 的情绪与分析师的情绪进行比较。有趣的是,他们发现分析师的情绪往往更可靠。
分析是对成绩单的单独部分和组合部分进行的,团队发现上下文驱动的方法优于基于背景词的朴素方法。情绪信号,尤其是美国小盘股公司,表现良好,得到投资团队的推荐。
在解释该方法时,Fan 描述了他们的团队如何使用分位数筛选和回测来评估不同功能的性能。他们检查了基于字典的方法以及使用 BERT 的基于上下文的方法的情绪分数。该团队还研究了可读性分数,衡量文本的易懂程度,重点关注 CEO 的评论,以确定与公司绩效的潜在相关性。
Fan 提供了对 BERT 工作原理的见解,强调了它的双向编码器表示,可以从给定单词的左右两边捕获上下文信息。该团队通过自标记和外部数据集添加情绪标签,对用于情绪分析的 BERT 模型进行了微调。他们的发现表明,基于 BERT 的情绪分析优于基于字典的情绪分析,正如财报电话会议记录中的例子所证明的那样。
此外,Fan 讨论了为情感分析设置准确度阈值的挑战,并强调准确度级别之间的实际性能可能没有显着差异。她强调了他们对美国小型公司的情绪信号的成功,这导致了投资团队的推荐。 Fan 还提到了一篇详细介绍 NLP 特征的论文的发表,这些特征可以作为量化信号来创建有效的交易策略,并不断努力通过数据扩充来增强模型。
讨论扩展到涵盖 NLP 特征与传统基本面和定量特征之间的相关性,强调观察到的可读性和情绪计算的适度相关性。范阐明了他们的回报方法,包括根据重新调整前的最新可用信息选择公司。
最后,Fan 谈到了 CO2 套利、BERT 和 FinBERT 之间的区别以及专为金融相关文件、收益和新闻量身定制的 BERT 金融使用模型的开发等主题。还提到了使用转录服务和供应商解决方案将音频数据转换为转录本以供分析的过程。
总之,Yuyu Fan 的研究展示了 NLP 和机器学习技术在分析财报电话会议记录方面的力量。情绪分析、会计分析和可读性评分的应用,以及 BERT 等高级模型的使用,可以生成高效的交易策略。正如 Alliance Bernstein 的投资团队所推荐的那样,情境驱动的方法优于单纯的方法,而且情绪信号被证明是有价值的,特别是对于美国小型公司而言。
Ciamac Moallemi(哥伦比亚):“流动性供应和自动做市”
Ciamac Moallemi(哥伦比亚):“流动性供应和自动做市”
在这次全面的讨论中,哥伦比亚大学教授 Ciamac Moallemi 从多个角度深入探讨了流动性提供和自动做市 (AMM) 的复杂性。他强调了 AMM 在解决区块链平台面临的计算和存储挑战方面的相关性,以及它们为流动性提供者产生积极回报的能力。为了说明这个概念,Moallemi 提出了 UniSwap V2 中波动性的逆向选择成本,揭示了 1.25 亿美元资金池的年成本约为 39,000 美元。他强调了波动性和交易量在确定流动性提供者回报方面的重要性,并阐明了 AMM 如何处理套利者和知情交易者。
Moallemi 强调了在区块链上使用 AMM 的优势,并探讨了合并价值函数和绑定函数的作用。他强调了对冲与再平衡策略相关的风险和成本的重要性。此外,Moallemi 介绍了他自己的流动性供应和自动做市模型,并将其与以太坊区块链的实际数据进行了比较。他讨论了他的模型如何通过降低支付给中介机构的成本来潜在地增强 AMM。 Moallemi 提出了各种方法来减轻由次优价格引起的低效率,例如利用预言机作为数据源并将套利权出售给授权参与者,使他们能够免费与矿池进行交易。
此外,Moallemi 阐明了 AMM 相对于传统限价订单簿的优势,特别是在简单性和可访问性方面。他强调了 AMM 如何通过消除对复杂算法和大量资源的需求,为不太成熟的参与者创造公平的竞争环境。 Moallemi 最后表达了对更好结构的潜力的乐观态度,这种结构有利于更广泛的参与者,将 AMM 定位为朝着正确方向迈出的一步。
Andreea Minca (Cornell ORIE):聚类异构金融网络
Andreea Minca (Cornell ORIE):聚类异构金融网络
Andreea Minca 教授是 Cornell ORIE 金融网络领域的著名专家,她的研究致力于探索集群异构金融网络的复杂性。她引入了一个创新的正则化术语来应对这些网络带来的独特挑战,尤其是存在具有任意连接模式的异常值。这些异常值阻碍了谱聚类算法的性能,并将聚类转化为一个计算上具有挑战性的问题,称为 NP-hard 组合问题。
为了根据它们的连接模式识别这些异常值,Minca 使用随机块模型和度校正随机块模型。这些模型为精确恢复提供了理论保证,无需对异常节点做出假设,除了知道它们的数量。金融网络固有的异质性进一步复杂化了仅基于节点度的异常值检测。
Minca 通过构建分区矩阵和节点排列,深入研究了将网络划分为集群和异常值的过程。她通过将其应用于分析韩国银行系统来举例说明这种方法。此外,Minca 使用 Gibbs 采样器来填补网络中的空白,通过根据重叠投资组合的强度和重叠程度对重叠投资组合进行聚类,从而实现有效的风险分配和投资多样化。
在她的工作中,Minca 强调了生成具有有意义的互连性的集群而不是没有连接性的集群的重要性。她提出了一种方法,在集群风险平价框架下提供五种多样化选择,强调在使用集群算法实现金融网络多样化时需要仔细考虑。 Minca 建议使用标准投资类别量化聚类算法的性能,并强调在使用这些技术时做出明智决策的重要性。
总的来说,Andreea Minca 教授的研究为异构金融网络集群的复杂性提供了宝贵的见解,提供了创新的方法和实用的解决方案来应对与这些网络相关的挑战。她的工作有助于推进风险分析、投资组合选择和理解金融系统的结构动态。