量化交易 (Quantitative trading) - 页 8

 

Rama Cont 和 Francesco Capponi:“股票市场的交叉影响”



Rama Cont 和 Francesco Capponi:“股票市场的交叉影响”

Rama Cont 和 Francesco Capponi 通过对订单流和价格数据的分析深入研究了股票市场中交叉影响的概念。他们断言,交叉影响意味着资产的价格不仅受到其自身订单流的影响,还受到其他资产订单流的影响。虽然之前的理论研究试图推导交叉影响效应的后果并将单一资产最优交易执行模型扩展到多种资产,但 Cont 和 Capponi 提出了一种更简化的方法来解释资产回报与订单流之间的相关性。

他们认为,没有必要使用价格影响系数的综合矩阵来解释这些相关性。相反,他们认为观察到的相关性可以归因于市场参与者经常参与多种资产交易,从而在资产之间产生相关的订单流失衡。为了确定交叉影响系数的重要性和执行成本的主要驱动因素,演示者建议对回报和订单流失衡的相关矩阵使用主成分分析 (PCA)。

Cont 和 Capponi 提出了一个股票市场交叉影响的简约模型,重点关注股票自身的订单流平衡和订单流失衡的相关性。他们发现订单流失衡的单因素模型足以解释回报的交叉相关性。该模型可用于投资组合执行和交易成本分析,演示者建议使用可靠的单一资产影响模型,以及跨资产订单流的共同因素的良好模型。

发言者强调了为方程式建立因果模型和解释的重要性。他们表示愿意分享更多材料和更新,强调他们致力于加深对该研究领域的理解。

  • 00:00:00 在视频的这一部分,Rama Cont 和 Francesco Capponi 讨论了股票市场中交叉影响的概念。他们通过分析来自股票市场的订单流和价格数据来研究这一概念,并解释市场影响或交易执行会影响资产价格,从而影响执行成本。他们还表明,价格变动是由供需之间的总体失衡驱动的,并将订单流失衡的概念定义为构建影响模型的有用工具。

  • 00:05:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了集中式订单簿市场中订单流失衡的线性影响。供需之间的这种总体失衡是推动价格的因素,这可以看作是一个回归模型,其影响系数反映了相反的流动性概念。该系数与订单簿的深度具有高度相关的反比关系,可以通过协方差计算来提取影响系数。虽然这项研究之前是针对单一股票进行的,但市场参与者也对多种资产之间的相关性感兴趣,并且已经发现订单流失衡与不同证券的回报之间存在正相关性。

  • 00:10:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了交叉影响的概念及其理论和实证研究。他们解释说,交叉影响是指一种资产的价格不仅受到其自身订单流的影响,还受到其他资产的订单流的影响。实证研究表明,至少在同质资产类别中,一种资产的订单流与另一种资产的价格变动之间存在正相关关系。理论研究试图推导出这种交叉影响效应的后果,并将单一资产最优交易执行模型扩展到多个资产,其中该模型包括交叉影响效应。然而,这导致需要估计大量的交叉影响系数。

  • 00:15:00 在本节中,主持人讨论交叉影响的概念及其在解释可观察市场现象方面的相关性。他们质疑是否需要完整的价格影响系数矩阵来解释市场中资产回报与订单流之间的相关性,以及是否可以采用更简约的方法。他们还类比物理学中的远距离行动,并讨论了将资产联系在一起以建立因果影响的基础机制的必要性。目的是设计一个只包含必要系数并避免不必要的复杂性的多资产影响模型。

  • 00:20:00 在本节中,发言者认为交叉影响的概念没有必要解释股票市场中观察到的价格变动和订单流失衡的共同变化。观察到的相关性可以解释为市场参与者经常交易多种资产,在资产之间产生相关的订单流失衡,这反过来导致不同资产回报的相关性。演讲者展示了一个因果模型图,表明资产价格是由订单流失衡驱动的,订单流失衡是实体和多资产交易策略产生的所有买卖订单的代数和。他们认为单一资产影响模型足以解释这些相关性,不需要额外的交叉影响模型。

  • 00:25:00 在本节中,传统的供求关系驱动每种资产的价格,在订单流平衡中产生相关性,与交叉影响模型进行比较,交叉影响模型假设一种影响股票回报的机制从远处。这些假设可以通过对图表中的变量进行条件化并执行条件回归,使用有关订单流和退货的可用数据进行测试。讨论了多资产影响模型的构建及其带来的固有识别问题。具有两个变量(收益和 OFI)的线性模型用于创建 theta 和 beta 系数矩阵。一只股票的净订单流量定义为买入队列的流入减去卖出队列的流出。

  • 00:30:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了回报的协方差与订单流不平衡及其与贝塔矩阵和交叉影响的关系。他们强调,不需要在 beta 中有非对角线元素来获得协方差矩阵中的非对角线元素,因为协方差可以来自订单流的相关性或交叉影响矩阵。两只股票在订单流中没有相关性但具有交叉影响系数的示例突出了了解订单流相关性以确定交叉影响系数的重要性。协方差矩阵受模型中的相关系数和交叉影响系数的影响,可以用不同场景下的数字观察到。

  • 00:35:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了为股票之间的相关性和订单流建模与理解交叉影响和建模之间的区别。他们解释说,仅仅观察一种资产的订单流与另一种资产的回报之间的非零相关性并不意味着您需要模型中的非零交叉影响系数。他们还提供了低相关性和订单流、高交叉影响的示例,反之亦然,以表明不可能仅从这些协方差推断出交叉影响。最后,他们讨论了所分析的数据,其中包括纳斯达克 100 中 67 只股票两年半以来的净订单流、订单流失衡和回报,并解释了他们如何重新定义和规范化回报和订单流失衡。

  • 00:40:00 在视频的这一部分中,演讲者研究了股票收益的相关性和不同股票的订单流失衡之间的关系。通过绘制股票回报与其他股票订单流失衡的相关性,演讲者证明绝大多数股票对的相关性非常接近相等,这表明回报与订单流失衡之间的相关性可能仅仅是由于不同余额之间的相关性。为了测试是否需要多元市场影响模型,演讲者使用回归分析发现交叉影响系数非常接近于零,这表明即使它们是可识别的,它们对总影响的影响也很小。

  • 00:45:00 在本节中,Rama Cont 和 Francesco Capponi 提出了一种不同的方法来确定交叉影响系数的重要性和执行成本的主要驱动因素。他们建议对收益和订单流量平衡的相关矩阵使用主成分分析 (PCA),并使用订单流量不平衡的因子模型。因子模型的第一个主成分用于测试任何交叉影响系数的剩余显着性,回归的残差被解释为仅由于该股票的行为而导致的异质订单流。该方法旨在将股票自身订单流的特殊部分与交叉交易引起的公共部分的贡献分离开来。

  • 00:50:00 在视频的这一部分,Rama Cont 和 Francesco Capponi 讨论了追踪纳斯达克 100 指数和标准普尔 500 指数的 ETF 的收益第一主成分与订单流余额之间的相关性。他们发现第一主成分收益与追踪纳斯达克 100 指数的 ETF 的整体收益具有 91% 的相关性。同样,订单流量余额的第一主成分与追踪同一指数的 ETF QQQ 上的订单流量余额具有 82% 的相关性.他们还观察到,回报和订单流失衡的第一主要成分与整体市场走势有关。这导致他们解释了他们的两步法,以消除订单流的共性并提高回报。

  • 00:55:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了股票市场的交叉影响,指的是股票自身的订单流不平衡以及股票之间订单流的共性如何影响股票的回报。他们表明,自我影响系数是股票回报的主要决定因素,而交叉影响系数非常小,一旦考虑主成分,几乎都变成负数。然后,他们测试有多少交叉影响项有助于解释退货的执行成本,并评估它们是否具有统计和经济意义,同时还质疑它们随时间的稳定性。

  • 01:00:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了交叉影响的影响及其在股票市场中的重要性。他们的结论是,虽然统计数据可能很重要,但从经济角度来看,幅度很小,并且在回归中包括所有其他订单流失衡时,解释力几乎没有任何明显差异。他们主张采用更简约的影响建模方式,并建议仅使用股票自身的订单流平衡和订单流失衡的相关性来模拟影响。他们还强调随着时间的推移稳定性的重要性,并分析子样本以确保交叉影响系数稳定。

  • 01:05:00 在本节中,Rama Cont 和 Francesco Capponi 总结了他们对股票市场交叉影响模型的发现。他们认为,在不引入具有许多系数的高维模型的情况下,可以解释不同股票之间的回报和订单流平衡之间的正协变现象。一个简单的不平衡订单流单因素模型足以解释这些回报互相关的模式。他们建议,构建多资产影响模型的更好方法是专注于构建订单流中公共因素的模型,例如订单流的线性因素模型或主成分分析。部署一个将订单流与其自身回报相关联的单一资产影响模型足以解释投资组合执行中执行成本的幅度。

  • 01:10:00 在本节中,Rama Cont 和 Francesco Capponi 讨论了他们模型的实际应用,特别是在投资组合执行和交易成本分析 (TCA) 的背景下。该模型允许量化执行成本,同时考虑到资产之间订单流的共性。单一资产和投资组合之间执行成本的差异与共性因素有关。该模型可用于衡量投资组合级别的执行成本,并有助于更好地了解交易组合的影响。他们建议使用一个好的模型来分析单一资产的影响,同时使用一个好的模型来分析资产间订单流的共同因素。

  • 01:15:00 在本节中,演讲者讨论了等式 12 中收益第一主成分的使用。他们指出,使用 OFI 的主成分与使用收益之间存在高度相关性,但他们争辩说他们想要遵循他们的因果分析并对共性建模,以便用不平衡来解释回报。他们强调了对方程式进行因果模型和解释的重要性。演讲者感谢听众的关注,并表示愿意分享更多材料和更新。
Rama Cont and Francesco Capponi: "Cross-Impact in Equity Markets"
Rama Cont and Francesco Capponi: "Cross-Impact in Equity Markets"
  • 2020.10.13
  • www.youtube.com
Title: "Cross-Impact in Equity Markets" Joint Work with Francesco CapponiAbstract: The empirical finding that market movements in stock prices may be correl...
 

Adam Grealish:“个人投资的算法方法”



Adam Grealish:“个人投资的算法方法”

Betterment 的投资总监 Adam Grealish 就公司的个人投资算法方法及其基于目标的策略提供了见解。 Betterment 利用机器人咨询模型,利用算法和最少的人工干预为其客户提供投资建议和管理。

Grealish 强调了决定投资结果的三个关键因素:保持低成本、税收优化和智能交易。尽管所有因素都很重要,但 Betterment 非常重视前三个因素。该公司采用 Black Litterman 优化技术构建全球多元化投资组合,并持续监控其 50 万庞大客户群的目标权重。税收优化,包括税损收缴、资产定位和批次分类等策略,提供了跑赢市场的机会。

在讨论的第二部分,Grealish 将 Betterment 的方法与传统的自动化财务顾问区分开来。与传统机器人顾问的“一刀切”方法不同,Betterment 的算法方法考虑了目标、时间范围和风险承受能力等个人因素。这种定制允许根据每个投资者的独特情况量身定制个性化投资组合。 Betterment 还提供额外的功能,如税收损失收集和税收协调的投资组合,以最大限度地提高税收效率和增加回报。

Grealish 进一步深入研究了 Betterment 投资策略的细节。公司鼓励长期配置稳定,每年仅调整一次投资组合以实现目标配置。他们利用基于触发的再平衡算法来管理目标分配的偏差并最大限度地降低风险。 Betterment 的投资组合是使用基于广泛市值的 ETF 构建的,优化了对具有相关风险溢价的风险资产类别的敞口。

成本优化是 Betterment 投资理念的一个重要方面。该公司利用 ETF 费用下降的趋势,每季度审查整个 ETF 领域。选择过程考虑了费用比率以外的因素,包括跟踪误差和交易成本,从而为 Betterment 的客户提供低成本的投资组合。

税收优化是 Betterment 战略的另一个关键要素。 Grealish 解释了税收管理的重要性,并概述了三种有效的策略:税损收缴、资产定位和批次分类。税收损失收割涉及亏本出售证券以实现出于税收目的的资本损失,而资产定位通过战略性地跨账户分配资产来最大化税后回报。批次分类需要首先出售损失最大的批次,以优化税收优惠。

Grealish 承认投资者行为对投资结果的影响。 Betterment 通过实施智能默认设置、使用自动化和鼓励基于目标的投资来打击负面行为。该公司采用有意的设计和数据分析来提示用户在偏离财务目标时采取行动。

在未来发展方面,Grealish 讨论了人工智能在金融科技领域的潜在用途。 Betterment 正在探索人工智能在自动化财务任务(如机器人咨询和现金管理)中的应用。该公司的目标是让更广泛的受众可以使用以前仅限于高净值个人和机构的金融服务。然而,个性化报税的复杂性给这一领域带来了挑战。

总体而言,Adam Grealish 为 Betterment 的个人投资算法方法提供了宝贵的见解,强调基于目标的策略、成本优化、税收管理和行为缓解。

  • 00:00:00 Adam Grealish 介绍 Betterment,这是一个在线自动化投资咨询平台,使用基于目标的方法进行投资管理。其目标是通过最佳投资策略为客户提供高回报。 Betterment 拥有直接面向客户的业务、面向财务顾问的白标技术平台和 401k 业务。 “机器人顾问”一词准确地描述了 Betterment 的方法,因为它通过软件执行的算法提供数字财务建议,而人工干预最少。

  • 00:05:00 Investing for Betterment 总监 Adam Grealish 解释了他们的投资方法,该方法基于算法和数学模型。 Betterment 平台提供完全不干涉的投资管理体验,无需人工交互,并为需要的人提供人工顾问服务。根据 Grealish 的说法,决定投资结果的关键因素是保持低成本、税收优化、智能交易、资产配置和证券选择。然而,Betterment 主要关注前三个,因为它们被认为对实现财务目标最具确定性,而不太重视资产配置和证券选择。他们使用 Black Litterman 优化技术来创建全球多元化的投资组合,并为投资者实现最佳回报。

  • 00:10:00 在本节中,Adam Grealish 讨论了他们如何帮助投资者根据具体的投资目标和时间范围选择承担多少风险。该应用程序提供有关承担多少风险的建议,以及随着时间的推移可能出现的情况的预测。然后,他们通过日常监控来管理目标权重,每天监控多达 800,000 个个人投资组合的 50 万客户。再平衡主要被视为一种风险管理工具,并在现金流出现、支付股息或从账户中扣除费用时以节税的方式进行。 Grealish 讨论了 Bushi(2012 年)的一篇论文,该论文强调了随着时间的推移重新平衡具有不相关证券的投资组合的好处。最后,他们根据清算情况区分目标,并根据地平线的长度构建下滑路径。

  • 00:15:00 Adam 讨论了他们的个人投资算法如何运作。他们鼓励投资者长期保持他们的配置,每年只调整一次,以朝着他们的目标配置迈进。该团队每月调整客户的目标分配,这使得边际美元更接近正确的风险目标,而无需进行会带来潜在风险的再平衡交易。他们的投资组合完全基于广泛的基于市值的 ETF,并且他们优化了对风险资产类别的敞口,并产生了与之相关的风险溢价。该团队采用基于触发的再平衡算法来测量与目标分配的偏差,当偏离太远时,他们会重新平衡,从而管理风险。最后,Grealish 指出,精通金融知识的人与精通个人理财知识的人之间存在很大的脱节。

  • 00:20:00 在本节中,Adam Grealish 讨论了 ETF 费用降低的趋势,这对 Betterment 有利,因为它是一家独立的机器人咨询公司,不与任何单个基金家族挂钩。 Betterment 有一个季度基金选择流程,审查整个可投资的 ETF 范围,不仅根据费用率,还根据跟踪误差和交易成本等其他因素对它们进行排名。 Betterment 侧重于年度总拥有成本或“taco 分数”,它由持有成本、交易成本和其他因素决定。该过程为 Betterment 带来了低成本的产品组合。

  • 00:25:00 在视频的这一部分,Adam Grealish 讨论了 Wealthfront 投资方法的各个方面。他解释说,他们的预期回报是通过 cap m 的反向优化产生的,他们使用在税收地段级别运行的蒙特卡罗模拟引擎来测试他们的税收策略。 Grealish 还指出,通过持有个人证券使基金行业脱媒是一个有趣的想法,可能会带来更多的税收机会和个性化,但会产生相关的运营成本。此外,他还解释了 Wealthfront 如何权衡持有和交易投资的成本,以准确衡量其总成本。

  • 00:30:00 Betterment 首席执行官 Adam Grealish 讨论了零售投资中税收管理的重要性,并概述了有效税收管理的三种策略:税收损失收缴、资产定位和批次分类。税收损失收缴涉及亏本出售证券以实现出于税收目的的资本损失,以及购买相关证券以维持市场敞口。 Betterment 旨在最大限度地减少收获的损失,同时保持目标风险分配并避免洗售,这种情况发生在投资者亏本出售证券并在 30 天内购买基本相同的证券时。 Grealish 还指出,税收管理提供了跑赢市场的机会,并可能在某些情况下导致大量避税。

  • 00:35:00 Adam 建议不要在 30 天后盲目地转回主要证券以避免增加您的纳税义务,因为您可能会实现 1 美元的长期损失,但随后会实现 4 美元的短期资本收益,从而导致负收益税收套利。他还强调,合格股息的低税率只会在 60 天后生效,过快切换回来会损害您的税收效率。 Grealish 建议选择与一级证券相关性高、费用可比、流动性充足的二级证券,以确保税收效率。在收获方面,Grealish 建议设定一个阈值,预期收益应大于交易成本和机会成本,这可以使用期权理论来确定,特别是在证券具有高波动性的情况下。 Grealish 的回溯测试显示每年的抵消幅度接近 2%,但他警告说,盲目遵循这一策略可能并不总是最优的。

  • 00:40:00 在本节中,Adam Grealish 讨论了税损收缴的好处,并就如何在个人账户中有效应用它提供了建议。税收损失收集可能是管理风险的有效方法,回溯测试结果表明它可以推动税后 alpha。但是,用户在将此策略应用于个人账户时需要考虑交易成本和未来洗售的机会成本。资产定位是另一种可以最大化税后回报的策略。通过跨账户分配资产以保持目标分配和投资组合的风险,用户可以提高他们的税后回报。

  • 00:45:00 Adam Grealish 讨论了不同证券类型的税务处理,并提供了个人投资的算法方法。他解释了如何通过将低效资产转移到税收优惠账户以及将有效资产转移到应税账户来优化三个账户的投资。这涉及考虑资产的增长率、股息收益率、清算税和合格股息收入比率,并将问题设置为线性规划问题。这种投资算法方法每年为非优化策略增加约 50 个基点。

  • 00:50:00 在本节中,Adam Grealish 谈到了征税地块管理,以及 Betterment 如何帮助其用户对所有地块进行分类并首先出售最大的损失,然后再转向收益并首先出售最小的。他还强调了亏损对于税收目的的重要性,以及如何将亏损用于抵消资本收益、冲销收入或结转。 Grealish 然后讨论了税率不确定性的问题,以及 Betterment 如何通过将税后表现作为一种观点并具体说明围绕它的信心水平,通过其 black litterman 流程来解决这个问题。然后,他们对后验回报进行稳健优化,并据此构建最优投资组合,同时每年重新审视他们的资本市场假设和战略资产位置。最后,他详细阐述了市政债券由于更高的税后预期表现而在其应税投资组合中的分配增加。

  • 00:55:00 Adam Grealish 讨论了行为主题及其如何影响散户投资者。他解释了投资者如何倾向于在市场上涨时买入,在市场下跌时卖出,这会导致业绩不佳和财富减少。为了解决这个问题,机器人顾问设置智能默认值、使用自动化并鼓励基于目标的投资以促进更好的行为。 Adam 还提到了一些研究,这些研究量化了由于投资者行为导致的年化表现不佳,通常在 1-4% 之间。

  • 01:00:00 Adam 讨论了 Betterment 通过有意设计和数据分析来打击不良投资行为的方法。他指出,他们大约四分之三的账户没有参与市场择时,公司密切监控客户活动。 Betterment 使用色彩设计来指示客户何时偏离实现其财务目标的轨道,从而促使他们采取行动重回正轨。在市场不确定时期,该公司依靠其平台测试不同的消息传递和干预措施,发现将负面市场趋势通知客户会引起警报并导致负面结果。相反,应用程序内的干预和消息传递被证明在减少负面结果和增加客户存款方面更有效。

  • 01:05:00 在本节中,Betterment 的首席投资官 Adam Grealish 讨论了算法投资在多大程度上受到收集资产的动机以及是否合乎道德。他指出,该系统主要影响那些偏离目标或处于正轨边缘的个人,并表示如果这是公司的目标,还有更好的方法来提取资产。他讨论的其他策略包括改变储蓄和存款或改变一个人的目标计划。 Grealish 还描述了 Betterment 减轻行为偏差的方法,例如其“税收影响预览”功能,该功能向客户显示潜在的纳税义务,并被证明可有效降低轻率决策的可能性。

  • 01:10:00 Adam 讨论了人工智能在金融科技领域的潜在用途。他认为,人工智能最先出现的一些地方是自动化外围金融领域,如机器人咨询和现金管理。例如,Betterment 正在探索使用 AI 将外部账户映射到代理代码,并使用交易数据来建议人们他们的支票账户中应该有多少现金。 Grealish 还表示,从长远来看,Betterment 的目标是让财务顾问成为每个人财务生活的中心,并广泛提供仅供超高净值人士和机构投资者使用的东西,包括税务准备。然而,个性化税务准备会使问题空间变得更加复杂。

  • 01:15:00 Betterment 的 Adam Grealish 解释说,特定州的市政债券不在 Betterment 平台上,因为并不总是很明显州内是最好的选择,而且它有点像菜单外的项目.虽然 Betterment 平台允许您链接任何其他房地产资产的外部账户并手动跟踪您的净资产,但也无法对其他基金进行资源密集型风险回报评估。 Betterment 专注于考虑资产类别,而不是出于税收原因排除资产类别,并且由于其作为独立顾问的结构及其对客户日常交易的推动,成为更全面服务的财务顾问,因此在机器人咨询领域独树一帜.该公司在 AWS 上运行一些研究计算,尽管它还不是 AWS 或现有公共 API 的高用户。

  • 01:20:00 在本节中,Adam Grealish 讨论了 Betterment 的交易流程。虽然他们考虑为客户实现订单流的内部化,但由于其被归类为替代交易场所,最终没有采用该选项。 Betterment 有自己的交易台,交易通过 Apex 执行,Apex 也为他们清算。不向客户收取交易费用,只收取平台费,保持交易不频繁。 Betterment 的 ETF 由股票和债券组成,同时在债券基金中提供税收优惠。此外,Betterment 跟踪所有扣除预期回报的回报,因为这可以分解为已实现回报和预期回报。
Adam Grealish: "An Algorithmic Approach to Personal Investing"
Adam Grealish: "An Algorithmic Approach to Personal Investing"
  • 2020.09.17
  • www.youtube.com
In this talk, Adam Grealish of Betterment will explore how technology can be used to improve investor outcomes. Technology and automation can play a signific...
 

Miquel Noguer i Alonso:“金融深度学习的最新发展”



Miquel Noguer i Alonso:“金融深度学习的最新发展”

在这段综合视频中,Miquel Noguer i Alonso 探讨了深度学习在金融领域的潜力,尽管该行业具有内在的复杂性和经验性质。深度学习在捕获非线性关系和识别重复模式方面提供了宝贵的功能,尤其是在非结构化数据和金融应用程序中。然而,它也带来了一些挑战,例如过度拟合和在非平稳情况下的有效性有限。为了应对这些挑战,因素、情绪分析和自然语言处理的整合可以为处理大量数据的投资组合经理提供有价值的见解。需要注意的是,没有一刀切的模型,深度神经网络不应该取代传统的基准模型。此外,Alonso 强调了 BERT 的重要性,BERT 是一种开源且高效的语言模型,展示了对金融文本中数字的深刻理解,使其对金融数据集特别有价值。

在整个视频中,Alonso 分享了重要的见解并讨论了在金融领域使用深度学习模型的各个方面。他探索使用卷积神经网络将金融数据转换为图像进行分析,利用自动编码器进行非线性数据压缩,以及应用内存网络进行时间序列分析。强调领域专家和机器学习从业者之间的协作是使用深度学习技术有效解决金融相关问题的关键因素。

Alonso 深入研究了在金融领域使用深度学习时遇到的挑战,例如数据生成过程的动态特性以及开发能够适应这些变化的模型的需求。他强调了信息论、复杂性和压缩信息以找到最简洁表示的概念。讨论了通用逼近定理,强调深度神经网络以任意精度逼近任何函数的能力,但不能保证泛化。演讲者建议进一步探索关于正则化、神经网络的内在维度和过度参数化神经网络的研究论文。

演讲者还谈到了插值机制的概念,其中深度神经网络可以发现更大的函数类,这些函数类可以识别具有较小范数的插值函数。他们讨论了深度神经网络的定性方面,强调了不同层的不同重要性及其在时间序列预测中的作用。但是,强调线性模型仍然是基准,深度学习模型的结果应该与它们进行比较。

Alonso 提供了对深度学习模型在金融领域的表现的见解,展示了对多只股票使用长期短期记忆网络的结果,并展示了它们优于其他神经网络的优势。深度学习模型在选择标准普尔 500 指数中的最佳股票方面表现优于线性模型,从而获得更好的样本外信息比率。演讲者强调,深度学习始终表现良好,可以成为选择模型时的可靠选择。

因素在金融深度学习模型中起着至关重要的作用,能够探索与回报的非线性关系。非线性的利用将这种方法与纯时间序列练习区分开来。演讲者还强调了训练期间参数选择的重要性,并警告不要假设使用更多数据总是会提高准确性。重要的是要注意,这些模型不包含成本或现实生活中的考虑因素,因为它们主要用于基于历史数据的研究目的。

演讲者阐明了他们论文的重点,强调其目的不是声称深度神经网络更优越,而是强调需要将它们与传统基准模型一起使用。讨论了捕获非线性关系和理解循环的重要性,以及考虑学习窗口等参数的必要性。深度神经网络可以通过捕获线性模型可能忽略的二阶或三阶效应,在特定场景中提供独特的见解。但是,强调没有通用的模型,深度神经网络应该补充现有的基准模型而不是取代它们。

还探索了自然语言处理,特别是情感分析在金融领域的应用。鉴于市场中产生的大量信息,大数据工具对于调查和分析高维空间至关重要。机器学习,尤其是深度学习,在应对这些挑战方面被证明是有价值的。语言模型可用于情绪分析等任务,从而提供对市场动能的洞察。事实证明,抓取互联网是检测可能表明市场变化的信息变化的有效方法。总体而言,自然语言处理为处理大量数据的投资组合经理提供了宝贵的见解。

在视频中,演讲者深入探讨了金融领域情绪分析的两种方法。传统方法涉及计算正面和负面词的频率,而更先进的方法利用深度学习和词嵌入来掌握词的上下文和语义。演讲者强调了来自 transformers (BERT) 的双向编码器表示的有效性,这是一种尖端语言模型,可提供更准确、更高效的单词表示。 BERT 理解金融文本中数字的能力对于准确的金融分析尤为重要。其他函数逼近器,如多层感知器、记忆网络和 covnet,也被认为是金融领域的有用工具。

此外,演讲者还讨论了将金融数据转换为图像并使用卷积神经网络进行分析的概念。这种方法被证明对无监督学习问题特别有益。介绍了使用自动编码器进行非线性数据压缩和使用记忆网络进行时间序列分析。如果环境足够稳定,内存网络可以适用于分析时间序列数据。此外,演讲者还谈到了 Transformer 模型在金融语言处理中的使用,并提供了对使用 TensorFlow 实施这些模型的见解。

关于在金融领域实施开源深度学习模型,演讲者强调,虽然可能需要针对金融应用程序进行专门培训,但由于可用的开源代码非常丰富,因此这是一个可以实现的目标。领域专家和机器学习者之间的协作对于解决金融相关问题至关重要,因为在该领域有很多利用机器学习的机会。演讲者指出,虽然手工制作的自然语言处理方法目前用于金融领域,但深度学习模型尚未在行业中得到广泛采用。

该视频还深入探讨了传统的金融手工控制方法,其中个人使用字典来描述摩根大通等实体,同时确保没有拼写错误。讨论了各种机器学习算法的有效性,例如长短期记忆网络和 BERT。 BERT 在已发表的研究中被认为是最先进的。还探讨了机器学习在横截面投资中的潜力,建议使用因子或回报来帮助机器解释平坦的回报或因子。

谈到在深度学习中寻找最优值的困难,演讲者承认这可能是一个 NP 问题。具有经验和直觉的人类数据科学家必须根据他们的专业知识做出启发式选择。理解和解释深度神经网络的挑战凸显出来,因为即使是数学家也难以制定方程式来解释其卓越性能。在这种情况下通常会采用定性分析。然而,随着时间的推移,在处理了各种数据集之后,数据科学家可以培养一种直觉,为特定情况选择最合适的参数。

  • 00:00:00 Miguel Noguer i Alonso 讨论深度学习在金融领域的应用。他指出,深度学习在图像识别和语言模型等其他领域取得了成功,但由于该行业的经验性和嘈杂性,很难看出它如何成功应用于金融领域。尽管复杂,但在非结构化数据和金融应用程序中使用深度学习仍有令人兴奋的可能性。教育金融研究所正在与大学和公司合作,研究人工智能在金融领域的应用。

  • 00:05:00 在视频的这一部分,Miquel Noguer i Alonso 讨论了在金融领域使用机器学习模型的潜力以及该领域缺乏研究。他接着强调了可用于金融的机器学习的各个领域,包括监督学习、非监督学习和强化学习。 Noguer i Alonso 鼓励研究人员专注于构建更多用于无监督学习的工具,因为目前该领域的研究有限。他最后指出,在金融领域没有任何地方不能将机器学习用于预测信用损失和组织数据集等目的。

  • 00:10:00 演讲者介绍了深度学习作为不可能学习、回归问题和通过使用非线性函数进行无监督学习的引擎。神经网络被解释为具有大量参数的非线性函数,这导致了统计学家和工程师对其可行性的警告。然而,深度学习的先驱们发现了激活函数、层数和神经元的正确组合,使其与统计预期相反。演讲者还讨论了深度学习的各种架构,例如卷积神经网络、递归神经网络和转换器。

  • 00:15:00 演讲者讨论深度学习在金融领域的利弊。从好的方面来说,深度学习模型更善于捕捉非线性和数据集的表现力,并在多变量时间序列中表现出效率。它们还与提升树竞争,提升树是分类和数值数据的最佳技术之一。然而,由于深度学习模型中的大量参数以及它们在非平稳情况下缺乏有效性,主要缺点是过度拟合,这是随着时间序列不断变化的金融中的一个大问题。演讲者指出,目前的模型并没有为这个问题提供好的解决方案。

  • 00:20:00 Miquel Noguer i Alonso 解释了深度学习在金融领域面临的挑战,特别是数据生成过程不断变化的性质以及如何创建可以在其中工作的模型。他建议的一种解决方案来自信息论;复杂性和将信息压缩到尽可能短的程序的想法。他还讨论了通用逼近定理,以及它如何保证深度网络可以任意精度逼近任何事物,但不能保证它们会泛化。他鼓励读者阅读 Sun 的一篇论文,该论文认为正则化不足以泛化,并推荐有关神经网络的内在维度和过度参数化神经网络的论文。

  • 00:25:00 在本节中,演讲者讨论了一种称为插值机制的新机制,其中深度网络可能能够通过返回大量引力来编写一些证书,这可能会导致发现大型函数类,从而找到具有较小范数的插值函数。这个想法是找到具有那么多特征的更简单的东西。他们还讨论了模型的定性方面,例如为什么所有层都不是平等的,以及深度神经网络在时间序列预测中的作用。然而,他们的基准模型仍然是线性模型,他们需要将结果与基准进行比较。

  • 00:30:00 演讲者讨论深度学习模型在金融领域的表现。他们展示了对 30 只股票而不是一只股票使用长短期记忆网络的结果,并指出与其他神经网络相比,绝对误差更低。演讲者还展示了深度学习模型如何在选择标准普尔 500 指数中的最佳股票方面优于线性模型,从而获得更好的样本外信息比率。总的来说,深度学习被发现始终接近最佳模型,并且在盲目选择模型时是一个不错的选择。

  • 00:35:00 演讲者讨论了因子在金融深度学习模型中的使用。质量、价值和动量等因素用于研究与回报的非线性关系。这种方法与纯时间序列练习的区别在于非线性的使用。演讲者还讨论了训练周期参数的重要性,并指出使用更多数据并不一定意味着更高的准确性。该模型不包括成本或现实生活中的考虑因素,因为它纯粹用于研究目的并基于过去的数据。

  • 00:40:00 在这一部分中,演讲者讨论了他们正在更新的论文,并澄清了论文中的主张并不是深度网络更好,而是它们需要与传统基准模型一起运行。此外,演讲者还解释说,深度网络在捕获非线性关系和学习正确循环方面很有用。但是,还需要考虑参数,例如网络学习的窗口。此外,由于学习了线性模型可能遗漏的二阶或三阶效应,深度网络可能会在某些修复机制中告诉我们不同的事情。演讲者还强调没有放之四海而皆准的模型,深度网络不应取代传统的基准模型。

  • 00:45:00 Miguel Noguer i Alonso 讨论了自然语言处理在金融领域的应用,特别是情感分析。随着市场上产生的大量信息,需要大数据工具进行调查,而机器学习,尤其是深度学习,可用于处理高维空间。语言模型可用于情绪分析等任务,这可能是金融动量的先兆。事实证明,在互联网上抓取信息是搜索可能表明市场变化的信息变化的有效方式。总体而言,自然语言处理可以在处理大量数据时为投资组合经理提供有用的见解。

  • 00:50:00 在本节中,演讲者讨论了情感分析在金融中的应用及其实现的两种方式:计算正面和负面词频的传统方法和更先进的使用深度分析的方法学习和词嵌入来理解词的上下文和语义。最先进的模型是来自 transformers 的双向编码器表示,它可以更有效、更准确地表示单词。该技术可用于天气管理和供应链问题等方面。

  • 00:55:00 在本节中,Miquel Noguer i Alonso 讨论了金融领域深度学习的最新发展,重点是双向复杂架构、BERT 以及数字在语言模型中的重要性。 BERT 是一种开源、高效的语言模型,可用于金融数据集的训练,可以节省时间和人力。它比其他模型表现更好,特别擅长理解金融文本中的数字,这对于准确分析至关重要。多层感知器、记忆网络和 covnet 是在金融中有用的其他函数逼近器。

  • 01:00:00 Miguel Noguer i Alonso 讨论了将金融数据转换为图像并使用卷积神经网络对其进行分析的想法,这对于无监督学习问题可能特别有用。他还介绍了自动编码器的概念,可用于数据的非线性压缩,以及记忆网络,如果环境足够稳定,可能适用于时间序列分析。最后,Noguer i Alonso 提到了在金融领域使用 transformer 模型进行语言处理,以及如何在 TensorFlow 中实现这些模型。

  • 01:05:00 在视频的这一部分,ESADE 商学院金融创新总监兼金融学高级讲师 Miquel Noguer i Alonso 讨论了在金融领域实施开源深度学习模型的可行性。他解释说,有很多可用的开源代码,虽然可能需要专门针对金融应用程序的培训,但这并非遥不可及的目标。 Alonso 还强调了领域专家和机器学习者之间合作解决金融相关问题的重要性,因为机器学习在金融领域有很多机会。此外,他指出,虽然金融领域使用了手工制作的 NLP 方法,但深度学习模型尚未在该行业得到广泛采用。

  • 01:10:00 演讲者讨论了金融领域手工控制的传统方法,其中涉及人们使用字典来描述 JP Morgan 等事物并确保没有拼写错误。他们继续讨论了机器学习在金融领域的应用以及各种算法的有效性,例如短远射记忆网络和 BERT,他们认为这是目前已发表研究中的最新技术。演讲者还讨论了将机器学习用于横截面投资的潜力,并建议使用因子或回报来帮助机器理解平坦的回报或因子。

  • 01:15:00 在本节中,Noguer 和 Alonso 讨论了在深度学习中寻找最优值的困难以及它如何成为 NP 问题,需要人类数据科学家的技能和直觉根据经验和直觉做出启发式选择.他们强调了理解和解释深度网络的挑战,因为即使是数学家也很难创建方程式来理解为什么它如此有效,而必须求助于定性分析。尽管存在这些挑战,但在处理多个数据集后,数据科学家可以对用于给定情况的最佳参数产生直觉。
Miquel Noguer i Alonso: "Latest Development in Deep Learning in Finance"
Miquel Noguer i Alonso: "Latest Development in Deep Learning in Finance"
  • 2020.03.19
  • www.youtube.com
Title of Seminar: "Latest Developments in Deep Learning in Finance"Date of Seminar: 9/24/19Speaker Bio: Miquel Noguer i Alonso (Artificial Intelligence Finan...
 

Gordon Ritter:“强化学习和套利机会的发现”



Gordon Ritter:“强化学习和套利机会的发现”

在本视频中,Gordon Ritter 探讨了强化学习在金融市场环境中的应用,特别侧重于发现衍生品交易中的套利机会。他强调了面对不确定性时复杂的多时期规划和战略的重要性。 Ritter 演示了使用价值函数来指导寻找最优策略,并提出了一个奖励函数,该函数将单周期增量与常量乘以与均值偏差的平方相结合。

Ritter 讨论了创建包含套利机会的模拟的过程,但没有明确指示机器在哪里找到它。他强调使用随机模拟对金融市场进行建模,并建议在有足够数据的情况下,通过强化学习训练的代理人可以识别市场套利。然而,他承认强化学习的局限性,例如过度拟合和处理不可预见场景的挑战。建议进行进一步的测试,例如探索伽马中性交易策略,以扩展受过训练的代理人的能力。

该视频包括对强化学习代理与衍生品对冲中基线代理的性能分析。训练有素的代理人在保持类似范围的已实现波动率的同时,展示了显着的成本节约,展示了其在成本和风险之间进行权衡的能力。 Ritter 讨论了价值函数在衍生品交易强化学习中的相关性,因为衍生品价格本身可以被视为价值函数的一种形式。

Ritter 还强调了在强化学习中构建适当的状态向量和动作空间的重要性。在状态向量中包含相关信息并定义适当的操作对于有效决策至关重要。他介绍了使用 Ornstein 和 Limbic 过程作为模拟均值回归动力学的方法,这可能会带来套利机会。

此外,该视频还讨论了使用短期回报来寻找交易机会的挑战以及有限状态空间的局限性。 Ritter 建议采用连续状态空间和函数逼近方法(例如模型树和神经网络)来应对这些挑战并改进价值函数的估计。

最后,Ritter 承认,虽然强化学习可以成为发现套利机会的宝贵工具,但它并不是现实交易中的可靠方法。他最后强调了强化学习通过随机系统发现有利可图的交易的潜力,但告诫不要期望它在市场上不存在套利机会的情况下找到套利机会。还认识到强化学习的局限性,包括过度拟合及其无法处理不可预见的情况。

  • 00:00:00 在本节中,Gordon Ritter 谈到了通过经验学习,以便在不确定的环境中随着时间的推移优化奖励。他提供了机器人如何在房间内导航以及瞪羚如何通过向腿部肌肉发送信号来学习走路的示例。他还提到,世界上最好的围棋手现在是通过强化学习方法训练的代理人,这是他谈话的重点。 Ritter 强调了在存在不确定性的情况下复杂的多时期规划和策略的重要性,以及强化学习如何应用于金融以发现套利机会。

  • 00:05:00 Gordon Ritter 解释了强化学习的概念,强化学习是代理与环境交互并采取行动优化奖励信号的过程。代理人观察环境状态并确定他们的行为是否导致积极或消极的奖励。强化学习涉及使用价值函数来构建最佳策略的搜索,以最大化长期奖励的期望。 Ritter 指出,具有数学金融背景的人很熟悉价值函数的概念。

  • 00:10:00 在视频的这一部分,Gordon Ritter 讨论了强化学习的概念,特别是用于寻找最优策略价值函数的 Hamilton-Jacobi Bellman 方程。然而,他指出,在现实世界的场景中,有时明确地求解方程是不可行的。然后,Ritter 引入了动作价值函数,用于寻找在给定状态下采取特定动作并随后遵循策略的预期长期收益。强化学习的目标是通过找到与其对应的提示或动作值函数来找到最优策略。 Ritter 随后提出了人工智能能否在现实场景中发现最佳动态交易策略的问题,同时考虑到买卖差价和佣金等交易成本。他建议,如果市场上存在套利,强化学习产生的代理将能够通过足够的数据找到它。

  • 00:15:00 Gordon Ritter 讨论了使用强化学习来发现金融市场中的套利机会。 Ritter 认为,与依赖一致的无套利价格的传统方法不同,强化学习可用于发现给定动态系统中是否存在任何套利机会。这种方法可以用来训练算法找到夏普比率高的策略,可以用来识别统计套利,这不是纯粹的套利,而是一种很好的交易策略。 Ritter 声称,这种方法类似于 AlphaGo Zero,它在零人类指导下学会了下围棋并击败了人类冠军。

  • 00:20:00 Gordon Ritter 解释了在最大化财富的预期效用时使用的假设,以及它在数学上如何等同于最大化均值方差二次形式。他阐明了二次函数不能是效用函数,并解释了他用来训练理性代理人像冯诺依曼摩根斯坦投资者一样行事的奖励信号。他建议结合单个周期内的增量减去一个常量乘以奖励函数均值的平方,并建议选择将什么放入状态,强调包括有助于代理人做出正确决策的相关信息的重要性。

  • 00:25:00 Gordon Ritter 讨论了如何在强化学习中构建状态向量和动作空间。他解释说,为了让代理学会使用信号来做出交易决策,该信号必须包含在状态向量中。此外,行动空间应包括选择使用哪种执行策略,选择算法中的参数以改变其行为,或决定是否跨越价差或加入订单簿近端的队列。 Ritter 还举例说明了如何在金融中使用 Ornstein 和 Limbic 过程来模拟均值回归动态,这可能会带来套利机会。

  • 00:30:00 在本节中,Gordon Ritter 讨论了构建一个随机模拟,该模拟至少具有近似套利作为其中的统计套利,即使它不是保证利润。他强调,代理人必须通过玩游戏并输掉几次来弄清楚一切。模拟具有基于线性价格影响函数的点差成本和影响成本,有时,他喜欢在总成本前玩乘数。他说状态向量可以很简单,状态只包含代理持有的东西和价格,其中包含信号。最后,他指出这只是一个概念证明,因为它不能保证在现实生活中的交易中有效。

  • 00:35:00 Gordon Ritter 讨论了创建具有套利机会的模拟的过程,但没有明确告诉机器在哪里寻找它。他解释说,它通过学习价值函数和一种称为 Q 学习的经典方法来工作。然而,他承认他不是特别喜欢 Q 函数的模型,因为它必须独立地学习每个矩阵元素,没有连续性。 Ritter 还展示了作为各种行为价格函数的价值函数图,显示了围绕均衡价格出现的无贸易区。

  • 00:40:00 在本节中,Gordon Ritter 讨论了将短期回报用于交易机会的局限性以及使用有限状态空间时出现的挑战。他建议使用连续状态空间和函数逼近方法(例如模型树)来估计贝尔曼值函数 Q 并找到最适合训练数据的未知函数。这种方法允许更有效地逼近价值函数和寻找交易机会。

  • 00:45:00 Gordon Ritter 讨论了统计机器学习技术(例如函数逼近器)的使用,以训练强化学习代理以长期和短期奖励的形式逼近奖励。通过使用更好的函数逼近器,例如神经网络,可以更准确地逼近 Bellmen 值函数并获得连续函数,从而更好地理解最优动作。然后,里特将这些技术应用到衍生品对冲的例子中,银行希望在不向市场倾销衍生品的情况下中和头寸风险。目标是使用可以基于动态复制策略优化交易一揽子衍生品的强化学习代理,允许自动对冲并降低市场影响的成本。

  • 00:50:00 在本节中,戈登·里特 (Gordon Ritter) 讨论了欧洲期权市场中至少必须存在的状态变量,以实现动态复制投资组合策略。他指出,在 Black-Scholes 类型的世界中,用于计算 delta 的状态变量是基础价格和到期时间,而期权的执行价格是期权定义的一部分。此外,他提到状态不需要包含选项 Greeks,并且期望代理自己学习那些非线性函数。他总结说,机器只能通过经验来学习,在哪里可以通过模拟生成大量经验集。

  • 00:55:00 Gordon Ritter 讨论了他的强化学习代理的输出,该代理将成本交易为 vol,并将其与使用 Delta 对冲的基线代理进行了比较。训练有素的智能体显示 Delta 对冲的头寸跟踪更顺畅,而基线智能体由于 Delta 对冲显示出过度交易和更高的成本。受过训练的代理人学会了在成本和风险之间做出权衡,Ritter 指出,为了节省大量成本而接受一些波动是可以接受的。尽管模拟的市场交易成本很高,但训练有素的智能体的表现仍然优于基线智能体。

  • 01:00:00 在本节中,演讲者展示了模拟直方图,以比较 Delta 智能体和强化学习方法的性能。 Delta 智能体显示出高度可预测的已实现交易量,但经过训练的智能体显示出显着的成本节省,同时保持了类似的已实现交易量范围。演讲者建议进一步测试,例如查看实现伽玛中性的交易策略,这可能会被代理人发现。演讲者总结说,强化学习中基于价值函数的方法的使用与衍生品交易领域有很好的交叉,因为衍生品价格本身就是价值函数的一种形式。

  • 01:05:00 Gordon Ritter 解释说,强化学习可用于通过训练可以找到有利可图的交易的随机系统来发现套利机会。但是,如果系统在经过数百万或数十亿次模拟后仍未找到任何机会,则可能表明市场不承认套利。他还讨论了强化学习的局限性,包括过度拟合和无法处理无限交易以及闪电崩盘等不可预见的情况。
Gordon Ritter: "Reinforcement Learning and the Discovery of Arbitrage Opportunities"
Gordon Ritter: "Reinforcement Learning and the Discovery of Arbitrage Opportunities"
  • 2019.05.30
  • www.youtube.com
Seminar Date: March 20, 2019Info: Reinforcement learning is a way of training a machine to find an optimal policy for a stochastic optimal control system, ...
 

Marcos Lopez de Prado:“大多数机器学习基金失败的 7 个原因”



Marcos Lopez de Prado:“大多数机器学习基金失败的 7 个原因”

Marcos Lopez de Prado 发表了全面的演讲,概述了金融行业大多数机器学习基金失败的原因。他强调了有助于在该领域取得成功的几个关键因素的重要性。

de Prado 强调的主要因素之一是在全权委托基金方面缺乏完善的理论。他指出,由于缺乏坚实的理论基础,许多投资对话缺乏建设性和抽象的方法。如果没有指导决策的理论,全权委托基金很难与他人互动并检验他们的想法,从而导致错误的选择和潜在的损失。

De Prado 还讨论了在机器学习基金内部孤立工作的不利影响。他强调协作和沟通对于成功至关重要,并警告不要雇佣大量博士并将他们分成不同的任务。相反,他提倡以团队为基础的方法,让专家独立工作但了解彼此的专业知识,从而制定更好的战略和结果。

团队内部的专业化是 de Prado 强调的另一个重要方面。他强调了组建一支能够处理复杂系统和任务的专家团队的重要性。这些专家应该具备独立的技能,同时了解整体战略并了解同事的专业领域。这种元策略范式不仅对制定有效策略很有价值,而且对于在不确定情况下做出明智的决策(包括招聘、投资监督和定义停止标准)也很有价值。

正确处理财务数据是 de Prado 讨论的另一个关键因素。他强调需要在保留有价值的信息的同时实现数据的平稳性。他建议按分数区分数据,以保留来自先前观察的记忆信息,从而在特定点进行关键预测。此外,他建议使用一个特定的阈值来实现静止序列和原始序列之间几乎完美的相关性,而无需使用过多的内存。 De Prado 告诫不要在没有流动性未来合约的情况下使用回报,建议在大多数情况下使用单一观察。

de Prado 还解决了采样频率和适当的数据标签问题。他建议将采样频率建立在市场信息到达的基础上,而不是依赖于日常或分钟观察等传统方法。通过使用基于交易量抽样的美元条等技术,可以确保样本中包含等量的信息。适当标记观察结果,例如使用接触障碍标记方法,允许制定风险意识策略,同时考虑价格动态和被止损的可能性。

元学习的概念,即一个机器学习模型预测另一个模型预测的准确性,作为实现精确度和召回率的一种手段进行了讨论。通过组合两个独立的模型,可以使用调和平均数来平衡精确度和召回率之间的权衡。 De Prado 建议针对不同的任务采用不同的机器学习算法来优化性能。

De Prado 强调了在金融领域应用机器学习的挑战,强调人类专家在使用机器学习算法之前需要过滤数据。财务数据本质上是杂乱无章且非独立分布的,因此很难将特定观察结果与资产联系起来。此外,由于法规和法律导致金融市场不断变化,因此有必要采取谨慎而细致的方法来实施机器学习算法。简单地将财务数据插入机器学习模型并不足以在金融领域取得成功。

解决非唯一性和过度拟合问题是 de Prado 演讲的另一个重要方面。他提出了一种方法来确定观察的唯一性,建议删除包含比与测试集共享的信息更旧的信息的观察,这一过程称为“清除”。这有助于通过与交叉验证技术的假设保持一致来创建更准确的机器学习模型。 De Prado 还警告过拟合的危险,强调反复回溯测试策略可能会导致误报并随着时间的推移减少有用性。考虑发现策略所涉及的试验次数对于避免过度拟合和误报至关重要。 De Prado 建议为策略的性能设置一个高阈值,以减轻与过度拟合相关的风险。

de Prado 引入了“瘪草莓”的概念,说明许多对冲基金表现出负偏度和正超峰态,即使基金经理并没有刻意针对这些特征。这主要是因为基金经理是根据夏普比率进行评估的,而这些统计属性会夸大该比率。 De Prado 强调了在分析回报时考虑样本量和产生发现所涉及的试验次数的重要性。他告诫不要投资于实现真正的夏普比率大于零的可能性很低的策略。

de Prado 强调了在模型拟合和过度拟合之间取得平衡。他建议不要追求完美契合,因为这会导致过度自信并增加风险。相反,他建议找到一种在有效应用统计模型的同时保存重要记忆的方法。 De Prado 还告诫不要使用过于复杂的模型,因为它们会阻碍数据馈送和异花授粉,从而阻碍机器学习算法的整体有效性。

De Prado 解决了行业中某些特征或指标成为首选的现象,从而导致战略趋同。将其与人类偏好和审美塑造某些特征的狗的繁殖进行比较,他解释了特定指标的使用,例如夏普比率和负偏度的结合,如何受到对冲基金的青睐,即使最初并不是这样有针对性的。解决这一现象证明具有挑战性,因为它在没有任何特定触发事件的情况下发生。

此外,de Prado 强调了在预测时使用近期价格数据的重要性,因为它与近期的未来具有更大的相关性。他建议在使用所有可用数据时采用指数权重衰减来确定样本长度。此外,他还强调了控制试验次数和避免孤立工作环境的重要性,因为这是导致机器学习基金失败的常见陷阱。他指出,金融不同于机器学习取得重大进步的其他领域,聘请统计学家可能并不总是开发成功交易算法的最有效方法。

总之,Marcos Lopez de Prado 的演讲阐明了大多数机器学习基金在金融行业失败的原因。他强调需要完善的理论、团队协作、专业化、正确处理和区分财务数据、适当的采样和标记、解决非唯一性和过度拟合等挑战,以及在实施机器学习算法时结合人类专业知识。通过了解这些因素并采取谨慎而细致的方法,从业者可以增加在充满活力和复杂的金融世界中取得成功的可能性。

  • 00:00:00 Marcos Lopez de Prado 讨论了全权委托基金缺乏完善的理论如何阻碍人们就投资进行真正建设性和抽象的对话。在参加投资会议时,他发现大多数谈话都是轶事,没有讨论真正的理论。因此,可自由支配的资金可能无法与他人互动和检验理论。缺乏完善的理论可能会导致决策失误,并最终导致业务损失。

  • 00:05:00 在本节中,Marcos Lopez de Prado 讨论了为什么大多数机器学习基金都失败了,并指出孤立工作的问题是一个主要因素。他解释说,不可能雇用 50 名博士,让他们在孤岛中一起工作,每个人都重复完成相同的任务,没有任何协作或沟通。这通常会导致尝试多种策略,导致错误的发现、失败的实施,并最终导致基金被关闭。 Lopez de Prado 断言,制定战略需要团队的努力,而要取得成功需要多种战略。

  • 00:10:00 Marcos Lopez de Prado 强调团队内专业化的重要性,这是在金融领域成功实施机器学习的关键因素。他认为,创建一个专家团队对于构建能够处理复杂系统(如工业流程或机器学习策略)的高性能基础架构至关重要。个别专家应该能够独立工作,但仍然了解整个游戏计划,了解彼此的专业领域以及与他们相关的疑问和问题。这种元策略范式不仅对制定策略有用,而且对在不确定的情况下做出决策,包括招聘、监督投资和停止策略的标准。

  • 00:15:00 在本节中,Marcos Lopez de Prado 强调了正确处理财务数据以实现平稳性同时保留最有价值信息的重要性。区分数据是有代价的,因为它会抹去有价值的信号信息,从而无法预测任何事情。因此,他建议按分数区分数据,以保留一些关于先前观察的记忆信息,从而可以辨别一个序列是否处于进行预测的关键点。微分和固定数据的组合为经典分析提供了有用的信息。

  • 00:20:00 演讲者讨论了创建固定系列以及如何实现它。通过使用特定的阈值,可以在不使用太多内存的情况下获得与原始序列几乎完全相关的平稳序列。如果与原始序列的相关性几乎为零,则实现平稳性是无用的。此外,演讲者观察到没有流动的未来案例可以证明使用回报是合理的,并建议即使在每日数据上也不要使用它。他建议在大多数情况下使用单一观察就足够了。

  • 00:25:00 演讲者讨论了采样频率的重要性,并建议采样频率应基于到达市场的信息量,而不是使用每天或一分钟观察等规范方法。他举了一个使用 dollar bar 的例子,它基于交易量进行抽样,以确保样本包含等量的信息,而不仅仅是等量的时间或价格。演讲者还强调了在抽样时考虑价格的重要性,因为它提供了影响市场活动的关键信息。

  • 00:30:00 Marcos Lopez de Prado 讨论了在金融领域正确采样和标记数据的重要性。他解释说,当大量信息进入市场时,采集更多样本至关重要,因为它们包含更多信息。他建议使用 Touch Barrier Labeling 方法通过考虑价格发生的变化以及价格如何达到特定结果来正确标记观察结果。通过这样做,它允许人们制定一种考虑风险水平的策略,这很重要,因为大多数人需要遵循风险水平并且需要考虑被止损的可能性。

  • 00:35:00 Marcos López de Prado 讨论了元学习的概念,其中机器学习模型用于预测另一个机器学习模型的预测是否正确。他解释了将两个决策组合成两个不同模型的重要性,以及它如何有助于在机器学习算法中实现精确度和召回率。 López de Prado 还引入了调和平均数的概念,用于平衡精度和召回率之间的权衡,并建议使用不同的机器学习算法来处理两个截然不同的任务。

  • 00:40:00 在本节中,Marcos Lopez de Prado 解释了在金融领域使用机器学习的挑战。他强调了在使用机器学习算法之前让人类专家过滤数据的重要性,因为财务数据杂乱无章且非独立同分布,这意味着将特定观察与特定患者联系起来并不容易,或者在这种情况下,与特定资产联系起来.此外,由于新的法规和法律,金融市场不断变化,这可能会对机器学习模型的性能产生重大影响。因此,在金融领域使用机器学习需要谨慎而细致的方法,不能简单地通过将金融数据插入机器学习算法来实现。

  • 00:45:00 Marcos Lopez de Prado 讨论了观测值的非唯一性问题,并提出了解决该问题的方法。他建议确定每次观察中的重叠量并确定它们的独特性以得出解决方案。由于交叉验证技术假定观察值是独立且同分布的,他还建议确定应从训练集中删除哪些观察值以避免 IID 假设。这个过程称为“清除”,会删除包含比与测试集共享的信息更早的信息的观察结果,从而产生更准确的金融机器学习模型。

  • 00:50:00 在本节中,Marcos Lopez de Prado 讨论了大多数机器学习基金失败的第七个原因,即过度拟合。他解释说,即使一个策略的夏普比率为零,通过反复回测该策略,最终也可以在纸面上找到一个惊人的策略。然而,反复回溯测试可能会导致误报,并且随着时间的推移它会变得不那么有用。为了避免过度拟合和误报,人们需要聪明并在实践中考虑到他们的发现所涉及的试验次数。练习的越多,对练习的要求就应该越高。

  • 00:55:00 Marcos Lopez de Prado 解释了瘪草莓的概念,即大多数对冲基金都具有负偏度和正超峰度的想法,尽管基金经理并非有意针对这些时刻。这是因为基金经理是根据夏普比率进行评估的,在统计上,负偏度和正超峰度会夸大该比率。 De Prado 强调了在分析回报时考虑样本量和产生发现所涉及的试验次数的重要性,并警告不要投资于真正夏普比率大于零的可能性很低的策略。

  • 01:00:00 Marcos Lopez de Prado 强调了平衡模型与数据拟合和避免过度拟合之间权衡的重要性。他建议不要过分专注于实现完美契合,因为这可能会导致过度自信和风险增加。相反,他建议找到一种方法来保存记忆,同时仍然能够有效地购买和应用统计模型。 Lopez de Prado 还指出,使用过于复杂的模型会使异花授粉和提供数据变得困难。

  • 01:05:00 Marcos Lopez de Prado 解释了某些特征或指标如何成为机器学习基金和对冲基金的首选,从而导致行业融合。以饲养狗为例,由于人类偏好和审美,某些特征是首选,他将这种现象与夏普比率交易和负偏度的使用进行了比较,后者已成为对冲基金的首选组合,尽管最初并非如此有针对性的。他指出,解决这一现象具有挑战性,因为它是在没有特定事件发生的情况下发生的。

  • 01:10:00 在本节中,Marcos López de Prado 讨论了在预测时使用近期价格数据的重要性,因为它与近期更相关。他建议使用权重呈指数衰减的所有可用数据来决定样本长度。 López de Prado 还强调需要控制试验次数并避免孤岛工作,因为这些是机器学习基金失败的常见原因。此外,他强调金融不同于机器学习取得重大进步的其他领域,雇佣统计学家并不总是开发成功交易算法的最佳方法。
Marcos Lopez de Prado: "The 7 Reasons Most Machine Learning Funds Fail"
Marcos Lopez de Prado: "The 7 Reasons Most Machine Learning Funds Fail"
  • 2019.05.13
  • www.youtube.com
Seminar Date: September 5, 2017For more information, please visit Marcos Lopez de Prado's website: http://www.quantresearch.org/Summary: In this popular thro...
 

Irene Aldridge:“长期投资组合优化中的实时风险”



Irene Aldridge:“长期投资组合优化中的实时风险”

Able Alpha Trading 总裁兼董事总经理 Irene Aldridge 全面讨论了高频交易 (HFT) 对长期投资组合经理的影响以及影响整个行业的市场系统性变化。她探讨了在大数据和机器学习进步的推动下金融业日益自动化,及其对投资组合优化的影响。此外,Aldridge 深入研究了日内成交量数据带来的挑战和机遇,并提出了一种循序渐进的方法,利用大数据集成实时风险识别。她提倡采用更细微的投资组合优化策略,该策略包含微观结构因素,并建议使用因素作为防御措施。 Aldridge 还谈到了量化策略的三年生命周期、虚拟现实和自动化在数据分析中的潜力,以及计算机矩阵在投资组合优化中的应用。

在她的整个演讲中,奥尔德里奇挑战了高频交易对长期投资组合经理没有影响的误解。她认为,市场的系统性变化会影响所有投资策略,无论其时间范围如何。凭借她在电气工程、软件开发、风险管理和金融方面的专业知识,Aldridge 强调了探索实时风险评估和投资组合优化等新领域的重要性。

Aldridge 强调了金融行业向自动化的重大转变,并指出手动交易已经让位于股票、外汇、固定收益和商品交易中的自动化系统。为了保持相关性,行业参与者已经接受了大数据和机器学习技术。然而,她承认一些交易员最初的抵制,他们担心自动化会使他们的专业知识过时。

演讲者探讨了大数据的演变及其在投资组合优化中的作用。她指出,大量结构化和非结构化数据的可用性彻底改变了金融格局。 Aldridge 解释了奇异值分解 (SVD) 等技术如何支持处理大型数据集以提取有价值的见解。 SVD 越来越多地用于自动化投资组合分配,目的是整合尽可能多的数据来为投资决策提供信息。

Aldridge 深入研究了使用奇异值分解来减少数据维度的过程。通过绘制通过此过程得出的奇异值,研究人员可以识别包含重要信息的向量,同时将其余向量视为噪声。该技术可应用于各种金融数据集,包括市值、贝塔系数、价格和日内波动率。由此产生的简化数据集为研究目的提供了可靠的指导,并有助于确定长期投资组合优化的关键因素。

演讲者讨论了投资组合分析师使用的常见因素,例如价格、市场风险 (beta)、市值和股息收益率。机构活动也是一个重要因素,Aldridge 强调使用大数据来分析报价数据和检测模式。识别机构活动为市场参与者提供了可见信号,从而导致交易量增加和有利的执行。

奥尔德里奇区分了激进型和被动型高频交易策略及其对流动性的影响。以订单取消为特征的激进高频交易策略会侵蚀流动性并增加风险,而被动高频交易策略(例如做市)可以通过提供流动性来降低波动性。她指出,机构投资者偏好成交量加权平均价格,并在外汇等某些市场使用时间加权平均价格,因为在这些市场中,成交量信息可能并不总是可用。

演讲者解决了日内交易量数据带来的挑战,考虑到交易所数量众多、时间间隔缩短以及需要在多个交易所中确定最佳业务和最佳报价。尽管存在这些挑战,Aldridge 仍然看到了在切片和分析日内成交量数据方面进行创新和进一步研究的重要机会。她提到了 SEC 运行的安全信息处理器 (SIP),该处理器汇总了来自多个交易所的限价订单,但她承认在不同交易所之间协调和解决问题一直存在挑战。

Aldridge 强调了投资组合优化中未探索的微观结构因素和风险。虽然长期投资组合经理传统上关注风险回报特征而忽视微观结构因素,但奥尔德里奇建议将它们作为输入并利用大量可用数据。她提出了一种循序渐进的方法,包括使用奇异值分解来根据先前的回报预测绩效,并利用大数据来识别和解决实时风险。算法可以帮助识别和利用交易中复杂的复杂性,例如 ping 订单,这些可能会被人类交易者忽视。

在挑战传统投资组合优化的局限性时,Aldridge 引入了一种更全面的方法,将微观结构因素和其他市场动态相结合。她强调了 ETF 和闪电崩盘等因素的破坏性潜力,并强调仅靠相关矩阵可能不足以分析风险。通过考虑超越更广泛市场走势的独立微观结构因素,Aldridge 提倡一种微妙的投资组合优化策略,可以提高回报并改善夏普比率。关于她的方法的更多细节可以在她的书中找到,她欢迎听众提出有关高频交易的问题。

Aldridge 进一步研究了一天内高频交易的持续性及其对长期投资组合分配的影响。她以谷歌的日内高频交易量为例说明了这一点,该交易量在一段时间内表现出一定范围内的稳定性。 Aldridge 强调了与高价股票的高频交易相关的较低成本以及便士股票的高频交易量百分比较低。此外,她指出,编码的复杂性通常会阻止高频交易员参与高股息股票。激进的高频交易策略涉及市场订单或接近市场价格的激进限价订单。

演讲者解释了量化策略的三年生命周期,阐明了量化分析师在制定成功策略时所面临的挑战。第一年通常涉及从以前的工作中获得成功的策略并获得丰厚的奖金。第二年以创新尝试为标志,但在此期间许多人都在努力制定成功的战略。第三年,找到成功策略的人可能会获得丰厚的奖金,而其他人可能会选择离开,将之前的策略带到新公司。这有助于集中类似的高频交易策略,这些策略可能会被调整或略微修改,并且通常会在大约同一时间执行交易。奥尔德里奇强调,高频交易与其他形式的自动化一样,是有益的,不应被忽视。

Aldridge 通过讨论虚拟现实和自动化在数据分析中的潜力来结束她的演讲。她谈到了基于贝塔的投资组合和因素的有用性,以购买一双袜子与购买戴尔电脑为例,以及贝塔的变化如何不同地影响它们的价格。还强调了在工作日规范化回报和解决随机性的重要性。奥尔德里奇建议使用因子作为一种防御形式,并强调使用因子可能是一种令人愉快的方法。

在一节中,奥尔德里奇解释了计算机矩阵在确定投资组合中每只股票的重要性或系数方面的应用。该矩阵结合了方差协方差和收缩技术来调整回报并获得更精确的结果。通过识别前几天回报的模式,该矩阵可以预测未来的结果并优化投资组合。虽然所讨论的玩具模型代表了一个基本示例,但它举例说明了使用计算机矩阵进行长期投资组合优化的潜力。

总而言之,艾琳·奥尔德里奇 (Irene Aldridge) 的演讲就高频交易对长期投资组合经理的影响以及金融业不断发展的格局提供了宝贵的见解。她强调了自动化、大数据和机器学习在投资组合优化中的作用。 Aldridge 讨论了日内成交量数据带来的挑战和机遇,提倡纳入微观结构因素,并提出了一种实时风险识别的分步方法。她的想法有助于更细致地理解投资组合优化,并突出了虚拟现实和数据分析自动化的潜力。 Aldridge 的综合方法鼓励投资组合经理接受技术进步并利用大量可用数据做出明智的投资决策。

此外,Aldridge 强调了考虑传统投资组合优化中经常被忽视的微观结构因素的重要性。通过将 ETF 和闪电崩盘等因素纳入分析,投资组合经理可以更准确地了解市场动态和相关风险。她挑战了仅相关矩阵就足以进行风险分析的观点,并提出了一种考虑独立微观结构因素的更复杂的方法。这种方法有可能提高投资组合回报并改善风险调整后的业绩。

奥尔德里奇还阐明了高频交易的错综复杂的世界。她讨论了激进型和被动型高频交易策略之间的区别,强调了它们对市场流动性和波动性的影响。虽然涉及取消订单的激进策略可能会削弱流动性并增加风险,但专注于限价订单和做市的被动策略可以提供流动性并降低波动性。了解高频交易的动态及其对投资组合分配的影响对于长期投资组合经理来说至关重要。

此外,Aldridge 还讨论了与日内成交量数据相关的挑战和机遇。随着多次交换和时间间隔的缩短,有效地分析和解释这些数据可能会很复杂。然而,Aldridge 将此视为创新和进一步研究的机会。她提到了由 SEC 运营的安全信息处理器 (SIP),该处理器汇总来自各个交易所的限价订单,以确定最佳业务和最佳报价。然而,她承认协调和解决不同交易所之间的问题仍然是一个挑战。

Aldridge 的演讲还强调了使用因子作为投资组合优化防御形式的重要性。通过考虑传统风险回报特征之外的各种因素,投资组合经理可以获得更深入的见解并改进他们的决策过程。市值、贝塔系数、价格和日内波动等因素可以为优化长期投资组合提供有价值的信息。

最后,Aldridge 谈到了虚拟现实和自动化在数据分析中的潜力。这些技术进步为分析复杂的金融数据和加深对市场动态的了解提供了新的可能性。通过利用自动化的力量和利用虚拟现实工具,投资组合经理可以增强他们的数据分析能力并做出更明智的投资决策。

总之,艾琳·奥尔德里奇 (Irene Aldridge) 关于高频交易的影响和不断变化的金融格局的讨论为长期投资组合经理提供了宝贵的见解。她对自动化、大数据和机器学习的探索突出了这些技术在投资组合优化方面的变革潜力。通过结合微观结构因素,将因素作为一种防御形式,并采用技术进步,投资组合经理可以适应不断变化的市场动态,并为实现最佳的长期投资组合绩效创造新的机会。

  • 00:00:00 Irene Aldridge 讨论了高频交易不会影响长期投资组合经理的误解。虽然许多经理人声称他们可以长期持有资产,从而避免高频交易的影响,但奥尔德里奇认为,它实际上确实会影响长期投资组合经理。她解释了市场的系统性变化及其对每个人的影响如何对投资组合经理产生影响,无论他们的投资策略是长期的还是短期的。 Aldridge 拥有电气工程、软件开发、风险管理和金融方面的背景,她的工作包括探索实时风险和投资组合优化等新领域。

  • 00:05:00 在本节中,演讲者讨论了金融行业向自动化的转变,以及十年前大多数交易是如何手动完成的。然而,现在自动化不仅在股票交易中变得普遍,而且在外汇、固定收益和商品交易中也变得普遍。自动化的目标是取代人工交易,那些在行业中保持相关性的人已经接受了大数据和机器学习以保持最新状态。然而,一些交易员拒绝与计算机分享他们的知识,担心这会导致立即自动化和他们自己的过时。

  • 00:10:00 Irene Aldridge 谈论大数据的演变及其在投资组合优化中的应用。她指出,就在几年前,大多数金融机构还无法访问大量数据,但这种情况已经改变,现在有结构化和非结构化数据的数据库,可以以不同的方式处理这些数据以产生有用的见解。其中一种方法是奇异值分解 (SVD),它将大量数据简化为更易于管理的形式。 Aldridge 解释了如何使用 SVD 来自动化投资组合分配,这是一个处于自动化边缘的行业。尽管一些公司仍然使用研究人员来分析月度数据并根据这些数据做出投资决策,但趋势是尽可能多地结合数据来为投资决策提供信息。

  • 00:15:00 Irene Aldridge 讨论了通过奇异值分解减少数据维度的过程。通过绘制通过此过程提取的奇异值,研究人员可以确定哪些向量包含重要信息,并专注于保留这些向量,同时将其余向量视为噪声。该技术可应用于各种数据集,包括市值、贝塔系数、价格和日内波动率等金融数据。由此产生的简化数据集为研究目的提供了可靠的指导,并有助于确定长期投资组合优化的重要因素。

  • 00:20:00 在本节中,Irene Aldridge 讨论了投资组合分析师常用的因素,例如价格和市场风险或贝塔系数。市值和股息收益率也是投资组合优化中使用的因素,这些因素包含在 MSCI、Barra 等公司使用的框架中。 Aldridge 解释了他们如何使用滴答数据的大数据来估计机构活动并寻找数据中的特定模式。机构活动很重要,因为它是市场参与者的可见信号,这可能导致其他市场参与者的突然出现,导致订单量增加,从而有利地执行订单。

  • 00:25:00 Irene Aldridge 讨论了激进型和被动型高频交易策略之间的区别,这两种策略都会影响流动性。激进的高频交易策略可能是 alpha 驱动的并且涉及大量订单取消,这会侵蚀流动性并增加风险,而被动高频交易策略涉及纯粹的限价订单,如做市,可以通过提供更多流动性来减少波动性。机构投资者更喜欢成交量加权平均价格,而时间加权平均价格仍在一些市场中使用,例如外汇市场,这些市场的成交量并不总是可用。总的来说,高频交易是一个既有好处也有风险的复杂话题。

  • 00:30:00 在本节中,Irene Aldridge 讨论了数据列的结构以及日内交易量数据带来的挑战,考虑到大量交易所、变化的时间间隔越来越短,以及寻找最佳业务和多个交易所中最好的报价。尽管面临挑战,但她认为日内成交量数据可以通过多种不同方式进行分割,并为创新和进一步研究提供了机会。她还提到了由 SEC 运行的安全信息处理器 (SIP),该处理器汇总来自多个交易所的限价订单并确定最佳业务和最佳报价,但指出协调和解决不同交易所之间的问题仍然是一个挑战。

  • 00:35:00 演讲者解释说,虽然长期投资组合经理主要关注风险回报特征而不关心执行,但有许多完全未探索的微观结构和风险因素可以用作输入,如以及可以提供新信息和见解的大量数据。他们提出了一种循序渐进的方法,涉及使用奇异值分解来根据先前的回报预测绩效,并利用大数据来识别和解决实时风险。演讲者还指出,交易所中有很多 ping 订单和其他复杂性,人类交易者并不总是很明显,但可以使用算法识别和利用。

  • 00:40:00 在本节中,Irene Aldridge 讨论了传统投资组合优化对长期投资的局限性,并介绍了一种将微观结构和其他市场因素整合到优化过程中的新方法。她解释了 ETF 和闪电崩盘等因素如何扰乱市场,以及相关矩阵可能不足以分析风险。通过考虑独立于较大市场变动的微观结构因素,Aldridge 提出了一种更细致的投资组合优化方法,可以提高回报率和夏普比率。她指出,她的书中更详细地介绍了她的方法,并回答了听众关于高频交易的问题。

  • 00:45:00 Irene Aldridge 解释了一天内高频交易的持续性以及它如何影响长期投资组合分配。她指出,虽然日内高频交易量可能在 0 到 100 之间,但随着时间的推移,谷歌的交易量一直相当稳定,例如在 36-42% 之间。这种稳定性也适用于其他股票。高频交易在交易价格较高的股票时成本较低,而细价股的高频交易量百分比较低。此外,由于编码复杂性,高频交易者倾向于避免高股息股票。激进的高频交易是使用市场订单或接近市场价格的激进限价订单的交易。

  • 00:50:00 Irene Aldridge 解释了量化策略的三年生命周期,在第一年,量化策略从他们以前的工作中带来了成功的策略并获得了丰厚的奖金,在第二年他们尝试创新但许多人努力制定一个成功的策略,在第三年,如果他们发现了一些好东西,他们可能会获得丰厚的奖金,否则他们就会离开并把以前的策略带到新店。这有助于集中类似的高频交易策略,这些策略可以被调整或略微修改,并且通常几乎同时执行。奥尔德里奇认为高频交易是好的,不可原谅,因为它是自动化的,就像清洁地板的机器人或控制供暖和制冷的家庭自动化系统一样。

  • 00:55:00 Able Alpha Trading 总裁兼董事总经理 Irene Aldridge 讨论了虚拟现实和数据分析自动化的潜力。她还谈到了基于 beta 的投资组合和因素的有用性,举例说明了购买一双袜子与购买戴尔电脑以及 beta 的变化如何不同地影响它们的价格。她强调了回报正常化的重要性,并解决了工作日的随机性问题。最后,Aldridge 介绍了使用因子作为一种防御形式,并建议使用因子可以很有趣。

  • 01:00:00 在本节中,Aldridge 讨论了使用计算机矩阵来确定投资组合中每只股票的重要性或系数。矩阵的行代表每只股票,第一行代表苹果,其他行是不同股票的市场数据。通过结合方差协方差和收缩,矩阵可以结合回报并进行调整以达到更具体的结果。这是通过在前几天的回归中找到 X-mas 并从那里进行预测来完成的。虽然所描述的玩具模型只是一个基本示例,但它展示了如何使用计算机矩阵来优化投资组合。
 

量化交易基础



量化交易基础

在这段关于量化交易基础的视频中,算法交易员 Shaun Overton 讨论了算法交易中涉及的挑战和机遇。 Overton 解释说,数据收集、分析和交易是算法交易中涉及的三个简单问题,尽管由于找到高质量的数据和适当的分析,这个过程可能会变得复杂。选择具有良好数据和功能的正确平台来满足交易者的目标可能具有挑战性,最受欢迎的平台是 MetaTrader、NinjaTrader 和 TradeStation,具体取决于交易者喜欢的交易类型。 Overton 还讨论了在真实市场交易时爆仓的严酷现实,以及管理风险的重要性。此外,他还解释了量化交易员如何预测市场的过度波动,并讨论了货币战争的影响。

YouTube 上的“量化交易基础”视频涵盖了算法交易的各种策略,包括情绪分析和基于图表线的长期策略;然而,最大的回报是在大尾巴事件和趋势期间获得的。视频的与会者讨论了用于回测的不同平台、集成多个平台进行交易分析的挑战,以及对交易策略形式化和自动化的日益增长的兴趣。一些长线交易者寻求自动化,因为他们已经在游戏中待了很长时间,推荐使用编程语言 NinjaTrader,但有局限性。

  • 00:00:00 算法交易员 Shaun Overton 解释了算法交易中涉及的三个简单问题:数据收集、分析和交易。然而,由于寻找高质量数据和正确分析等障碍,这个过程可能会变得复杂,尤其是在交易需要仔细检查数据的情况下。不建议使用免费期权进行交易,因为它们可能包含重复数据或数据缺口。此外,使用付费选项超出了零售商的范围,因为每台仪器可能要花费数千美元。尽管如此,可以通过使用提供软件和经纪人 API 的平台来简化交易。

  • 00:05:00 演讲者讨论了可用于分析数据和进行交易的不同软件选项。最受欢迎的外汇交易平台是 MetaTrader、NinjaTrader 和 TradeStation,具体取决于您喜欢的交易类型。 MetaTrader 绝对是最受欢迎的,全世界有超过一千家经纪商提供它。演讲者解释说,使用像这些期权这样的预建平台可以使交易和分析数据更加直接,并且避免了在交易时多次重新编码分析的需要。演讲者还介绍了每个平台使用的不同编程语言。

  • 00:10:00 演讲者讨论了量化交易的不同平台,并解释了 Multicharts 是如何通过复制 TradeStation 的平台和语言而流行起来的。但是,语言之间存在差异,并不总是完全兼容。演讲者还谈到了数据在量化交易中的重要性以及每个平台带来的挑战。他指出,MetaTrader 使用简单,但不够复杂,无法进行更复杂的分析,而且提供的数据质量通常很差。总的来说,演讲者强调了谨慎选择具有良好数据和功能的平台以满足交易者目标的重要性。

  • 00:15:00 Shaun Overton 讨论了为量化交易策略收集和存储数据的挑战。他解释了尝试存储多年的测试数据的困难,以及由于服务器限制,经纪人对获取数据的限制。他指出,虽然 MetaTrader 提供免费数据,但不是高质量数据,而 NinjaTrader 提供优质数据,但需要设置陡峭的学习曲线。他还警告说,针对特定经纪商的编程策略存在危险,因为它将交易者与该特定经纪商结合在一起,如果他们不满意,就很难转换。他列出了交易员可能对经纪人不满的原因,包括糟糕的服务和糟糕的执行。

  • 00:20:00 Shaun Overton 解释了经纪人为从交易者及其交易中赚钱而玩的一些问题和游戏。经纪人可以操纵市场定价和交易,通过显示一个价格然后让交易者接受更差的价格来迫使交易者为他们的交易支付更多费用。此外,交易者可能会因延迟不佳或软件故障而收到糟糕的执行。目前,算法交易的最大问题是制度化的腐败以及机构如何因技术事故从交易者那里窃取资金,以及暗池和其他有自己的规则来操纵交易的交易场所。

  • 00:25:00 演讲者讨论了特定经纪商平台在量化交易方面的局限性。虽然它们对于极其简单的策略可能是有效的,但它们有局限性并且无法支持任何更复杂的策略。演讲者推荐稳定的平台,如 NinjaTrader 和 MultiCharts,它们具有良好的研究质量并允许自定义编程和 GUI 调整。然而,发言人警告说,这些平台不适合管理投资组合或运行基金,因为它们缺乏与多个图表对话的能力,并且需要大量的体力劳动。

  • 00:30:00 Shaun Overton 讨论了一个严酷的现实,即在现场市场交易时很容易炸毁账户,其中 90-95% 的账户会在 6 个月或一整年内关闭。经纪人有两种赚钱方式,通过佣金或风险,通常更流行和更有利可图的方式是承担交易损失。普通交易者在波动率低时赚钱,但在波动率高时,他们就会遭受损失。谈到风险管理,但对大多数人来说,这只是空谈,他们因不管理风险而继续亏损。

  • 00:35:00 Shaun 讨论了波动性如何影响量化交易策略,以及散户交易者如何在市场预测中往往出错。他解释了可以访问客户账户的经纪人如何跟踪多头头寸与空头头寸的比率,以及如何使用此信息来预测过度波动。 Overton 指出,此类信息的获取范围越来越广,MyFxBook 和 OANDA 等网站发布了有关市场定位的数据。然而,他警告说,虽然这些信息对经纪人来说可能是一座金矿,但它可能无法提供稳定的现金流,并可能导致一段时间内的巨额亏损。

  • 00:40:00 肖恩·奥弗顿 (Shaun Overton) 讨论了量化交易员调查大型银行客户资金以根据某个方向的交易百分比制定多头和空头策略的潜力。他还评论了散户投资者对参与股市的怀疑态度,特别是考虑到最近的负面消息,导致自上次崩盘以来撤资数十亿美元。奥弗顿还提到了 CNBC 最近关于大型基金经理及其对大公司股票影响的新闻报道,展示了机构资金在推动市场方面的力量。

  • 00:45:00 讨论了由于交易者的平均账户规模,机构交易(尤其是外汇交易)在市场上的影响力可能不如零售交易。然而,更大的估值和更大的交易金额会导致更多的人乱价,甚至像醉酒交易这样的小事件也会对市场产生影响。货币的主要驱动力是利率,这是一场所有人都想要零利率的货币战争,更难确定哪个国家的货币最弱。最后,分析了日本货币对美元日元的历史以及其价格下跌与美元走弱和日元走强之间的关系。

  • 00:50:00 Shaun Overton 讨论货币战争对出口商的影响。他解释了当他们经营的货币价值增加时,丰田等出口商如何受到严重影响。奥弗顿表示,目前主要货币之间存在货币战争,各国都试图让自己贬值,每个人都在争相归零。因此,交易员需要推测谁将在破坏货币方面做得最差,因为他们将是这种环境中最好的。奥弗顿认为,美元目前是一场灾难,但是迄今为止最好的一场灾难。特定国家的社会风险和事件,例如 9 月 11 日和福岛灾难,也会影响货币价格。

  • 00:55:00 演讲者讨论了清淡市场交易和异国货币交易。有人提到,对于算法交易,您需要流动性和低点差,这使得很难用南非兰特或土耳其里拉等不太受欢迎的货币进行交易。此外,这些货币的点差可能是欧元兑美元交易成本的 8 或 9 倍,这使得获利具有挑战性。关于账户中少于 50k 的人的策略,演讲者提到了关注期货市场交易者持仓报告等内容以深入了解市场头寸的重要性。

  • 01:00:00 一组讨论算法交易的各种策略,包括情绪分析和基于图表线的简单长期策略。交易的挑战在于理解回报的分布,因为大多数时候它只是噪音。然而,最大的回报是在大尾事件和趋势期间获得的。因此,最好的策略不是持续赚钱,而是抓住机会。尽管渴望信号和行动,但最好让市场按照它的意愿行事。还提到了分析市场数据的程序 Quantopian。

  • 01:05:00 在本节中,“量化交易基础”YouTube 视频的参与者讨论了他们用于回测和优化的不同平台,以及集成多个平台进行交易分析和策略开发的挑战。虽然一些与会者指出 Quantopian 提供了一个用于个人分析的平台,并正在与经纪人协商合同以解决平台集成挑战,但其他与会者讨论了 NinjaTrader 等平台的局限性以及将它们与其他平台集成的困难,一些人强调了这样一个事实:更适合手动交易或作为简单的回测工具。此外,肖恩·奥弗顿 (Shaun Overton) 指出,他的业务是围绕交易者自己的策略的形式化和自动化而建立的,与会者指出,个人交易者和市场都对形式化和自动化他们的交易策略表现出越来越大的兴趣。

  • 01:10:00 参加量化交易研讨会的交易员询问自动化某些交易策略的好处。发言人肖恩·奥弗顿 (Shaun Overton) 指出,一些已经在游戏中工作了 10 年、20 年甚至 30 年的交易员只是想将他们的策略自动化,这样他们就不必再整天监控它们了。在讨论特定于交易的编程语言时,Overton 支持 NinjaTrader,因为它在 C Sharp 上运行,但指出在其中可以完成的工作存在局限性。
Basics of Quantitative Trading
Basics of Quantitative Trading
  • 2013.02.26
  • www.youtube.com
http://www.onestepremoved.com/ Shaun Overton speaks to the meetup group Dallas Algorithmic Traders about quantitative trading. Most members of the audience h...
 

什么是量化交易员?



什么是量化交易员?

“什么是量化交易员?”是 Michael Halls-Moore 深入研究量化交易世界的视频,解释了如何使用数学和统计学来制定交易策略和分析市场低效率。虽然量化基金主要关注短期策略,但演讲者强调还使用了低频和自动化方法。机构交易者优先考虑风险管理,而零售交易者则受利润驱动。有效的市场制度检测至关重要,但由于市场中存在随机事件,因此具有挑战性。建议量化交易者不要仅仅依赖单一模型,而是要不断研究和测试新模型,以解释已知和未知的市场动态。尽管存在风险,但成功的量化交易者可以获得令人印象深刻的 35% 的年费用回报率。

在视频中,Michael Halls-Moore 对“量化交易员”的概念提供了深刻的见解。他解释说,量化交易员在金融领域运用数学和统计技术,利用计算和统计方法。他们的工作涵盖广泛的活动,从编程交易结构到进行深入研究和开发稳健的交易策略。虽然买卖规则发挥作用,但它们并不是唯一的焦点,因为量化交易员在一个更大的系统中运作,而信号发生器只是其中的一个组成部分。

量化基金通常从事高频交易,并努力优化市场资产中的技术和微观结构。量化交易涉及的时间范围可能相差很大,从几微秒到几周不等。零售交易者有很大的机会采用高频策略。

与普遍看法相反,量化交易不仅仅专注于高频交易和套利。它还结合了低频和自动化策略。然而,由于他们利用系统中物理效率低下的科学方法,量化基金主要集中在短期策略上。演讲者强调了融合科学和交易背景以在量化交易领域蓬勃发展的重要性。

零售交易者和机构交易者之间的显着区别在于他们的风险管理方法。零售交易者主要受利润动机驱动,而机构交易者优先考虑风险管理,即使这意味着牺牲潜在回报。机构交易员秉承风险至上的心态,强调尽职调查、压力测试和下行保险政策,以有效降低风险。

风险管理涉及各种技术,例如使用凯利准则等数学框架根据账户净值调整杠杆。更保守的交易者选择减少回撤以实现可控的增长率。 VIX 等领先风险指标被用来衡量未来的波动性。在这些交易中,风险管理系统比入场系统更重要。虽然在趋势跟踪中采用了止损,但均值回归策略要求重新评估和探索不同的场景和历史数据以进行回撤计划。在实施交易算法之前,会进行回溯测试以有效管理风险因素。

该视频深入探讨了过滤掉交易策略并使用回测作为过滤它们而不是直接将其投入生产的工具的重要性。它强调了在前进过程中预期更严重的回撤并利用过滤机制来确定实施策略的适用性的重要性。然后,对话深入探讨了纳西姆·尼古拉斯·塔勒布 (Nassim Nicholas Taleb) 对肥尾理论的信念,并探讨了如何利用机器学习技术来应用区间交易和趋势交易策略,从而实现市场机制检测。

有效的市场制度检测是量化金融的一个重要方面。然而,由于它依赖于随机事件,例如利率下降和市场趋势,它带来了挑战。更成熟的公司跟踪基本数据并将其纳入他们的模型以加强市场制度检测。交易时,股票或 ETF 的选择取决于具体市场,选择合适的资产可能是一项复杂的任务。演讲者强调,数学模型和市场基本面的结合对于有效防御黑天鹅事件至关重要,因为之前的高波动期可以为预测未来的波动性和市场变化提供洞察力。

该视频进一步探讨了与量化交易相关的潜在回报和风险。量化交易员有可能获得令人印象深刻的 35% 的年回报率,尤其是在拥有扎实的教育背景(如博士学位)和高效的管理流程的情况下。然而,当底层硬件或交易所发生变化时,高频量子可能会面临挑战,可能导致系统崩溃。

尽管存在风险,但通过长期利用盈利机会实现 15% 至 20% 的持续回报被认为是有利的。量化交易者不会依赖单一的神奇算法,也不会在遇到问题时惊慌失措。相反,他们深入研究可能分析起来很复杂但提前准备应对潜在挑战的统计特性。

该视频强调了在量化交易中避免过度依赖单一模型的重要性。模型无法准确预测所有未来事件,历史上的华尔街崩盘和模型缺陷导致的投资失败就是明证。量化交易员必须不断研究和测试新模型,评估其表现。回撤期是交易过程中固有的一部分,交易者必须准备好驾驭它们。

总而言之,虽然一些交易者可能过于专注于微观管理他们的模型,但了解模型是否考虑了所有市场动态,包括未知的未知数,是至关重要的。量化交易者应采用多维方法,将数学模型与市场基本面相结合,以全面了解市场行为。通过不断完善和多样化他们的策略,量化交易者可以增加他们在不断变化的金融环境中取得成功的机会。

  • 00:00:00 在本节中,Michael Halls-Moore 解释了“量化交易员”的含义,即以计算和统计方式在金融领域使用数学或统计学的人。这可以从编程交易结构到研究核心交易和制定策略。买卖规则的重要性不如其他方面那么重要,信号发生器只是一个更大系统的一部分。量化基金通常处理更高频率的交易,并专注于优化市场资产中的技术和微观结构。量化交易者的典型时间范围从几微秒到几周不等,而零售交易者最大的机会在于更高频率的策略。

  • 00:05:00 在本节中,我们了解到量化交易不仅仅是高频交易和套利,它还包括低频和自动化策略。然而,由于其利用系统中物理低效的科学方法,量化基金通常侧重于短期策略。演讲者认为,兼具科学和交易背景对于成功进行量化交易至关重要。在风险管理方面,他指出了零售交易和机构交易之间的文化差异,后者具有风险至上的心态,并强调尽职调查、压力测试和下行保险政策。

  • 00:10:00 在本节中,视频讨论了散户和机构交易者在风险管理方面使用的不同方法。零售交易者主要以利润为导向,而机构交易者则专注于风险管理,即使潜在回报只是可能回报的一小部分。该视频提到凯利标准是一种根据账户净值调整杠杆的数学方法,更保守的交易者选择减少回撤以实现更可控的增长率的幻灯片。此外,VIX 等领先风险指标用于查看未来的波动性。在这些交易中,风险管理系统比入场系统更重要,在趋势跟踪中使用止损,但在均值回归中不使用,交易员在均值回归中重新思考和探索不同的情景和历史来制定回撤计划。在开始交易算法之前,会进行回测阶段以管理风险因素。

  • 00:15:00 在本节中,采访者和量化交易员讨论了过滤交易策略的重要性,以及如何使用回溯测试作为过滤策略的手段,而不是将其投入生产的手段。他们强调了在前进过程中预期更严重的回撤以及使用过滤机制来确定策略是否适合实施的重要性。然后谈话转向 Taleb 对肥尾理论的信念,以及未来如何使用机器学习技术应用区间交易和趋势交易策略来确定市场机制的转变。

  • 00:20:00 在本节中,演讲者强调了量化金融中有效市场机制检测的重要性。问题是,很难记住这一点,因为它依赖于纯粹的随机事件,例如利率下降和市场趋势。虽然检测市场机制很棘手,但更成熟的公司将跟踪基本数据并将其纳入他们的模型。交易时,根据交易对象的不同,有不同数量的股票或 ETF 可供选择,选择合适的股票可能会很棘手。此外,演讲者认为,黑天鹅防御取决于数学模型和市场基本面的结合,因为之前的可怕波动可以使人们预测未来的波动和市场变化。

  • 00:25:00 在本节中,视频解释了量化交易者可以预期的回报以及它给他们带来的风险。在博士学位和高效管理流程的帮助下,量化交易员每年可以获得 35% 的费用回报。然而,高频量子可能会因底层硬件或交易所的变化而受到影响,导致他们的系统崩溃。尽管存在这些风险,但从长远来看,在开发可能这样做的事情上获得 15% 到 20% 的回报是一个不错的回报。量子交易者既没有单一的神奇算法,也不会在遇到问题时惊慌失措。他们预计会经历一些难以分析和提前准备的统计特性。

  • 00:30:00 在本节中,演讲者讨论了在量化交易中过度依赖单一模型是不可取的,因为模型无法准确预测所有未来事件。他列举了主要由于模型缺陷导致的典型华尔街崩盘和投资失败的例子。演讲者强调了不断研究新模型并检查其性能的重要性;但是,总会遇到回撤期。总之,虽然一些交易者可能会微观管理他们的模型,但必须了解该模型是否考虑了所有市场动态或未知的未知数。
What is a quant trader?
What is a quant trader?
  • 2013.12.02
  • www.youtube.com
http://www.onestepremoved.com/ Shaun Overton interviews Michael Halls-Moore, a quantitative developer. Mike jumped from postgraduate school straight into alg...
 

PyCon 加拿大 2015 - Karen Rubin:建立量化交易策略(主题演讲)



PyCon 加拿大 2015 - Karen Rubin:建立量化交易策略(主题演讲)

继续讨论,Karen Rubin 深入探讨了她对财富 1000 强公司女性 CEO 的研究的发现和见解。分析显示,女性 CEO 的回报率为 68%,而男性 CEO 的回报率为 47%。然而,凯伦强调,她的数据尚未证明女性 CEO 的表现优于男性。她认为这项研究在高收入和高市值公司中是一个有趣的概念。

受到她的发现的启发,Karen 强调了多元化在金融和科技行业的重要性。她鼓励更多女性加入该领域并参与制定投资策略。她认为,结合投资女性 CEO 等理念,有助于创建多元化和包容性的基金。

扩大讨论范围,Karen 谈到了可能影响 CEO 成功的其他因素,包括他们的性别、招聘方式(内部或外部),甚至他们的出生月份。她承认这样一种理论,即当组织表现不佳时,公司可能会任命女性 CEO,然后用男性 CEO 取而代之,以从重组中获益。然而,到目前为止,Karen 还没有能够对这一理论进行套利。此外,她指出,在 CEO 发布公告后,股价通常会下跌,但她仍然不确定这种趋势在女性和男性 CEO 之间是否存在差异。

最后,Karen 强调,为 CEO 制定量化交易策略需要考虑各种因素并进行全面分析。虽然她的研究为女性 CEO 的绩效提供了宝贵的见解,但她强调需要进一步研究和探索,以更全面地了解行政领导中的性别动态及其对投资结果的影响。

  • 00:00:00 在这一部分中,演讲者介绍了她自己以及她编写算法投资市场的经验。作为众包对冲基金 Quantiacs 的产品副总裁,她需要编写一种算法来了解用户的行为,以便为他们构建有效的软件。在阅读瑞士信贷的性别报告后,她对投资女性 CEO 产生了兴趣,并想知道她是否可以制定一种策略,从历史上看女性 CEO,并在她们不再担任 CEO 时出售。

  • 00:05:00 在本节中,Karen Rubin 讲述了她在构建量化交易策略时采取的初始步骤。她需要获得特定时间段内所有女性 CEO 的历史名单,以便模拟一段时间内发生的事情。 Karen 解释说,在项目的早期阶段,获取和清理数据占用了她大量的时间,因为她必须手动搜索和分析每位 CEO 的开始和结束日期以及相应的股票代码。她还谈到了在分析之前确保定价数据准确和清理的挑战。尽管样本量很小,但卡伦继续推进她的研究。

  • 00:10:00 在本节中,Karen Rubin 解释了她在算法交易中的回溯测试过程以及模拟在她的策略中的作用。她模拟自己的策略,就好像她在实际市场上交易一样,通过查看历史数据并根据她的女性 CEO 名单为她做出买卖决策。她将她的第一个算法版本与标准普尔 500 指数作为基准进行了比较。但是,由于她在之前的策略中没有考虑杠杆作用,因此后来在常驻量化分析师的帮助下重写了她的策略。

  • 00:15:00 在视频的这一部分,Karen Rubin 讨论了她如何重新平衡她的交易策略以确保所有公司的投资组合权重相等。她的算法买卖公司并计算她的投资组合的价值,以确保她不会亏本或在未来不得不借钱进行购买。她还讨论了她从 Reddit 和 Hacker News 社区收到的反馈,他们质疑她的策略是否依赖于雅虎和阿里巴巴的股价。她将雅虎从她的策略中剔除以检验这一理论,并发现虽然它影响了整体回报,但它并不是这些回报的唯一原因。

  • 00:20:00 在本节中,演讲者讨论了如何通过创建行业中立的投资组合来避免行业偏见。通过将投资组合数量除以行业数量,该行业内的每家公司都获得了相同数量的投资。例如,如果医疗保健公司有 3 家公司,它们的分配将分成三分之一,而拥有大约 20 家公司的 Consumer Cyclical,每家公司将获得分配给该行业的总额的二十分之一。演讲者策略的最终回报率为 275%,而等权重基准回报率为 251%,标准普尔 500 指数回报率为 122%。虽然一些人认为标准普尔 500 指数等基准在哲学上并不准确,因为其公司的权重不相等,但 RSP Guggenheim Equal Weight S&P 500 指数为比较目的提供了更好的基准。

  • 00:25:00 在本节中,Karen Rubin 讨论了在投资女性 CEO 时寻找正确基准的挑战。她强调,虽然财富 1000 强基准似乎是正确的选择,但购买其历史成分股名单的成本很高。相反,她创建了 Quanto 1000,这是一个新的基准,通过按收入对所有公司进行排名并选择前 1000 家公司。将她的算法的回报与 Quanto 1000 和标准普尔 500 进行比较,她发现该算法以 43% 的优势优于其他两个基准不同之处。她还探索了 Event Fessor 关于 CEO 变动的新数据集,这使她能够在男性和女性 CEO 之间创建比较策略。结果表明,在女性 CEO 上任之日并在她们离职之日停止投资的策略在七年期间的回报率为 28%,而男性 CEO 的回报率为 44%。

  • 00:30:00 在本节中,Karen 详细介绍了她对财富 1000 强公司女性 CEO 的研究结果。分析显示,女性 CEO 的回报率为 68%,而男性 CEO 的回报率为 47%。然而,Karen 认为她的数据并未表明女性 CEO 的表现优于男性。她认为这项研究提供了一个关于高收入和高市值公司女性 CEO 的有趣想法。 Karen 希望鼓励金融和科技行业的多元化,并邀请更多女性加入该领域。她相信引入像投资女性 CEO 这样的想法来创建多元化基金的重要性。

  • 00:35:00 在本节中,演讲者讨论了影响 CEO 成功的各种因素,包括他们的性别、内部或外部招聘以及出生月份。她还阐述了这样一种理论,即公司会在业绩不佳时聘请女性 CEO,然后用男性 CEO 取而代之,以从重组中获益。然而,她一直无法套利这一理论。此外,她指出,在 CEO 发布公告后,股价通常会下跌,但她不确定女性 CEO 与男性 CEO 的这种趋势是否不同。总的来说,在为 CEO 制定量化交易策略时,需要考虑很多因素。
PyCon Canada 2015 - Karen Rubin: Building a Quantitative Trading Strategy (Keynote)
PyCon Canada 2015 - Karen Rubin: Building a Quantitative Trading Strategy (Keynote)
  • 2015.11.24
  • www.youtube.com
PyCon Canada 2015: https://2015.pycon.ca/en/schedule/67/Talk Description:Upon joining Quantopian, in order to understand her users better, Karen Rubin embark...
 

Ernie Chan 博士的量化交易机器学习网络研讨会



Ernie Chan 博士的量化交易机器学习网络研讨会

金融界知名人士 Ernie Chan 博士分享了他对机器学习在交易中的见解和经验。他首先回顾了自己早期将机器学习应用于交易的尝试,并承认最初并没有取得成功。陈博士强调了解机器学习在交易中的局限性的重要性,尤其是在数据可能不足的期货和指数交易中。

然而,他强调了机器学习在应用于个别科技股、订单簿数据、基本面数据或新闻等非传统数据源时在生成有利可图的交易策略方面的潜力。为了解决数据可用性和数据窥探偏差的局限性,Chan 博士建议使用重采样技术,例如过采样或装袋。这些技术有助于扩展数据集,但在将它们用于交易策略时,保留时间序列数据中的序列自相关性至关重要。

特征选择在机器学习在交易中的成功应用中起着至关重要的作用。 Chan 博士强调了通过选择相关特征或预测变量来减少数据采样偏差的重要性。他解释说,虽然许多人认为特征越多越好,但在交易中,特征丰富的数据集可能会导致虚假的自相关和糟糕的结果。他讨论了三种特征选择算法:正向特征选择、分类和回归树 (CART) 以及随机森林,它们有助于识别最具预测性的变量。

陈博士深入研究支持向量机 (SVM) 分类算法,该算法旨在预测未来的一日收益及其正面或负面性质。 SVM 找到一个超平面来分离数据点,可能需要非线性变换才能有效分离。他还谈到了其他机器学习方法,例如神经网络,但强调了它们在捕捉相关特征方面的局限性,以及由于金融市场的非平稳性,它们不适合交易。

网络研讨会还强调了自定义目标函数在交易策略中的重要性。 Chan 博士推荐使用逐步回归、决策树和集合回归等技术来开发预测模型。他强调了减少交易数量的平方根以实现高精度保护回报的重要性。夏普比率是评估策略有效性的有效基准,大于等于 2 的比率被认为是有利的。

陈博士就机器学习在金融业的应用提供了宝贵的见解,强调了其在某些领域的潜力,同时告诫其局限性。他强调了特征选择、数据重采样和选择合适的目标函数对于在量化交易中成功应用机器学习的重要性。

  • 00:00:00 在本节中,Ernie Chan 博士分享了他在金融行业的机器学习背景和经验。他讨论了尽管他在该领域拥有专业知识并为知名公司工作,但他如何未能成功地将机器学习应用于交易。陈博士分享说,这次演讲的目的是解释机器学习的陷阱,为什么它在交易中不起作用,以及它如何在交易中起作用。他指出,当他第一次开始在交易中使用机器学习时,他错误地认为它适用于每日柱线并使用技术指标作为输入,但最终没有产生成功的结果。

  • 00:05:00 在本节中,Ernie Chan 博士讨论了由于数据不足和数据窥探偏差的风险,在期货和指数交易中使用机器学习算法的局限性。他认为,当机器学习应用于个别科技股、订单簿数据、基本面数据或新闻等非传统数据时,它在产生有利可图的交易策略方面更有潜力。为了克服数据不足和数据窥探偏差的限制,Chan 博士建议使用重采样技术,例如过采样或装袋。虽然重采样可以扩展数据集,但在将这些技术用于交易策略时,必须仔细考虑以保留时间序列数据中的序列自相关。

  • 00:10:00 在本节中,Chan 博士讨论了三元组在机器学习中的使用,它允许使用多天而不是一天作为输入来保持自相关。他还强调了减少数据采样偏差的重要性,这可以通过减少特征或预测变量的数量来实现。虽然许多人认为拥有更多特征更好,但在交易中情况并非如此,因为特征和目标之间的虚假自相关导致特征丰富的数据集是一个诅咒。因此,特征选择至关重要,支持特征选择的机器学习算法非常适合交易。 Chan 博士重点介绍了三种此类算法,包括逐步回归、随机森林和 LASSO 回归。他告诫说,神经网络和深度学习算法不选择特征而是把所有东西混合在一起,不适合交易。

  • 00:15:00 在本节中,Ernie Chan 博士讨论了三种不同的特征选择算法:前向特征选择、分类和回归树 (CART) 以及随机森林。正向特征选择涉及一次向线性回归模型添加一个特征,直到算法确定哪些特征提高了可预测性。另一方面,CART 类似于决策树,并在每次迭代时根据分类条件强加条件进行分层操作。随机森林是一种通过将 bagging 与随机子空间相结合,可以应用于不同分类算法的技术,它涉及对数据进行过采样和对预测变量进行欠采样,以实现数据和特征之间的平衡。为了更好地解释这个概念,陈博士提供了一个带有假设特征的示例表来预测明天的回报。

  • 00:20:00 在本节中,Ernie Chan 博士讨论了使用分类回归树等分类算法减少特征集的过程。他解释说,有很多技术可以做到这一点,例如欠采样或使用互信息。然而,他指出这些技术是最简单和众所周知的。他使用数据中的代表性样本,通过确定哪些技术指标可用于预测未来回报以及这些指标的哪些值将产生正或负回报来演示算法的工作原理。一旦对数据子集进行了分类,就会重复该过程以识别其他变量以实现更好的分类。

  • 00:25:00 在本节中,Ernie Chan 博士解释说,机器学习算法的工作原理是找到对分类器有用的预测变量和参数,然后迭代直到找不到统计显着性。机器学习算法通常是具有更多数据细节和条件的统计回归系统。他接着讨论了支持向量机分类算法,该算法旨在预测未来的一日收益以及它们是正数还是负数。该算法试图找到一个超平面来切割数据,但通常需要非线性变换才能找到分离点。这种转换对于使支持向量机有效工作至关重要。

  • 00:30:00 在本节中,Chan 博士讨论了如果没有足够的数据供机器学习算法学习,则需要重新采样数据,尽管必要的数量与预测变量的数量有关。他概述了支持向量机是如何对数据进行分类的,尽管 SVM 不像逐步回归或分类树那样是一种特征选择算法,但 SVM 找到了一个可以穿过任何维度的超平面。他指出,神经网络是一个非线性方程,它们用一个巨大的长线性函数拟合数据,而不是像回归中那样使用线性函数,而且深度学习只是一个有很多层但每层节点很少的神经网络更容易分阶段捕获功能。

  • 00:35:00 在本节中,Ernie Chan 博士讨论了使用神经网络进行量化交易的概念。他解释说,神经网络是一种强大的工具,因为它可以逼近任何非线性函数,并且能够根据今天的变量预测明天的回报。但是,他还指出,神经网络在交易中效果不佳,因为金融市场不稳定,而且使用这种方法很难捕捉到相关特征。他强调,神经网络使用所有输入而不选择特征,因此很难找到对市场有因果影响的变量。

  • 00:40:00 在本节中,Ernie Chan 博士解释了机器学习何时对交易者有用。当交易者对他们的数据或市场缺乏直觉,或者他们没有数据的数学模型时,机器学习会很有帮助。此外,机器学习可以帮助交易者在特征太多或不知道哪些特征重要时培养直觉。然而,如果交易者有良好的直觉和简单的数学模型,他们最好建立简单的模型而不是使用机器学习。如果交易者的数据太少,或者如果他们的市场发生制度变化,交易者在使用机器学习时也应该小心,因为糟糕的市场模型会导致算法在制度变化时崩溃。

  • 00:45:00 在网络研讨会的这一部分,Ernie Chan 博士解释了在量化交易中应用机器学习技术时使用静态数据的重要性。他指出,许多统计和技术测试可用于确定数据集的平稳性,但结果往往是模棱两可的。由于缺乏成功的样本外复制,陈博士还讨论了他对强化学习和深度学习在交易中有效性的怀疑。此外,他还强调了交易策略中定制目标函数的必要性,并建议使用集合回归或决策树等技术进行预测建模。

  • 00:50:00 在本节中,Ernie Chan 博士讨论了机器学习中用于量化交易的目标函数选择,并解释了数据的可用性决定了目标函数的选择。如果目标函数是一个月的回报,每日回报成为输入,目标变量的选择必须与预测变量的时间尺度相匹配。 Chan 博士还解释了 Adam 和深度学习方法之间的区别,指出深度学习在特征选择方面做得不太好。此外,本节还深入探讨了不同制度的定义,以及如何根据首选标准来定义它们。最后,陈博士强调,量化交易的交易次数并不是决定成败的因素。

  • 00:55:00 在本节中,Ernie Chan 博士讨论了将 n 的平方根减少到可管理的数字对于实现高精度保护回报的重要性。他解释说,误差与交易数量的平方根成正比,而夏普比率是统计显着性的极好衡量标准,因为它在其构造中融入了这一概念。夏普比率为 2 或更大的策略被认为是有效的。虽然Christophe提到的最后一个问题可能过于技术化,但陈博士认为夏普比率是衡量策略有效性的一个很好的基准。
Machine Learning for Quantitative Trading Webinar with Dr. Ernie Chan
Machine Learning for Quantitative Trading Webinar with Dr. Ernie Chan
  • 2017.03.28
  • www.youtube.com
Quantitative trading and algorithmic trading expert Dr. Ernie Chan teaches you machine learning in quantitative finance. You will learn:1) The pros and cons ...