为了进一步扩展我们的理解,我们探讨了多元正态分布的概念及其在求解最小二乘估计量分布中的作用,假设残差呈正态分布。涵盖矩生成函数、QR 分解和最大似然估计等主题。我们解释了 QR 分解如何简化最小二乘估计,并给出了关于正态线性回归模型的基本结果。我们定义了似然函数和最大似然估计,强调了正态线性回归模型中最小二乘和最大似然原理之间的一致性。
00:30:00 在本节中,我们将学习回归分析以及如何求解 beta 的普通最小二乘估计。我们使用矩阵,采用 y 向量、自变量的 n 个值和 X(因变量值的矩阵)来定义拟合值 y hat,等于矩阵 x 乘以 beta。通过取 n 向量的叉积减去 X 矩阵乘以 beta 的乘积,得出 beta 的普通最小二乘估计值,我们可以求解 Q 关于 beta 的二阶导数,最终为 X。转置 X,一个正定或半定矩阵。最后,我们将 Q 相对于回归参数的导数定义为减去第 j 列堆叠乘以 y 的两倍。
00:35:00 在本节中,介绍了回归建模中正规方程的概念。方程组必须满足普通最小二乘估计值 beta。借助矩阵代数,可以求解方程,β hat 的解假设 X 转置 X 逆存在。要使 X 转置 X 逆,X 必须具有满秩,这表明具有由其他自变量解释的自变量会导致秩降低。发现如果 beta 帽子没有满秩,我们对 beta 的最小二乘估计可能不是唯一的。
00:40:00 在回归分析这一节中,引入了帽子矩阵作为投影矩阵,它将响应变量的线性向量带入拟合值。具体来说,它是一个正交投影矩阵,投影到X的列空间上。残差是响应值和拟合值的差值,可以表示为y减去y hat,或者I_n减去H乘以y。原来I_n减去H也是一个投影矩阵,将数据投影到与x的列空间正交的空间上。记住这一点很重要,因为它有助于通过投影到列空间来表示 n 维向量 y,并有助于理解残差与 X 的每一列正交。
00:50:00 在本节中,演讲者讨论了高斯-马尔可夫定理,该定理指出,如果高斯-马尔可夫假设适用,则估计量 theta 在所有线性无偏估计量中具有最小的方差。这意味着只要这是标准,最小二乘估计量就是 θ 的最佳估计量。这个定理的证明是基于考虑另一个线性估计,它也是一个无偏估计,并评估两个估计量之间的差异,这两个估计量的期望必须为 0。证明的数学论证包括方差分解和跟踪协方差项。这个结果是术语 BLUE 估计或最小二乘估计的 BLUE 属性来自计量经济学课。
00:55:00 在本节中,视频讨论了组件之间具有非零协方差的回归模型,以及如何将数据 Y、X 转换为 Y 星和 X 星以满足原始高斯-马尔可夫假设,使响应变量具有常量方差且不相关。该视频解释说,对于具有非常大方差的响应值,这些广义最小二乘法会通过 sigma inverse 对那些值进行折扣。然后,该视频深入研究了正态回归模型的分布理论,假设残差是均值为 0 且方差为 sigma 平方的正态分布,并且响应变量将具有恒定方差,但由于它们对因变量的均值不同而分布不均。
01:00:00 在本节中,将针对均值向量和协方差矩阵讨论多元正态分布的概念。目标是在假设残差呈正态分布的情况下求解最小二乘估计量的分布。引入力矩生成函数作为导出 Y 和 beta 帽的联合分布的一种方法。对于多元正态分布,Y 的矩生成函数是各个矩生成函数的乘积,Y 的分布是均值 mu 和协方差矩阵 sigma 的正态分布。求解 beta 帽的力矩生成函数以确定其分布,即多元正态分布。
01:05:00 在本节中,演讲者讨论了 beta hat 的矩生成函数,以及它如何等效于一个多元正态分布,均值为某个对象给出的真实 beta 和协方差矩阵。每个 beta 帽的边缘分布由均值 beta_j 和方差等于对角线的单变量正态分布给出,这可以从高斯矩生成函数证明。然后演讲者继续讨论 X 的 QR 分解,这可以通过自变量矩阵的 Gram-Schmidt 正交归一化来实现。通过定义上三角矩阵 R 并通过 Gram-Schmidt 过程求解 Q 和 R,我们可以将任何 n x p 矩阵表示为标准正交矩阵 Q 和上三角矩阵 R 的乘积。
01:10:00 在本节中,讨论了 QR 分解及其在简化最小二乘估计中的应用。通过使用 Gram-Schmidt 过程对 X 的列进行正交化,可以计算 QR 分解以获得简单的线性代数运算来求解最小二乘估计。 beta hat 的协方差矩阵等于 sigma 平方 X 转置 X 逆,帽子矩阵只是 Q 乘以 Q 转置。进一步探索分布理论以提供关于正态线性回归模型的基本结果。
01:15:00 在这一节中,教授讨论了一个重要的定理,对于任意矩阵 A,m 乘 n,它可以将随机向量 y 变换为随机法向量。该定理证明,在构建此类统计量时,最小二乘估计 beta hat 和残差向量 epsilon hat 是独立的随机变量。 Beta 帽的分布是多元正态分布,而残差平方和是卡方随机变量的倍数。还讨论了回归参数估计和 t 统计量。最大似然估计也在正态线性回归模型的背景下进行了解释。事实证明,普通最小二乘估计是最大似然估计。
01:20:00 在本节中,定义了似然函数和最大似然估计。似然函数是给定多元正态随机变量的未知参数的数据的密度函数,最大似然估计确定使观测数据最有可能的这些参数的值。需要注意的是,使用最小二乘法来拟合模型与将最大似然原理应用于正态线性回归模型是一致的。此外,广义 M 估计量作为一类估计量被简要提及,用于寻找回归参数的稳健和分位数估计。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Kenneth AbbottThi...
教授深入研究解决正态线性回归模型的估计问题。他们强调误差方差的最大似然估计是 n 上的 beta 帽子的 Q,但警告说这个估计是有偏差的,需要通过将它除以 n 减去 X 矩阵的秩来进行校正。随着更多参数被添加到模型中,拟合值变得更加精确,但也存在过度拟合的风险。该定理指出,回归模型的最小二乘估计(现在是最大似然估计)服从正态分布,残差平方和服从自由度等于 n 减去 p 的卡方分布。 t 统计量被强调为评估模型中解释变量重要性的重要工具。
广义 M 估计作为一种通过最小化 beta 函数 Q 来估计未知参数的方法被引入。可以通过为函数 h 选择不同的形式来定义不同的估计量,这涉及对另一个函数的评估。该视频还介绍了稳健的 M 估计器,它利用函数 chi 来确保与估计有关的良好属性,以及分位数估计器。稳健估计器有助于减轻最小二乘估计中离群值或大残差的影响。
然后主题转移到 M 估计量及其在拟合模型中的广泛适用性。介绍了应用于资产定价的线性回归模型的案例研究,重点是资本资产定价模型。教授解释了股票回报如何受到整体市场回报的影响,并根据股票的风险进行衡量。案例研究提供了有关如何使用统计软件 R 收集数据的数据和详细信息。提到了回归诊断,强调了它们在评估个体观察对回归参数的影响方面的作用。引入杠杆作为识别有影响的数据点的度量,并提供了它的定义和解释。
讲师讲解了时间序列分析的Wold分解法,包括初始化参数p(代表过去观察的次数),根据最后的p lag值估计X_t的线性投影。通过使用时间序列方法检查残差,例如评估与较长滞后的正交性和与白噪声的一致性,可以确定合适的移动平均模型。 Wold 分解方法可以通过在 p 接近无穷大时采用投影的极限来实现,收敛到数据在其历史上的投影并对应于投影定义的系数。然而,p 与样本大小 n 的比率接近零以确保模型估计有足够的自由度是至关重要的。
然后重点转向 ARMA 模型上下文中的自回归模型。在解决移动平均过程之前,讲座从更简单的案例开始,特别是自回归模型。探索了平稳性条件,并通过用复变量 z 代替多项式函数 phi 引入了与自回归模型相关的特征方程。如果特征方程的所有根都在单位圆之外,则认为过程 X_t 是协方差平稳的,这意味着复数 z 的模大于 1。单位圆外的根必须具有大于 1 的模才能确保平稳性。
视频进展到特别关注自回归过程,尤其是 AR(1) 模型。这些模型涉及的变量往往会在短期内回归到某个均值,而均值回归点可能会在长期内发生变化。本讲座介绍了用于估计 ARMA 模型参数的 Yule-Walker 方程。这些方程依赖于不同滞后观测值之间的协方差,可以求解所得方程组以获得自回归参数。 Yule-Walker 方程经常用于指定统计包中的 ARMA 模型。
解释了用于统计估计的矩原理方法,特别是在指定和计算似然函数变得具有挑战性的复杂模型的背景下。讲座继续讨论移动平均模型并给出 X_t 期望值的公式,包括 mu 和 gamma 0。时间序列中的非平稳行为通过各种方法解决。讲师强调了适应非平稳行为以实现准确建模的重要性。一种方法是转换数据以使其静止,例如通过差分或应用 Box-Jenkins 的使用一阶差分的方法。此外,还提供了线性趋势回归模型的示例,作为处理非平稳时间序列的一种方法。
演讲者进一步探讨了非平稳过程及其与 ARMA 模型的结合。如果差分(无论是第一次差分还是第二次差分)产生协方差平稳性,则可以将其集成到模型规范中以创建 ARIMA 模型(自回归综合移动平均过程)。这些模型的参数可以使用最大似然估计来估计。为了评估不同的模型集并确定自回归和移动平均参数的顺序,建议使用 Akaike 或 Bayes 信息准则等信息准则。
讨论了向模型添加额外变量的问题,以及惩罚的考虑。讲师强调需要为纳入额外参数建立证据,例如评估超过特定阈值的 t 统计量或采用其他标准。贝叶斯信息准则假设模型中的变量数量有限,假设它们是已知的,而 Hannan-Quinn 准则假设变量数量无限但确保它们的可识别性。模型选择是一项具有挑战性的任务,但这些标准为决策提供了有用的工具。
00:05:00 在本节中,教授讨论了如何解决正态线性回归模型的估计问题。误差方差的最大似然估计是 Q of beta hat over n,但这个估计是有偏差的,需要通过除以 n 减去 X 矩阵的秩来校正。添加到模型中的参数越多,拟合值越精确,但也增加了曲线拟合的危险。该定理指出回归模型的最小二乘法(现在是最大似然估计)呈正态分布,残差平方和呈卡方分布,自由度由 n 减去 p。 t 统计量是评估模型中不同解释变量相关性的重要方法。
00:10:00 在本节中,视频解释了广义 M 估计的概念,它涉及通过最小化 beta 函数 Q 来估计未知参数。通过为 h 选择不同的函数形式,它是另一个函数的评估总和,可以定义不同类型的估计量,例如最小二乘法和最大似然估计。该视频还讨论了稳健的 M 估计量,其中涉及定义函数 chi 以具有良好的估计特性和分位数估计量。稳健估计有助于控制最小二乘估计下非常大的值或残差的不当影响。
00:15:00 在本节中,教授讨论了 M 估计量以及它们如何包含拟合模型中遇到的大多数估计量。该课程介绍了一个案例研究,该案例研究将线性回归模型应用于资产定价。资本资产定价模型被解释为表明股票回报取决于整体市场的回报,并根据股票的风险程度进行衡量。案例研究提供了使用 R 收集数据所需的数据和详细信息。教授提到了回归诊断以及它们如何确定个体观察对回归参数的影响。最后,利用杠杆识别有影响力的数据点,并给出定义和解释。
00:20:00 在本节中,教授介绍了在股票收益建模中添加另一个因素(例如原油收益)以帮助解释收益的概念。分析表明,在本案例研究中,市场无法有效解释 GE 的回归;原油是另一个有助于解释回报的独立因素。另一方面,石油公司埃克森美孚 (Exxon Mobil) 有一个回归参数,该参数显示原油随着油价的上涨和下跌,对其回报率有何影响。本节以散点图结尾,该散点图指示与个案与自变量质心的马氏距离相关的有影响的观察结果。
00:35:00 本节讨论时间序列分析的Wold分解法。该方法涉及初始化参数 p,它表示线性确定性项中过去观察的数量,并估计 X_t 在最后 p lag 值上的线性投影。通过时间序列方法对残差进行分析,如评估残差是否与较长滞后正交、是否与白噪声一致等,可以指定一个移动平均模型并评估其适用性。当 p 变大时,Wold 分解方法可以实现为投影的极限,收敛到数据在其历史上的投影并对应于投影定义的系数。但是,p/n 比需要接近 0,以避免在估计模型时耗尽自由度。
00:40:00 在本节中,演讲者强调了在估计时间序列模型时使用有限数量参数的重要性,因为这有助于避免过度拟合。滞后算子是时间序列模型中的一个重要工具,其中时间序列使用算子 L 以一个时间增量向后移动。任何随机过程都可以使用滞后算子表示,其中 psi 为 L,L 是无限阶多项式滞后。脉冲响应函数与创新在某个时间点的影响有关,该影响会影响该点及以后的过程。演讲者使用美联储主席利率变化的例子来帮助解释随着时间的推移创新的影响。
00:45:00 在本节中,将结合时间序列分析讨论长期累积响应的概念。长期累积响应是流程中一项创新随时间的影响,以及流程正在移动的价值。该响应由各个响应的总和给出,由带有滞后算子的 psi 的多项式表示。 Wold 表示是无限阶移动平均线,它可以使用 L 多项式的 psi 的倒数进行自回归表示。还向观众介绍了具有数学定义的自回归移动平均过程类。
00:50:00 在本节中,重点是 ARMA 模型中的自回归模型。为了更好地理解这些模型,将研究更简单的案例,从自回归模型开始,然后转向移动平均过程。还将探索平稳性条件,其中多项式函数 phi,如果用复数变量 z 代替,将是与自回归模型相关的特征方程。 X_t 的过程是协方差平稳的当且仅当此特征方程的所有根都在单位圆外,即复数 z 的模大于 1,并且根在单位圆外的模大于比 1。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
该视频提供了波动率建模的广泛概述,探索了该领域的各种概念和技术。讲师首先介绍自回归移动平均 (ARMA) 模型及其与波动率建模的相关性。 ARMA 模型用于捕捉布朗运动过程中冲击的随机到达。演讲者解释说,这些模型假设存在一个过程 pi of t,它代表一个泊松过程,计算发生的跳跃次数。跳跃由服从泊松分布的随机变量 gamma sigma Z_1 和 Z_2 表示。这些参数的估计是通过 EM 算法使用最大似然估计进行的。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
00:00:00 在本节中,来自摩根士丹利的演讲嘉宾 Ivan Masyukov 博士讨论了利率产品的正则化定价和风险模型,其中涉及向模型添加额外的约束,也称为正则化项。讲座首先解释债券,这是市场上最简单的利率产品之一,涵盖债券的定期支付、到期日和面值。还讨论了直到到期才支付任何费用的零息债券和提供无限支付的永久债券。讲座最后解释了用于分析的现金流量图,绿色箭头表示收到的东西,红色箭头表示支付的东西。
00:35:00 在本节中,重点将转移到如何交易价差以及哪些工具被认为最具流动性。据透露,债券是最具流动性的期权,而十年期互换和债券之间的利差是第二大流动性期权。在创建曲线时,这种转变值得信赖,因为输入的微小变化可能会导致输出发生较大变化,这是交易员关注的一个原因。一种典型的情况是交易者希望他们的模型的价值对市场变化不敏感,为此他们需要购买尽可能多的一年期掉期 plus 200,两年期掉期和 minus 一样多1.3,等等。然而,它可能会很昂贵,成本约为 360 万美元,并且与特定工具的出价成正比。
00:55:00 在本节中,演讲者解释了蒙特卡罗模拟所需的远期利率演变方程,其中远期利率是被同化的数量。演讲者讨论了远期利率的漂移,它在一定程度上依赖于远期利率对 beta 的幂。引入了波动率表面,它给出了用于日历和远期时间的波动率数量,并简要提及了相关性和因子结构。演讲者解释说,三角形曲面用于每个箭头的转换波动率,并显示了波动率曲面的示例。问题在于计算维度为 240 x 240 的三角矩阵,需要长达 60 年的数据,这是一项具有挑战性的任务。
01:00:00 在视频的这一部分,演讲者解释了如何解决校准波动率曲面的问题。由于要校准的元素数量很大,因此存储 28K x 28K 矩阵的形式化解决方案并不实用。此外,由于校准仪器的数量少于要校准的元素的数量,因此这是一个不确定的问题,会产生不稳定的解决方案。为了解决这个问题,他们将表面表示为一个向量,并使用基函数的线性组合,这些基函数对应于具有与输入仪器相同数量的基函数的合理函数。虽然它校准得很好,但生成的表面看起来不太像波动率表面,而更像是曼哈顿天际线与哈德逊河和建筑物的形状。这种方法很常用,但会产生不稳定的结果。
01:05:00 在视频的这一部分,演讲者讨论了定价和风险模型中的不适定性问题,这意味着输入的微小变化可能导致输出的剧烈变化。为了解决这个问题,他们建议使用开始时平滑的基函数(例如 B 样条)对输出施加约束,并使用惩罚函数来控制波动率表面的变化和平滑度。通过这样做,他们可以产生有意义的结果,而不必针对每个输入仪器进行精确校准。演讲者演示了如何在二维中构造基函数并使用线性组合进行组合。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Ivan MasyukovThis...
本视频以上一讲关于波动率建模的讨论为基础,深入探讨了时间序列分析的各个方面。教授首先介绍了 GARCH 模型,该模型提供了一种灵活的方法来衡量金融时间序列的波动性。探讨了最大似然估计与 GARCH 模型的结合使用,以及使用 t 分布作为时间序列数据建模的替代方法。还讨论了 t 分布与正态分布的近似。接下来是多元时间序列,讲座涵盖了互协方差和 Wold 分解定理。演讲者阐明了向量自回归过程如何将高阶时间序列模型简化为一阶模型。此外,还讨论了稳态 VAR 过程的均值计算及其作为回归方程组的表示。
讲师还强调了 t 分布的使用,与高斯分布相比,它提供了更重的尾部分布,用于建模时间序列数据。具有 t 分布的 GARCH 模型可以有效地估计波动率并计算风险价值限制。 t 分布可以很好地近似于正态分布,讲师鼓励探索不同的分布以增强时间序列建模。此外,还讨论了 t 分布与正态分布的近似。当 t 分布具有 25-40 个自由度时,可以认为它是正态分布的合理近似。讲师展示了一个比较标准正态分布和具有 30 个自由度的标准 t 分布的概率密度函数的图表,证明这两个分布相似但尾部不同。
00:30:00 在本节中,我们将学习多变量时间序列,这涉及到单变量时间序列的扩展,以模拟随时间变化的多个变量。我们将协方差平稳性的定义扩展到有限且有界的一阶和二阶矩,其中 M 维取值随机变量被视为 M 个不同的时间序列。对于多元过程的第 t 个观测值的方差-协方差矩阵,我们定义 gamma_0,即 X_t 减去 mu 乘以 X_t 减去 mu 素数的期望值。然后通过将协方差矩阵 gamma_0 与对角矩阵与该矩阵的对角线的平方根相乘,获得相关矩阵 r_0。
00:35:00 在本节中,介绍了交叉协方差矩阵的概念,它着眼于多元时间序列的当前值如何与这些值的第 k 个滞后值协变。当前周期向量值 Gamma_k 与这些值的第 k 个滞后值协变。解释了这些矩阵的性质,其中 gamma_0 的对角线是方差对角线项的协方差矩阵。还提到了高等定理Wold分解定理的存在,它扩展了单变量Wold分解定理。该定理有助于识别经济时间序列中变量之间因果关系的判断。
00:40:00 在本节中,介绍了协方差平稳过程的 Wold 分解表示的概念。该过程表示为确定性过程和白噪声的移动平均过程之和。在多变量情况下,确定性过程可以是线性或指数趋势,而白噪声过程是均值为 0 的 m 维向量和半正定方差/协方差矩阵。创新是对建模过程的扰动,不能由先前的信息预测。协方差矩阵中的项之和必须收敛才能使过程协方差平稳。
00:45:00 在本节中,Wold 分解被讨论为一种表示影响过程且以前不可用的信息位的方法。然后本节继续讨论向量自回归过程,该过程模拟多元序列的给定分量如何依赖于其他变量或多元序列的分量。然后解释了将第 p 阶过程重新表示为具有向量自回归的一阶过程的概念,这是一种在时间序列方法中用于简化复杂模型分析的强大技术。
00:50:00 在本节中,演讲者讨论了使用 Z_t 和 Z_(t-1) 向量表示的多元随机过程,以及如何将其转换为具有更大多元序列的一阶时间序列模型。如果伴随矩阵 A 的所有特征值的模都小于 1,则该过程是平稳的,这确保该过程在随时间递增时不会出现爆炸行为。这个要求与多项式方程的所有根都在单位圆外是一样的。这段摘录中没有提到多项式的阶数。
00:55:00 在本节中,重点是通过对等式两边取期望来计算平稳 VAR 过程的均值。求解第二行到第三行的mu,得到过程的无条件均值。向量自回归模型表示为回归方程组,由 m 个回归模型组成,对应于多元序列的每个分量。第 m 个回归模型将矩阵的第 j 列建模为 Z beta j 和 epsilon j,其中 Z 是多元过程滞后值的向量。该计算假设 p 个样本前观察值可用。
01:00:00 在本节中,演讲者解释了用于时间序列分析的多元回归模型。该模型由整个多元序列滞后的线性回归模型组成,直至 p lags,其回归参数由 βj 给出,它对应于 phi 矩阵的各种元素。演讲者定义了多元回归模型,并解释了如何通过分别考虑每个分量序列的单变量回归模型来指定它。这与计量经济学中看似无关的回归有关。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
然后,讲师解释了如何推导自回归移动平均 (ARMA) 过程的状态空间表示。这种方法允许灵活表示时间序列中变量之间的关系。该视频强调了 Harvey 1993 年工作的重要性,该工作为 ARMA 过程定义了特定的状态空间表示。
接下来,该视频探讨了 VAR 模型在宏观经济变量中的应用,以预测增长、通货膨胀和失业率。通过分析自相关和偏自相关系数,研究人员可以确定变量之间的关系并识别模式和相关性。该视频提供了一个回归模型示例,说明了如何将联邦基金利率建模为滞后失业率、联邦基金利率和 CPI 的函数。这个例子表明,失业率的上升往往会导致下个月的联邦基金利率下降。
然后讲座介绍了线性状态空间模型,作为表达经济和金融中使用的各种时间序列模型的一种方式。解释了状态方程和观测方程,展示了该建模框架的灵活性。该视频说明了将具有时变贝塔值的资本资产定价模型表示为线性状态空间模型。通过在回归参数中加入时间依赖性,该模型捕获动态变化。此外,讲师讨论了随时间改变回归参数的概念,假设它们遵循独立的随机游走。解释了联合状态空间方程及其在添加新数据时递归更新回归的实现。 P 阶自回归模型和 Q 阶移动平均模型表示为线性状态空间模型。
然后讲座深入研究状态方程和观察方程,强调它们在基本状态之间转换中的作用。探讨了 ARMA 过程的状态空间表示的推导,突出了定义状态和基础转换矩阵的灵活性。 本讲座概述了线性状态空间模型在时间序列分析中的应用。演讲者解释说,这些模型可用于通过结合观察到的数据和潜在状态来估计和预测感兴趣的变量。通过利用作为递归算法的卡尔曼滤波器,模型可以计算给定观察数据的状态的条件分布,以及预测未来状态和观察结果。
00:10:00 在视频的这一部分,演讲者介绍了协整的概念,这是处理非平稳时间序列的时间序列分析中的一个主要主题。讨论从协整相关的上下文开始,重点关注按某个阶数 d 积分的随机过程,这意味着第 d 个差值是平稳的。虽然采取一阶差分会导致平稳性,但该过程会丢失一些信息,而协整提供了一个框架来系统地表征统计建模的所有可用信息。非平稳过程仍然可以具有向量自回归表示,可以表示为 x 等于白噪声 epsilon 的多项式滞后,将其降低为平稳性需要取 d 阶差分。
00:15:00 在视频的这一部分中,引入了协整的概念,作为处理多元时间序列的线性组合可能是平稳的情况的一种方法,这意味着它们代表了过程的平稳特征。协整涉及找到向量 beta,使得 x 和 beta 素数 X_t 上的线性权重是一个平稳过程。协整向量可以任意缩放,但通常的做法是将过程的第一个组成序列设置为 1。这种关系在经济学和金融学中以多种方式出现,包括利率期限结构、购买力平价、货币需求、覆盖利率平价、一价定律、现货和期货。举一个能源期货的例子来说明这个概念。
00:25:00 在本节中,讲座讨论了扩展单变量模型的 p 阶向量自回归模型。讲座解释了一个序列的自回归依赖于所有其他序列,这形成了具有均值 0 和某种协方差结构的多维白噪声。还讨论了对一阶进行积分的过程,以及与一些额外项的差异相关的推导过程。最后,讲座提供了级数差分的方程,它等于一个常数加上一阶差分多元级数的矩阵倍数,再加上另一个矩阵乘以二阶差分,一直到第 p不同之处。
00:30:00 在本节中,视频讨论了使用滞后和差分序列消除时间序列中的非平稳性的过程。该模型表示差分序列的随机过程模型,是平稳的。虽然作为滞后矩阵倍数的项是平稳的,但 pi X_t 项包含涉及识别矩阵 pi 的协整项。由于原始序列有单位根,矩阵 pi 降阶,它定义了协整关系。 beta 的列定义协整 x 的线性独立向量。 pi的分解不是唯一的,通过在过程平稳的r维空间定义坐标系,矩阵pi可以表示为alpha beta prime。
00:45:00 在这一部分,演讲者介绍了线性状态空间模型的主题,它可以用来表达经济和金融中使用的许多时间序列模型。该模型涉及时间 t 的观察向量、基础状态向量、时间 t 的观察误差向量和状态转换创新误差向量。演讲者解释了模型中的状态方程和观测方程,它们是状态和观测加上噪声的线性变换,以及如何将它们一起写成一个联合方程。该符号可能看起来很复杂,但它在指定变量之间的关系方面提供了很大的灵活性。
00:55:00 在本节中,介绍了时间序列中随时间变化的回归参数的概念,假设它们遵循独立的随机游走。解释了联合状态空间方程以及用于在添加新数据时递归更新回归的线性状态空间实现。还讨论了 P 阶自回归模型,概述了线性状态空间模型如何演化的结构。最后,将Q阶移动平均模型表示为线性状态空间模型。
01:00:00 在本节中,讲师讨论了状态方程和观测方程,它们用于给出基础状态之间的转换。他们使用自回归移动平均模型的示例来演示线性状态空间模型的设置如何促进模型估计过程。讲座接着解释了 Harvey 在 93 年的工作如何为 ARMA 过程定义了一个特定的状态空间表示,以及一个给定的过程如何有许多不同的等效线性状态空间模型,这取决于一个人如何定义状态和底层转换矩阵 T。最后,讲座继续推导 ARMA 过程的状态空间表示。
01:05:00 在本节中,演讲者解释了如何通过使用观测值迭代求解第二状态并重写模型方程,为线性状态空间模型中的转移矩阵 T 建立一个简单模型。此过程用观察值替换基础状态,并生成一个转移矩阵 T,该矩阵的第一列是自回归分量,R 矩阵中是一个移动平均分量向量。线性状态空间建模的有效性在于卡尔曼滤波器的完整规范,它在给定时间 t 的信息的情况下递归计算 t+1 时基础状态的概率密度函数,以及未来状态的联合密度和 t+1 处的观察,给定时间 t 之前的信息,以及下一个观察的边际分布给定时间 t 之前的信息。卡尔曼滤波器的实现需要涉及条件均值、协方差和由 omegas 确定的均方误差的符号。
01:10:00 在本节中,文字记录讨论了卡尔曼滤波器,它有四个步骤,可帮助预测时间序列中的状态向量和观察值。滤波器增益矩阵用于根据发生的情况调整基础状态的预测,并表征我们从每次观察中获得的信息量。通过最小化我们观察到的和我们预测的之间的差异,可以减少时间 t 状态的不确定性。还有一个预测步骤,它预测前一个周期的状态,并在给定先前状态的情况下更新未来状态的协方差矩阵。最后,平滑步骤表征了在整个时间序列中给定信息的基础状态的条件期望。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Alexander Eydelan...
00:45:00 本节讨论投资组合优化的资本市场线。这条线表示任何最优投资组合的预期收益,等于无风险利率加上市场投资组合每风险收益的倍数。通过为市场投资组合分配额外的权重并以无风险利率借入资金,人们可以获得更高的回报和超出市场投资组合的波动性,从而扩大有效边界。本节最后讨论了 von Neumann-Morgenstern 效用理论,该理论考虑了基于预期回报和波动性的投资组合优化决策过程。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
00:20:00 在本节中,视频介绍了因子建模以及将因子转化为意外因子以对宏观经济变量建模的方法。讨论了在这些因素中加入意外变化的力量,这种方法现在被广泛应用。该视频还解释了如何使用简单回归方法和高斯-马尔可夫假设来估计基础参数。还提供了 BARRA 方法的示例,该方法使用基于基本面或特定资产属性的公共因子变量。
00:30:00 本节介绍行业因素模型的概念。具体来说,行业因素模型允许关联因素加载,这些因素用于根据资产所属的行业组来加载每项资产。行业因素模型的问题是如何指定潜在因素的实现,这些因素可以用回归模型进行估计。因子实现的估计假设 x 的分量的可变性具有相同的方差,但实际上这些模型中存在异方差性。总的来说,本节概述了行业因素模型的协方差矩阵估计和回归估计。
00:35:00 在视频的这一部分,重点是估计回归参数时的异方差及其对投资组合优化的影响,其中资产按其预期回报加权,并受到高方差的惩罚。因子模拟投资组合用于确定因子交易的真实价值,例如 Fama-French 模型,每个因子的实现是标的资产收益的加权和。通过标准化 k 维实现的行权重,可以为资产分配定义解释潜在投资的因子模拟投资组合。
00:40:00 在本节中,演讲者讨论了统计因子模型,用于分析 T 时间单位内 m 种资产的资产收益时间序列,其中潜在因子未知。演讲者将因子分析和主成分分析解释为揭示那些可以根据数据本身定义的潜在因素的方法。演讲者指出,在定义因子模型时具有灵活性,矩阵 B 或因子 f 的任何给定规格都可以通过 k x k 可逆矩阵 H 进行转换。
00:45:00 在本节中,讨论了因子建模和转换的概念,强调了线性函数如何根据基础因子的协方差矩阵保持不变。讨论转向定义对角化因子的矩阵 H,这允许考虑具有不相关因子分量的因子模型。做出某些假设(例如正交和零均值因子)可将模型简化为协方差矩阵 sigma_x,因为因子载荷 B 乘以其转置,再加上一个对角矩阵。还在具有正态分布的基础随机变量的正态线性因子模型的背景下讨论了最大似然估计,从而得出数据的联合密度函数。
00:50:00 在本节中,视频讨论了因子建模以及如何应用最大似然估计方法来使用 EM 算法指定 B 和 psi 矩阵的所有参数。可以使用回归公式估计因子载荷和 alpha 来估计因子实现。 EM 算法是一种强大的估计方法,它可以通过估计隐藏变量(假设隐藏变量已知)并迭代该过程来简化复杂的似然函数。因素实现可用于风险建模。
01:05:00 在本节中,视频解释了线性因子模型和主成分分析之间的差异。对于线性因子模型,假设残差向量具有等于对角线的协方差矩阵,而主成分分析可能正确也可能不正确。然后视频继续讨论经验主成分分析,其中样本数据用于获取均值和协方差矩阵的估计值。还引入了可变性的概念,其中第一主成分变量定义为坐标轴具有最大可变性的维度。然后第二个主成分变量是与第一个方差最大的方向正交的方向,继续这个过程来定义所有 m 个主成分变量。
MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...
6.回归分析
6.回归分析
在这个综合视频中,我们深入探讨了回归分析的主题,探讨了它在统计建模中的意义。在我们讨论线性回归的目标、线性模型的设置以及拟合回归模型的过程时,线性回归占据了中心位置。为了确保坚实的基础,我们首先解释残差分布的假设,包括著名的高斯-马尔可夫假设。此外,我们引入了广义高斯-马尔可夫定理,它提供了一种在回归分析中估计协方差矩阵的方法。
我们强调将主观信息纳入统计建模和容纳不完整或缺失数据的重要性。统计建模应根据所分析的特定过程进行调整,我们告诫不要盲目地将简单线性回归应用于所有问题。解释了 beta 的普通最小二乘估计,以及归一化方程、帽子矩阵和用于估计回归参数的高斯-马尔可夫定理。我们还涵盖了组件之间具有非零协方差的回归模型,从而允许采用更灵活和现实的方法。
为了进一步扩展我们的理解,我们探讨了多元正态分布的概念及其在求解最小二乘估计量分布中的作用,假设残差呈正态分布。涵盖矩生成函数、QR 分解和最大似然估计等主题。我们解释了 QR 分解如何简化最小二乘估计,并给出了关于正态线性回归模型的基本结果。我们定义了似然函数和最大似然估计,强调了正态线性回归模型中最小二乘和最大似然原理之间的一致性。
在整个视频中,我们强调了回归分析中涉及的迭代步骤。这些步骤包括确定响应变量和解释变量、指定假设、定义估计标准、将所选估计量应用于数据以及验证假设。我们还讨论了检查假设、进行影响诊断和检测异常值的重要性。
总之,该视频全面概述了回归分析,涵盖的主题包括线性回归、高斯-马尔可夫假设、广义高斯-马尔可夫定理、建模中的主观信息、普通最小二乘估计、帽矩阵、多元正态分布、矩生成函数、QR 分解和最大似然估计。通过理解这些概念和技术,您将有能力处理回归分析并在您的统计建模工作中有效地利用它。
7. 风险价值 (VAR) 模型
7. 风险价值 (VAR) 模型
该视频深入讨论了金融行业广泛使用的风险价值 (VAR) 模型的概念。这些模型采用基于概率的计算来衡量公司或个人可能面临的潜在损失。通过使用一个简单的示例,该视频有效地说明了 VAR 模型背后的基本概念。
VAR 模型是个人评估任何一天投资决策亏损概率的宝贵工具。要了解与投资相关的风险,投资者可以分析时间序列的标准差。该指标揭示了随着时间的推移平均回报偏离平均值的程度。通过以平均加减一个标准差对证券进行估值,投资者可以深入了解证券的风险调整后潜在回报。
该视频强调可以使用不同的方法构建 VAR 模型。虽然该视频主要关注参数化方法,但它承认采用蒙特卡罗模拟的替代方法。后一种方法提供了更高的灵活性和定制选项,从而可以进行更准确的风险评估。
此外,该视频探索了反映历史数据集属性的合成数据集的创建。通过采用这种技术,分析师可以生成真实的场景来准确评估潜在风险。该视频还演示了三角函数在描述温度数据中观察到的季节性模式时的应用,展示了风险分析中采用的多种方法。
除了讨论 VAR 模型外,该视频还深入探讨了银行和投资公司采用的风险管理方法。它强调了解公司风险状况和防范风险过度集中的重要性。
总体而言,该视频提供了有关在金融行业中使用 VAR 模型作为风险评估工具的宝贵见解。通过量化与投资相关的风险并采用统计分析,这些模型有助于做出明智的决策并减轻潜在的财务损失。
8. 时间序列分析Ⅰ
8. 时间序列分析Ⅰ
在本视频中,教授首先重新审视最大似然估计法作为统计建模的主要方法。他们解释了似然函数的概念及其与正态线性回归模型的联系。最大似然估计被定义为使似然函数最大化的值,表明观察到的数据被赋予这些参数值的可能性有多大。
教授深入研究解决正态线性回归模型的估计问题。他们强调误差方差的最大似然估计是 n 上的 beta 帽子的 Q,但警告说这个估计是有偏差的,需要通过将它除以 n 减去 X 矩阵的秩来进行校正。随着更多参数被添加到模型中,拟合值变得更加精确,但也存在过度拟合的风险。该定理指出,回归模型的最小二乘估计(现在是最大似然估计)服从正态分布,残差平方和服从自由度等于 n 减去 p 的卡方分布。 t 统计量被强调为评估模型中解释变量重要性的重要工具。
广义 M 估计作为一种通过最小化 beta 函数 Q 来估计未知参数的方法被引入。可以通过为函数 h 选择不同的形式来定义不同的估计量,这涉及对另一个函数的评估。该视频还介绍了稳健的 M 估计器,它利用函数 chi 来确保与估计有关的良好属性,以及分位数估计器。稳健估计器有助于减轻最小二乘估计中离群值或大残差的影响。
然后主题转移到 M 估计量及其在拟合模型中的广泛适用性。介绍了应用于资产定价的线性回归模型的案例研究,重点是资本资产定价模型。教授解释了股票回报如何受到整体市场回报的影响,并根据股票的风险进行衡量。案例研究提供了有关如何使用统计软件 R 收集数据的数据和详细信息。提到了回归诊断,强调了它们在评估个体观察对回归参数的影响方面的作用。引入杠杆作为识别有影响的数据点的度量,并提供了它的定义和解释。
引入了将原油收益等其他因素纳入股票收益模型的概念。分析表明,市场本身并不能有效地解释某些股票的回报,而原油作为一个独立因素有助于阐明回报。以石油公司埃克森美孚为例,展示其回报与油价的相关性。本节以散点图结束,该散点图根据个案与自变量质心的马氏距离指示有影响力的观察结果。
讲师继续讨论单变量时间序列分析,其中涉及将随时间变化的随机变量作为离散过程进行观察。他们解释了严格平稳性和协方差平稳性的定义,协方差平稳性要求过程的均值和协方差随时间保持不变。介绍了自回归移动平均 (ARMA) 模型,以及它们通过集成自回归移动平均 (ARIMA) 模型扩展到非平稳性。还包括平稳模型的估计和平稳性测试。
讨论了协方差平稳时间序列的 Wold 表示定理,指出这样的时间序列可以分解为线性确定性过程和系数由 psi_i 给出的白噪声的加权平均值。白噪声分量 eta_t 具有恒定的方差并且与自身和确定性过程不相关。 Wold 分解定理为此类过程建模提供了一个有用的框架。
讲师讲解了时间序列分析的Wold分解法,包括初始化参数p(代表过去观察的次数),根据最后的p lag值估计X_t的线性投影。通过使用时间序列方法检查残差,例如评估与较长滞后的正交性和与白噪声的一致性,可以确定合适的移动平均模型。 Wold 分解方法可以通过在 p 接近无穷大时采用投影的极限来实现,收敛到数据在其历史上的投影并对应于投影定义的系数。然而,p 与样本大小 n 的比率接近零以确保模型估计有足够的自由度是至关重要的。
强调了在时间序列模型中使用有限数量的参数以避免过度拟合的重要性。滞后算子,表示为 L,是作为时间序列模型中的基本工具引入的,它可以将时间序列移动一个时间增量。滞后算子用于使用多项式 psi(L) 来表示任何随机过程,多项式 psi(L) 是涉及滞后的无限阶多项式。脉冲响应函数被讨论为衡量创新在特定时间点对过程的影响,在该点及以后影响它。演讲者举了一个例子,使用美联储主席的利率变化来说明创新的时间影响。
长期累积响应的概念与时间序列分析有关。这种反应代表了随着时间的推移过程中一项创新的累积效应,并表示该过程正在收敛的价值。它计算为多项式 psi(L) 捕获的各个响应的总和。 Wold 表示是无限阶移动平均值,可以使用多项式 psi(L) 的倒数将其转换为自回归表示。介绍了自回归移动平均 (ARMA) 过程的类别及其数学定义。
然后重点转向 ARMA 模型上下文中的自回归模型。在解决移动平均过程之前,讲座从更简单的案例开始,特别是自回归模型。探索了平稳性条件,并通过用复变量 z 代替多项式函数 phi 引入了与自回归模型相关的特征方程。如果特征方程的所有根都在单位圆之外,则认为过程 X_t 是协方差平稳的,这意味着复数 z 的模大于 1。单位圆外的根必须具有大于 1 的模才能确保平稳性。
在视频的后续部分中,讨论了一阶自回归过程 (AR(1)) 中的平稳性和单位根的概念。给出模型的特征方程,说明协方差平稳性要求phi的量级小于1。表明当phi为正时,自回归过程中X的方差大于新息的方差当 phi 为负时更小。此外,证明了 phi 介于 0 和 1 之间的自回归过程对应于指数均值回归过程,该过程已被用于金融利率模型。
视频进展到特别关注自回归过程,尤其是 AR(1) 模型。这些模型涉及的变量往往会在短期内回归到某个均值,而均值回归点可能会在长期内发生变化。本讲座介绍了用于估计 ARMA 模型参数的 Yule-Walker 方程。这些方程依赖于不同滞后观测值之间的协方差,可以求解所得方程组以获得自回归参数。 Yule-Walker 方程经常用于指定统计包中的 ARMA 模型。
解释了用于统计估计的矩原理方法,特别是在指定和计算似然函数变得具有挑战性的复杂模型的背景下。讲座继续讨论移动平均模型并给出 X_t 期望值的公式,包括 mu 和 gamma 0。时间序列中的非平稳行为通过各种方法解决。讲师强调了适应非平稳行为以实现准确建模的重要性。一种方法是转换数据以使其静止,例如通过差分或应用 Box-Jenkins 的使用一阶差分的方法。此外,还提供了线性趋势回归模型的示例,作为处理非平稳时间序列的一种方法。
演讲者进一步探讨了非平稳过程及其与 ARMA 模型的结合。如果差分(无论是第一次差分还是第二次差分)产生协方差平稳性,则可以将其集成到模型规范中以创建 ARIMA 模型(自回归综合移动平均过程)。这些模型的参数可以使用最大似然估计来估计。为了评估不同的模型集并确定自回归和移动平均参数的顺序,建议使用 Akaike 或 Bayes 信息准则等信息准则。
讨论了向模型添加额外变量的问题,以及惩罚的考虑。讲师强调需要为纳入额外参数建立证据,例如评估超过特定阈值的 t 统计量或采用其他标准。贝叶斯信息准则假设模型中的变量数量有限,假设它们是已知的,而 Hannan-Quinn 准则假设变量数量无限但确保它们的可识别性。模型选择是一项具有挑战性的任务,但这些标准为决策提供了有用的工具。
总之,该视频涵盖了统计建模和时间序列分析的各个方面。它首先解释最大似然估计及其与正态线性回归模型的关系。介绍了广义M估计和鲁棒M估计的概念。介绍了将线性回归模型应用于资产定价的案例研究,然后解释了单变量时间序列分析。在协方差平稳时间序列的背景下讨论了 Wold 表示定理和 Wold 分解方法。强调了时间序列模型中有限数量参数的重要性,以及自回归模型和平稳性条件。该视频最后介绍了自回归过程、Yule-Walker 方程、矩量法、非平稳行为和使用信息标准的模型选择。
9.波动率建模
9.波动率建模
该视频提供了波动率建模的广泛概述,探索了该领域的各种概念和技术。讲师首先介绍自回归移动平均 (ARMA) 模型及其与波动率建模的相关性。 ARMA 模型用于捕捉布朗运动过程中冲击的随机到达。演讲者解释说,这些模型假设存在一个过程 pi of t,它代表一个泊松过程,计算发生的跳跃次数。跳跃由服从泊松分布的随机变量 gamma sigma Z_1 和 Z_2 表示。这些参数的估计是通过 EM 算法使用最大似然估计进行的。
然后,该视频深入探讨了模型选择和标准的主题。讨论了不同的模型选择标准以确定最适合给定数据集的模型。 Akaike 信息准则 (AIC) 用于衡量模型与数据的拟合程度,并根据参数数量对模型进行惩罚。贝叶斯信息准则 (BIC) 类似,但对添加的参数引入对数惩罚。 Hannan-Quinn 准则提供了介于对数项和线性项之间的中间惩罚。这些标准有助于为波动率建模选择最佳模型。
接下来,视频介绍了 Dickey-Fuller 检验,这是评估时间序列是否符合简单随机游走或是否显示单位根的宝贵工具。讲师解释了该测试在检测非平稳过程中的重要性,这在使用 ARMA 模型时可能会带来挑战。重点介绍了与使用 ARMA 模型对非平稳过程建模相关的问题,并讨论了解决这些问题的策略。
该视频最后展示了 ARMA 模型在真实世界示例中的应用。讲师演示了如何在实践中应用波动率建模以及 ARMA 模型如何捕捉时间相关的波动率。该示例用于说明波动率建模技术的实际相关性和有效性。
总之,本视频全面概述了波动率建模,涵盖 ARMA 模型的概念、Dickey-Fuller 检验、模型选择标准和实际应用。通过探索这些主题,该视频提供了对金融市场等各个领域中波动性建模和预测所涉及的复杂性和策略的见解。
10. 正规定价和风险模型
10. 正规定价和风险模型
在这个内容丰富的视频中,广泛涵盖了利率产品(特别是债券和掉期)的正规定价和风险模型的主题。演讲者首先解决了这些模型中不适定性的挑战,其中即使输入的微小变化也会导致显着的输出。为了克服这一挑战,他们提出使用平滑基函数和惩罚函数来控制波动率表面的平滑度。 Tikhonov 正则化是作为一种技术引入的,它可以对振幅进行惩罚,减少噪声的影响并提高模型的意义。
演讲者深入探讨了交易者在该领域采用的各种技术。他们讨论了样条技术和主成分分析 (PCA),用于识别市场差异并做出明智的交易决策。解释了债券的概念,涵盖定期支付、期限、面值、零息债券和永续债券等方面。强调了构建收益率曲线为不同期限的掉期投资组合定价的重要性。
详细讨论了债券和掉期的利率和定价模型。演讲者承认单一数字模型在预测价格变化方面的局限性,并介绍了掉期的概念以及交易者如何为掉期利率报出价和报价水平。解释了定价掉期收益率曲线的构建,以及用于校准和样条类型的输入工具的选择。使用实际示例演示了使用三次样条校准掉期并确保它们按面值重新定价的过程。
该视频进一步探讨了三个月远期利率的曲线以及与市场观察相匹配的公平价格的必要性。然后重点转移到交易点差和确定最具流动性的工具。讨论了创建对市场变化不敏感的曲线的挑战,强调了与此类策略相关的巨大成本。解决了对改进对冲模型的需求,并提出了一个新的投资组合风险通用公式。主成分分析用于分析市场模式和场景,使交易者能够使用流动性和成本效益高的掉期进行对冲。
深入探讨了正则化定价和风险模型,强调了 PCA 模型的缺点,例如不稳定性和对异常值的敏感性。强调了将风险转化为更易于管理和流动性更强的数字的好处。该视频解释了关于风险矩阵行为的额外约束和想法如何增强这些模型。讨论了使用 B 样条、罚函数、L1 和 L2 矩阵以及吉洪诺夫正则化来提高稳定性和减少定价错误的方法。
演讲者解决了校准波动率曲面的挑战,提供了对不确定问题和不稳定解决方案的见解。解释了表面作为矢量的表示和基函数的线性组合的使用。重新审视不适定性的概念,并强调使用平滑基函数约束输出的重要性。
涵盖了各种技术和方法,包括截断奇异值分解 (SVD) 和使用样条技术的拟合函数。解释了插值图的解释及其在校准和套利市场差异中的应用。讨论了掉期及其在波动率建模中的作用,以及它们为交易者带来的机会。
该视频最后强调了规范化定价和风险模型在识别市场异常和促进知情交易决策方面的相关性。它强调债券的流动性和使用掉期建立曲线,同时也承认在没有稳定曲线的情况下对 PCA 模型的依赖。总体而言,该视频提供了对利率产品的正规化定价和风险模型的全面理解,为观众提供了该领域的宝贵知识。
11.时间序列分析二
11.时间序列分析二
本视频以上一讲关于波动率建模的讨论为基础,深入探讨了时间序列分析的各个方面。教授首先介绍了 GARCH 模型,该模型提供了一种灵活的方法来衡量金融时间序列的波动性。探讨了最大似然估计与 GARCH 模型的结合使用,以及使用 t 分布作为时间序列数据建模的替代方法。还讨论了 t 分布与正态分布的近似。接下来是多元时间序列,讲座涵盖了互协方差和 Wold 分解定理。演讲者阐明了向量自回归过程如何将高阶时间序列模型简化为一阶模型。此外,还讨论了稳态 VAR 过程的均值计算及其作为回归方程组的表示。
然后,讲座更深入地研究了用于时间序列分析的多元回归模型,通过每个组件序列的单独单变量回归模型强调了其规范。引入了矢量化算子的概念,证明了它在将多元回归模型转换为线性回归形式方面的实用性。还解释了估计过程,包括最大似然估计和模型选择标准。本讲座最后展示了向量自回归模型在分析与增长、通货膨胀、失业和利率政策影响相关的时间序列数据中的应用。脉冲响应函数用于理解时间序列的一个组成部分中的创新对其他变量的影响。
此外,还讨论了上一课的波动率建模的延续。定义了允许金融时间序列中随时间变化的波动性的 ARCH 模型。 GARCH 模型是 ARCH 模型的扩展,具有附加参数,突出了其优于 ARCH 模型的优势,为波动率建模提供了更大的灵活性。讲师强调 GARCH 模型假设收益序列中的新息服从高斯分布。
此外,探索了使用最大似然估计的 GARCH 模型的实现。平方残差的 ARMA 模型可以表示为新息的多项式滞后来衡量条件方差。通过确保算子的根位于单位圆之外来确定长期方差的平方根。最大似然估计涉及基于数据和未知参数建立似然函数,联合密度函数表示为时间序列的连续条件期望的乘积。这些条件密度服从正态分布。
讨论了与估计 GARCH 模型相关的挑战,主要是由于对基础参数的限制。为了优化一个凸函数并找到它的最小值,需要将参数变换到一个没有限制的范围内。拟合模型后,使用各种测试评估残差以评估正态性和分析不规则性。一个名为 rugarch 的 R 程序包用于拟合欧元兑美元汇率的 GARCH 模型,在拟合汇率回报的平均过程后使用正常的 GARCH 项。使用 Akaike 信息准则确定自回归过程的顺序,并生成自回归残差的正态分位数-分位数图以评估模型。
讲师还强调了 t 分布的使用,与高斯分布相比,它提供了更重的尾部分布,用于建模时间序列数据。具有 t 分布的 GARCH 模型可以有效地估计波动率并计算风险价值限制。 t 分布可以很好地近似于正态分布,讲师鼓励探索不同的分布以增强时间序列建模。此外,还讨论了 t 分布与正态分布的近似。当 t 分布具有 25-40 个自由度时,可以认为它是正态分布的合理近似。讲师展示了一个比较标准正态分布和具有 30 个自由度的标准 t 分布的概率密度函数的图表,证明这两个分布相似但尾部不同。
在讲座中,教授继续讲解使用向量自回归(VAR)模型分析时间序列数据。重点是了解变量之间的关系以及创新对感兴趣变量的影响。为了分析 VAR 模型中变量之间的关系,使用了多元自相关函数 (ACF) 和偏自相关函数 (PACF)。这些函数捕获变量之间的交叉滞后,并提供对它们之间动态交互的洞察。通过检查 ACF 和 PACF,可以识别显着滞后及其对变量的影响。此外,脉冲响应函数 (IRF) 用于了解创新随时间对变量的影响。创新是指其中一个变量的冲击或意外变化。 IRF 说明了变量如何响应多元时间序列的一个组成部分中的创新。此分析有助于了解冲击在整个系统中的传播和幅度。
例如,如果失业率出现创新,IRF 可以显示这种冲击如何影响其他变量,例如联邦基金利率和消费者价格指数 (CPI)。可以观察响应的幅度和持续时间,从而深入了解系统内的相互依赖性和溢出效应。除了 IRF 之外,还可以使用其他统计方法,例如预测误差方差分解 (FEVD)。 FEVD 将每个变量的预测误差方差分解为自身冲击和其他变量冲击的贡献。该分析允许量化不同冲击在驱动每个变量的可变性方面的相对重要性。通过使用 VAR 模型并分析 ACF、PACF、IRF 和 FEVD,研究人员可以全面了解多变量时间序列中的关系和动态。这些见解对于预测、政策分析和理解经济变量之间复杂的相互作用很有价值。
综上所述,讲座强调了VAR模型在时间序列数据分析中的应用。它强调使用 ACF 和 PACF 捕获交叉滞后,使用 IRF 检查创新的影响,使用 FEVD 量化不同冲击的贡献。这些技术使人们能够更深入地了解多变量时间序列中的关系和动态,从而促进准确的预测和政策决策。
12.时间序列分析三
12.时间序列分析三
在这个关于时间序列分析的 YouTube 视频中,教授介绍了一系列模型及其在不同场景中的应用。该视频深入探讨了向量自回归 (VAR) 模型、协整和线性状态空间模型等主题。这些模型通过检查自相关和偏自相关系数,对于预测失业、通货膨胀和经济增长等变量至关重要。
该视频首先介绍了用于估计和预测时间序列模型的线性状态空间建模和卡尔曼滤波器。线性状态空间建模涉及建立观察和状态方程以促进模型估计过程。卡尔曼滤波器是一种强大的工具,可计算似然函数并为估计和预测提供基本条件。
然后,讲师解释了如何推导自回归移动平均 (ARMA) 过程的状态空间表示。这种方法允许灵活表示时间序列中变量之间的关系。该视频强调了 Harvey 1993 年工作的重要性,该工作为 ARMA 过程定义了特定的状态空间表示。
接下来,该视频探讨了 VAR 模型在宏观经济变量中的应用,以预测增长、通货膨胀和失业率。通过分析自相关和偏自相关系数,研究人员可以确定变量之间的关系并识别模式和相关性。该视频提供了一个回归模型示例,说明了如何将联邦基金利率建模为滞后失业率、联邦基金利率和 CPI 的函数。这个例子表明,失业率的上升往往会导致下个月的联邦基金利率下降。
然后引入协整的概念,解决非平稳时间序列及其线性组合。协整涉及找到一个向量 beta,它在与感兴趣的变量组合时产生一个平稳的过程。该视频讨论了利率期限结构、购买力平价以及现货和期货关系等示例。一个使用能源期货,特别是原油、汽油和取暖油合约的例子展示了协整的概念。
该视频进一步探讨了 VAR 模型的估计和协整向量自回归过程的分析。参考了 Sims、Stock 和 Watson 的工作,其中展示了如何将最小二乘估计量应用于这些模型。还提到了协整关系的最大似然估计和秩检验。介绍了关于裂纹扩展数据的案例研究,包括使用增强的 Dickey-Fuller 测试来测试非平稳性。接下来,视频重点介绍原油期货数据以及非平稳和整合订单的确定。 Johansen 程序用于检验协整过程的秩。与平稳关系相对应的特征向量提供了对原油期货、汽油 (RBOB) 和取暖油之间关系的见解。
然后讲座介绍了线性状态空间模型,作为表达经济和金融中使用的各种时间序列模型的一种方式。解释了状态方程和观测方程,展示了该建模框架的灵活性。该视频说明了将具有时变贝塔值的资本资产定价模型表示为线性状态空间模型。通过在回归参数中加入时间依赖性,该模型捕获动态变化。此外,讲师讨论了随时间改变回归参数的概念,假设它们遵循独立的随机游走。解释了联合状态空间方程及其在添加新数据时递归更新回归的实现。 P 阶自回归模型和 Q 阶移动平均模型表示为线性状态空间模型。
然后讲座深入研究状态方程和观察方程,强调它们在基本状态之间转换中的作用。探讨了 ARMA 过程的状态空间表示的推导,突出了定义状态和基础转换矩阵的灵活性。
本讲座概述了线性状态空间模型在时间序列分析中的应用。演讲者解释说,这些模型可用于通过结合观察到的数据和潜在状态来估计和预测感兴趣的变量。通过利用作为递归算法的卡尔曼滤波器,模型可以计算给定观察数据的状态的条件分布,以及预测未来状态和观察结果。
本讲座强调理解线性状态空间模型的关键组成部分的重要性。状态方程表示基础状态随时间的转变动力学,而观察方程将观察到的数据与基础状态相关联。这些方程以及初始状态分布定义了模型结构。
讲师继续讨论线性状态空间模型的估计过程。最大似然估计通常用于根据观测数据估计模型的未知参数。卡尔曼滤波器通过计算似然函数在这个过程中起着至关重要的作用,似然函数衡量模型和数据之间的拟合优度。
此外,讲座强调线性状态空间模型为模拟各种经济和金融现象提供了一个灵活的框架。它们可用于表示自回归模型、移动平均模型,甚至更复杂的模型,例如具有时变贝塔的资本资产定价模型。这种多功能性使线性状态空间模型成为经济学和金融领域研究人员和从业人员的宝贵工具。为了进一步说明线性状态空间模型的实际应用,讲座介绍了原油期货合约的案例研究。通过分析原油、汽油和取暖油等不同期货合约价格之间的关系,演讲者展示了如何利用线性状态空间模型来识别能源市场的模式、预测价格和评估风险。
总之,该视频全面概述了线性状态空间模型及其在时间序列分析中的应用。通过利用卡尔曼滤波器,这些模型使研究人员能够估计和预测感兴趣的变量,了解潜在状态的动态,并捕捉变量之间的复杂关系。该讲座强调了线性状态空间模型在各种经济和金融环境中的灵活性和实用性,使其成为实证分析和决策制定的宝贵工具。
13.商品模型
13.商品模型
在这段视频中,演讲者深入探讨了复杂的商品模型世界,强调了定量分析师在该领域面临的挑战。他们提供了富有洞察力的例子,例如 Trafigura 在 2009 年创纪录的利润,这是通过战略性原油采购和储存实现的。演讲者讨论了存储投标的各种策略、优化问题以及商品模型中稳定性和鲁棒性的重要性。此外,他们探索了商品价格建模的复杂性,重点关注电力价格所需的独特考虑因素。演讲者提出了一种适合商品环境的替代方法,将其与固定收益、外汇和股票市场中使用的方法区分开来。
该视频首先阐明了商品领域定量分析师解决的具体问题。举了一个说明性的例子,以 Trafigura 为特色,该公司从 2009 年的油价急剧下跌中获利巨大。演讲者解释了期货合约如何在商品市场中发挥作用,强调了期货溢价和现货溢价的概念。 Contango 是指未来现货价格超过当前现货价格的情况,使交易者即使在价格下跌期间也能产生利润。
接下来,演讲者深入探讨了托克在 2009 年 2 月至 2010 年原油价格从每桶 35 美元飙升至 60 美元期间的盈利策略。通过以 35 美元的价格借款,购买和储存原油,然后以 60 美元的更高价格出售,托克获得了每桶 25 美元的可观利润。这一策略被大规模采用,涉及数百万桶的存储,从而带来了显着的收益。演讲者强调需要在存储拍卖中仔细制定战略,以有效收回成本并产生额外利润。
该视频继续讨论了两种不同的商品模型存储投标策略。第一种策略涉及交易员竞标 8 月份的期货合约,并在 12 月份卖出,而无需借款。宽客采用的第二种策略是卖出 8 月和 12 月合约之间的价差期权。该期权的价值由两份合约之间的价格差异决定,正差异为期权所有者带来利润,负差异则没有利润。虽然第二种策略更为复杂,但它为公司提供了额外的价值。
使用商品模型在 8 月 1 日销售产品的优势将在后续部分讨论。通过在特定日期出售期权,卖方将获得一个由公式确定的期权价值,通常高于当前市场价值。这使卖方在投标过程中处于有利地位,使他们能够获得自己选择的利润率。演讲者还阐明了期权风险的计算以及如何利用实物或实物资产来减轻该风险。
然后,该视频深入探讨了商品模型中差价期权的复杂性,强调需要在考虑技术、合同、法律和环境限制的同时确定最有价值的期权组合。演讲者强调了以保证在期权到期时提取价值的方式出售期权组合的重要性,同时考虑到注入和提取率的限制。
另一个部分讨论了涉及商品模型和存储的优化问题。问题围绕着当存储容量耗尽时从商品选项中提取价值,以及当存储容量变空时从存储中出售。演讲者解释了问题中涉及的变量和约束,并演示了如何通过一系列选项优化投资组合以实现利润最大化。问题的复杂性要求使用布尔变量并关注利润最大化。
该视频进一步探讨了商品模型的挑战,特别是与注入和提取率、产能限制以及数量和价格等未知变量相关的挑战。这些因素导致问题的非线性性质,使得在处理大量变量和约束时极难解决。可以采用包括近似、蒙特卡洛模拟和随机控制在内的几种方法来解决商品模型的复杂性。然而,结果的准确性在很大程度上取决于所用参数的精度。如果参数不正确,即使是最细致的方法也可能导致错误的结果。
然后,演讲者继续讨论他们选择的商品建模方法,该方法优先考虑稳健性和稳定性,而不是捕捉价格行为的完整丰富性。他们告诫不要过度参数化模型,因为它会引入不稳定,导致即使是微小的变化也会显着影响其价值。通过采用不同的方法,他们优先考虑稳定性和稳健性,允许外部监管机构验证模型。此外,模型的每个组件都可以在市场上交易,这在当前的市场格局中具有重要意义。还解释了动态对冲的概念,展示了如何在没有活跃期权市场的情况下使用简单的播放器函数复制期权的价值并实现支付。
演讲者深入探讨了通过动态对冲复制期权支付的概念。这种策略使交易者即使在没有买家的情况下也可以出售投资组合。他们强调制定战略以提取价值并与存储设施运营商合作以成功执行计划的重要性。演讲者解释了如何将这种方法扩展到对实体资产(例如油轮和发电厂)建模,以根据电力和燃料价格做出明智的决策来实现利润最大化。虽然每项资产的性质可能不同,但概念方法保持不变,因此需要全面了解与每项资产相关的独特复杂性和限制。
在随后的部分中,视频探讨了根据发电厂效率计算生产一兆瓦时电力的成本的过程。效率量化为以毫米 BTU 为单位的热耗率,表示产生一兆瓦时电力所需的天然气量。与天然气发电厂对应的常数通常介于 7 到 20 之间,值越低表示效率越高。还考虑了与生产一兆瓦时相关的额外成本,例如空调和人工。该视频进一步深入探讨了确定发电厂的价值以及构建价格和燃料成本分布以确定收购发电厂的适当付款。
商品价格建模的挑战,尤其是电力价格,将在下一节中讨论。由于数据中存在肥尾和尖峰,因此无法使用布朗运动准确地对电价分布进行建模。此外,与股票市场相比,电价的波动性要高得多。讲师强调这些挑战在所有地区都很普遍,并强调了捕捉尖峰均值回归以准确表示电价行为的必要性。其他现象,如高峰态、状态切换和非平稳性也需要纳入模型中。
该视频探讨了与商品价格建模相关的挑战,重点介绍了各种方法,包括均值回归、跳跃和状态转换。然而,这些模型往往很复杂且难以管理。相反,演讲者提出了一种专门针对商品领域量身定制的独特方法,与固定收益、外汇和股票市场采用的方法不同。这种方法更符合商品市场的特点和复杂性。
发言者强调商品价格主要受供需动态驱动。然而,事实证明,仅基于价格的传统方法不足以捕捉商品价格行为的复杂性。为了解决这个问题,演讲者建议结合基本面建模,同时确保模型与可用的市场数据保持一致。他们解释了电力价格是如何通过拍卖来自不同效率的发电厂的投标来形成的,以及最终价格是如何根据需求来确定的。由于随机燃料价格因素的影响,描绘需求与价格之间关系的散点图显示出多样化的分布。
此外,演讲者解释说,电力价格由需求和燃料价格共同决定,因为发电成本取决于燃料价格。此外,需要对停电的发生进行建模,因为市场是有限的,如果少数发电厂出现停机,电价可能会受到影响。为了整合这些因素,演讲者建议构建一个发电堆栈,它代表市场中每个参与者的发电成本。通过考虑燃料价格和停电,可以调整发电堆以准确匹配市场价格和期权价格。
视频继续讨论如何为不同的商品建模以了解电价的演变。演讲者解释了燃料价格、停电和需求行为的建模过程。随后,构建发电堆,表示由需求、停电、可变成本和燃料价格等因素决定的曲线。仔细选择参数以匹配电力价格和其他相关市场参数的远期曲线。这种方法可以相对轻松地捕获电力市场中的价格峰值。演讲者指出,天然气、取暖油和燃料油是可储存的商品,使它们的行为更有规律,更容易建模。
展望未来,演讲者强调了如何利用商品模型来预测市场电价,同时考虑温度、供应和需求等因素。通过利用蒙特卡罗模拟和对燃料价格分布的全面了解,可以实现对温度波动引起的价格峰值的准确模拟。该模型还可以准确地捕获市场的相关结构,而无需将其作为输入。然而,需要强调的是,维护这样的模型需要大量的信息和组织,因为必须跟踪每个发电厂和市场变化。
在视频的最后一部分,演讲者承认了为不同市场构建商品模型所面临的挑战。该过程是一项艰巨的任务,需要多年的开发,使其成为一项昂贵的工作。尽管涉及复杂性,演讲者认为所涵盖的主题是结束讨论的好点,并邀请观众提出他们可能有的任何遗留问题。
总体而言,该视频对定量分析师在构建商品模型时所面临的挑战提供了宝贵的见解。它强调了在建模方法中优先考虑稳定性和稳健性的重要性、商品价格建模的复杂性以及供应、需求和燃料价格等基本因素在影响电价中的作用。演讲者还强调了与行业利益相关者合作的重要性,以及为不同市场维护和更新商品模型所需的持续努力。
14. 投资组合理论
14. 投资组合理论
投资组合理论是金融学中的一个基本概念,侧重于投资组合的绩效和最佳构建。它涉及分析多种资产的预期回报、波动性和相关性,以确定最有效的投资组合分配。有效边界代表一系列具有不同波动水平的可行投资组合。通过引入无风险资产,可行集扩展到包括无风险资产和其他资产的组合,形成一条直线。
参数的准确估计对于评估投资组合和解决投资组合优化的二次规划问题至关重要。公式用于计算基于各种约束的最佳权重,例如只做多头的投资组合、持有约束和基准敞口约束。效用函数用于定义财富偏好并在考虑风险规避的同时最大化预期效用。
该视频深入探讨了使用交易所交易基金 (ETF) 和市场中性策略的投资组合理论的应用。可以实施不同的约束来控制投资组合中的风险和变化,包括对市场因素的敞口限制和最小交易规模。演讲者探讨了投资于美国市场各个工业部门的九只 ETF 的最佳配置,考虑了投资组合分析工具和资本约束对最佳投资组合的影响。还讨论了对冲基金采用的市场中性策略,强调了它们分散化和降低相关性的潜力。
在评估投资组合时,选择适当的风险措施至关重要。均值-方差分析是常用的,但平均绝对偏差、半方差、风险值和条件风险值等替代风险度量可以提供额外的见解。因子模型的使用有助于估计方差-协方差矩阵,提高投资组合优化的准确性。
在整个视频中,演讲者强调了准确参数估计的重要性、约束对投资组合构建的影响以及风险度量在投资组合评估中的重要性。投资组合理论提供了一个框架,可以在不确定的情况下做出理性的投资决策,同时考虑对更高回报、更低波动性和风险规避的偏好。通过应用这些概念,投资者可以构建适合其风险承受能力和投资目标的均衡投资组合。
在视频的后续部分中,演讲者进一步探讨了投资组合理论的复杂性及其实际意义。以下是所涵盖要点的摘要:
投资组合优化的历史理论:演讲者首先讨论了投资组合优化的历史基础,重点是马科维茨均值方差优化。这种方法根据平均收益和波动率分析投资组合。它为理解风险和回报之间的权衡提供了一个框架,并作为现代投资组合理论的基础。
不确定性下的效用理论和决策:引入效用理论,特别是冯·诺伊曼-摩根斯坦效用理论,以指导不确定性下的理性决策。效用函数用于表示投资者对财富的偏好,考虑到更高回报和更低波动性等因素。演讲者解释了投资组合理论中常用的各种效用函数,包括线性函数、二次函数、指数函数、幂函数和对数函数。
约束和替代风险措施:该视频探讨了在投资组合优化中包含约束。可以实施这些限制以确保特定的投资标准,例如只做多头的投资组合、周转率限制和对某些市场因素的敞口限制。此外,演讲者还讨论了传统均值-方差分析之外的替代风险度量,例如考虑偏度、峰态和连贯风险度量的度量。
解决投资组合优化问题:演讲者提供了解决投资组合优化问题的数学见解。通过将其表述为二次规划问题,可以确定投资组合的最佳权重。拉格朗日条件和一阶条件用于求解这些权重,二阶导数表示协方差矩阵。该解决方案允许在特定约束条件下最大化回报,同时最小化波动性。
有效边界和资本市场线:引入有效边界的概念,代表一组在给定风险水平下实现最高回报的最优投资组合。演讲者解释了有效边界是如何根据各种投资组合的风险回报曲线形成的。此外,还讨论了资本市场线,说明了将无风险资产与市场组合相结合时风险与收益之间的关系。它使投资者能够确定任何所需风险水平的预期回报。
参数估计和风险度量:突出了准确参数估计的重要性,因为它显着影响投资组合分析。演讲者强调使用因子模型来估计方差-协方差矩阵,为优化提供更精确的输入。此外,还解释了不同的风险度量,例如平均绝对偏差、半方差、风险价值和条件风险价值,它们的适用性取决于所投资资产的具体特征。
在整个视频中,演讲者强调了使用交易所交易基金 (ETF) 和市场中性策略的投资组合理论的实际应用。详细讨论了使用约束来管理投资组合中的风险和变化、资本约束对最优投资组合的影响以及市场中性策略对多元化的好处。
总的来说,该视频全面概述了投资组合理论,涵盖了从历史基础到实际实施的各个方面。它强调准确估计的重要性、约束的结合、风险措施的选择以及不同投资策略的潜在收益。通过理解这些概念,投资者可以做出明智的决定,以构建符合其风险偏好和投资目标的投资组合。
一个特定的值。通过投资于无风险资产,投资者可以以较低的方差获得较高的回报,扩大投资机会。讲师提供了确定最佳投资组合的公式,该投资组合按比例投资于风险资产,但权重分配不同,具体取决于目标回报。这些公式还提供了投资组合方差的封闭式表达式,由于使用最优投资组合时的权衡,它随着目标回报的增加而增加。完全投资的最优投资组合称为市场投资组合。
15. 因素建模
15. 因素建模
在本节中,视频深入探讨了因子建模的实际方面,包括基础参数的估计和因子模型的解释。演讲者强调了将模型拟合到特定数据周期的重要性,并承认对因素之间的动态和关系进行建模至关重要。
该视频解释了最大似然估计方法可用于估计因子模型的参数,包括因子载荷和 alpha。估计过程涉及使用具有估计因子载荷和 alpha 值的回归公式来估计因子实现。 EM(期望最大化)算法被强调为复杂似然函数的强大估计方法,因为它在假设已知隐藏变量的情况下迭代地估计隐藏变量。
讨论了因子建模在商品市场中的应用,强调识别驱动回报和协方差的潜在因素。这些估计因素可以作为其他模型的输入,从而更好地了解市场的过去和变化。演讲者还提到了使用变换矩阵 H 考虑估计因子的不同变换的灵活性。
引入似然比检验作为检验因子模型维数的一种方法。通过将估计的因素模型的可能性与简化模型的可能性进行比较,可以评估其他因素的重要性和相关性。这种测试方法有助于确定要包含在模型中的适当数量的因素。
本节最后强调了对因素动态及其结构关系进行建模的重要性。因子模型提供了一个框架,用于理解因子之间的相互作用及其对资产回报和协方差的影响。通过考虑动态和结构关系,投资者和分析师可以获得对金融市场潜在驱动因素的宝贵见解。
总体而言,本节扩展了因子建模主题,探讨了参数估计、因子模型的解释以及因子建模在商品市场中的应用。本节强调需要适当的建模技术和了解因素之间的动态和关系,以获得对金融市场的有意义的见解。
原始变量 x 的仿射变换。主成分变量的平均值为 0,协方差矩阵由特征值的对角矩阵给出,它们表示一个线性因子模型,其因子载荷由 gamma_1 给出,残差项由 gamma_2 p_2 给出。但是,gamma_2 p_2 向量可能没有对角协方差矩阵。