量化交易 (Quantitative trading) - 页 11

MetaQuotes 2023.06.13 13:58 #101

6.回归分析

在这个综合视频中，我们深入探讨了回归分析的主题，探讨了它在统计建模中的意义。在我们讨论线性回归的目标、线性模型的设置以及拟合回归模型的过程时，线性回归占据了中心位置。为了确保坚实的基础，我们首先解释残差分布的假设，包括著名的高斯-马尔可夫假设。此外，我们引入了广义高斯-马尔可夫定理，它提供了一种在回归分析中估计协方差矩阵的方法。

我们强调将主观信息纳入统计建模和容纳不完整或缺失数据的重要性。统计建模应根据所分析的特定过程进行调整，我们告诫不要盲目地将简单线性回归应用于所有问题。解释了 beta 的普通最小二乘估计，以及归一化方程、帽子矩阵和用于估计回归参数的高斯-马尔可夫定理。我们还涵盖了组件之间具有非零协方差的回归模型，从而允许采用更灵活和现实的方法。

为了进一步扩展我们的理解，我们探讨了多元正态分布的概念及其在求解最小二乘估计量分布中的作用，假设残差呈正态分布。涵盖矩生成函数、QR 分解和最大似然估计等主题。我们解释了 QR 分解如何简化最小二乘估计，并给出了关于正态线性回归模型的基本结果。我们定义了似然函数和最大似然估计，强调了正态线性回归模型中最小二乘和最大似然原理之间的一致性。

在整个视频中，我们强调了回归分析中涉及的迭代步骤。这些步骤包括确定响应变量和解释变量、指定假设、定义估计标准、将所选估计量应用于数据以及验证假设。我们还讨论了检查假设、进行影响诊断和检测异常值的重要性。

总之，该视频全面概述了回归分析，涵盖的主题包括线性回归、高斯-马尔可夫假设、广义高斯-马尔可夫定理、建模中的主观信息、普通最小二乘估计、帽矩阵、多元正态分布、矩生成函数、QR 分解和最大似然估计。通过理解这些概念和技术，您将有能力处理回归分析并在您的统计建模工作中有效地利用它。

00:00:00 在本节中，教授介绍了今天讨论的回归分析主题及其在统计建模中的重要性。该方法，尤其是线性回归，功能强大，广泛应用于金融和其他应用统计学科。教授讨论了回归分析的各种目标，包括提取/利用自变量和因变量之间的关系、预测、因果推理、近似，以及揭示变量之间的函数关系/验证函数关系。此外，线性模型是从数学的角度建立的，讲座涵盖了普通最小二乘法、高斯-马尔可夫定理和正规线性回归模型的形式模型，然后扩展到更广泛的类别。
00:05:00 在本节中，探讨了线性回归分析的概念，其中线性函数对给定自变量的响应变量的条件分布进行建模。回归参数用于定义关系，残差描述数据中的不确定性或误差。此外，可以应用多项式逼近和傅里叶级数来提供完整的描述，尤其是对于循环行为。拟合回归模型的关键步骤包括根据响应变量的规模提出模型并确定关键自变量。值得注意的是，这些自变量可以包括响应变量的不同函数形式和滞后值，使设置相对通用。
00:10:00 在本节中，演讲者讨论了回归分析中涉及的步骤。首先，需要确定解释变量的响应并指定残差分布的假设。其次，需要为如何判断回归参数的不同估计量定义一个标准，并提供多种选择。第三，需要对最佳估计量进行表征并将其应用于给定数据。第四，必须检查他们的假设，如有必要，这可能导致对模型和假设的修改。最后，演讲者强调了根据被建模的过程定制模型的重要性，而不是对所有问题都应用简单的线性回归。本节最后讨论了可以对线性回归模型中的残差分布做出的假设，正态分布是一个常见且熟悉的起点。
00:15:00 在本节中，演讲者解释了回归分析中使用的高斯-马尔可夫假设，重点关注残差的均值和方差。这些假设包括零均值、常量方差和不相关的残差。演讲者还讨论了涉及矩阵值或向量值随机变量的广义高斯-马尔可夫假设。演讲者演示了协方差矩阵如何表征 n 向量的方差，并提供了使用 mu 和 y 值的示例。
00:20:00 在本节中，介绍了广义高斯-马尔可夫定理，作为回归分析中估计协方差矩阵的一种方法。该定理允许自变量、因变量和残差之间具有非零协方差的一般协方差矩阵，并假设它们可以相关。讨论了为什么残差在回归模型中可能相关的非线性示例，以及在拟合回归模型中使用超出高斯分布的各种分布类型以扩展适用性。然后讲座涵盖了回归参数的估计标准以及用于判断什么是好的估计的各种方法，包括最小二乘法、最大似然法、稳健方法、贝叶斯方法以及对不完整或缺失数据的适应。
00:25:00 在本节中，演讲者讨论了将主观信息纳入统计建模的重要性以及贝叶斯方法在适当建模中的实用性。他还强调需要通过使用统计模型来容纳不完整或缺失的数据。此外，演讲者还解释了如何通过分析残差以确定高斯-马尔可夫假设是否适用来检查回归模型中的假设。他还分别提到了影响诊断和异常值检测在识别可能具有高度影响或不寻常的案例中的重要性。最后，他引入了普通最小二乘的概念和最小二乘准则来计算与响应变量实际值的偏差平方和。
00:30:00 在本节中，我们将学习回归分析以及如何求解 beta 的普通最小二乘估计。我们使用矩阵，采用 y 向量、自变量的 n 个值和 X（因变量值的矩阵）来定义拟合值 y hat，等于矩阵 x 乘以 beta。通过取 n 向量的叉积减去 X 矩阵乘以 beta 的乘积，得出 beta 的普通最小二乘估计值，我们可以求解 Q 关于 beta 的二阶导数，最终为 X。转置 X，一个正定或半定矩阵。最后，我们将 Q 相对于回归参数的导数定义为减去第 j 列堆叠乘以 y 的两倍。
00:35:00 在本节中，介绍了回归建模中正规方程的概念。方程组必须满足普通最小二乘估计值 beta。借助矩阵代数，可以求解方程，β hat 的解假设 X 转置 X 逆存在。要使 X 转置 X 逆，X 必须具有满秩，这表明具有由其他自变量解释的自变量会导致秩降低。发现如果 beta 帽子没有满秩，我们对 beta 的最小二乘估计可能不是唯一的。
00:40:00 在回归分析这一节中，引入了帽子矩阵作为投影矩阵，它将响应变量的线性向量带入拟合值。具体来说，它是一个正交投影矩阵，投影到X的列空间上。残差是响应值和拟合值的差值，可以表示为y减去y hat，或者I_n减去H乘以y。原来I_n减去H也是一个投影矩阵，将数据投影到与x的列空间正交的空间上。记住这一点很重要，因为它有助于通过投影到列空间来表示 n 维向量 y，并有助于理解残差与 X 的每一列正交。
00:45:00 在本节中，介绍了高斯-马尔可夫定理作为线性模型理论中的一个强大结果，该定理可用于通过考虑一般感兴趣目标来估计回归参数的函数，该目标是 beta 的线性组合.该定理指出最小二乘估计是参数 theta 的无偏估计，并提供了一种方法来证明这些估计在所有线性无偏估计中具有最小方差，假设满足某些条件。还简要解释了无偏估计量的概念。
00:50:00 在本节中，演讲者讨论了高斯-马尔可夫定理，该定理指出，如果高斯-马尔可夫假设适用，则估计量 theta 在所有线性无偏估计量中具有最小的方差。这意味着只要这是标准，最小二乘估计量就是 θ 的最佳估计量。这个定理的证明是基于考虑另一个线性估计，它也是一个无偏估计，并评估两个估计量之间的差异，这两个估计量的期望必须为 0。证明的数学论证包括方差分解和跟踪协方差项。这个结果是术语 BLUE 估计或最小二乘估计的 BLUE 属性来自计量经济学课。
00:55:00 在本节中，视频讨论了组件之间具有非零协方差的回归模型，以及如何将数据 Y、X 转换为 Y 星和 X 星以满足原始高斯-马尔可夫假设，使响应变量具有常量方差且不相关。该视频解释说，对于具有非常大方差的响应值，这些广义最小二乘法会通过 sigma inverse 对那些值进行折扣。然后，该视频深入研究了正态回归模型的分布理论，假设残差是均值为 0 且方差为 sigma 平方的正态分布，并且响应变量将具有恒定方差，但由于它们对因变量的均值不同而分布不均。
01:00:00 在本节中，将针对均值向量和协方差矩阵讨论多元正态分布的概念。目标是在假设残差呈正态分布的情况下求解最小二乘估计量的分布。引入力矩生成函数作为导出 Y 和 beta 帽的联合分布的一种方法。对于多元正态分布，Y 的矩生成函数是各个矩生成函数的乘积，Y 的分布是均值 mu 和协方差矩阵 sigma 的正态分布。求解 beta 帽的力矩生成函数以确定其分布，即多元正态分布。
01:05:00 在本节中，演讲者讨论了 beta hat 的矩生成函数，以及它如何等效于一个多元正态分布，均值为某个对象给出的真实 beta 和协方差矩阵。每个 beta 帽的边缘分布由均值 beta_j 和方差等于对角线的单变量正态分布给出，这可以从高斯矩生成函数证明。然后演讲者继续讨论 X 的 QR 分解，这可以通过自变量矩阵的 Gram-Schmidt 正交归一化来实现。通过定义上三角矩阵 R 并通过 Gram-Schmidt 过程求解 Q 和 R，我们可以将任何 n x p 矩阵表示为标准正交矩阵 Q 和上三角矩阵 R 的乘积。
01:10:00 在本节中，讨论了 QR 分解及其在简化最小二乘估计中的应用。通过使用 Gram-Schmidt 过程对 X 的列进行正交化，可以计算 QR 分解以获得简单的线性代数运算来求解最小二乘估计。 beta hat 的协方差矩阵等于 sigma 平方 X 转置 X 逆，帽子矩阵只是 Q 乘以 Q 转置。进一步探索分布理论以提供关于正态线性回归模型的基本结果。
01:15:00 在这一节中，教授讨论了一个重要的定理，对于任意矩阵 A，m 乘 n，它可以将随机向量 y 变换为随机法向量。该定理证明，在构建此类统计量时，最小二乘估计 beta hat 和残差向量 epsilon hat 是独立的随机变量。 Beta 帽的分布是多元正态分布，而残差平方和是卡方随机变量的倍数。还讨论了回归参数估计和 t 统计量。最大似然估计也在正态线性回归模型的背景下进行了解释。事实证明，普通最小二乘估计是最大似然估计。
01:20:00 在本节中，定义了似然函数和最大似然估计。似然函数是给定多元正态随机变量的未知参数的数据的密度函数，最大似然估计确定使观测数据最有可能的这些参数的值。需要注意的是，使用最小二乘法来拟合模型与将最大似然原理应用于正态线性回归模型是一致的。此外，广义 M 估计量作为一类估计量被简要提及，用于寻找回归参数的稳健和分位数估计。

6. Regression Analysis

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading

MetaQuotes 2023.06.13 13:59 #102

7. 风险价值 (VAR) 模型

7. 风险价值 (VAR) 模型

该视频深入讨论了金融行业广泛使用的风险价值 (VAR) 模型的概念。这些模型采用基于概率的计算来衡量公司或个人可能面临的潜在损失。通过使用一个简单的示例，该视频有效地说明了 VAR 模型背后的基本概念。

VAR 模型是个人评估任何一天投资决策亏损概率的宝贵工具。要了解与投资相关的风险，投资者可以分析时间序列的标准差。该指标揭示了随着时间的推移平均回报偏离平均值的程度。通过以平均加减一个标准差对证券进行估值，投资者可以深入了解证券的风险调整后潜在回报。

该视频强调可以使用不同的方法构建 VAR 模型。虽然该视频主要关注参数化方法，但它承认采用蒙特卡罗模拟的替代方法。后一种方法提供了更高的灵活性和定制选项，从而可以进行更准确的风险评估。

此外，该视频探索了反映历史数据集属性的合成数据集的创建。通过采用这种技术，分析师可以生成真实的场景来准确评估潜在风险。该视频还演示了三角函数在描述温度数据中观察到的季节性模式时的应用，展示了风险分析中采用的多种方法。

除了讨论 VAR 模型外，该视频还深入探讨了银行和投资公司采用的风险管理方法。它强调了解公司风险状况和防范风险过度集中的重要性。

总体而言，该视频提供了有关在金融行业中使用 VAR 模型作为风险评估工具的宝贵见解。通过量化与投资相关的风险并采用统计分析，这些模型有助于做出明智的决策并减轻潜在的财务损失。

00:00:00 在此视频中，Ken Abbott 讨论了银行和投资公司使用的风险管理方法。他首先讨论了风险，然后继续讨论风险管理如何涉及了解公司的风险状况，并防止风险过大集中。
00:05:00 风险价值模型是一种估计与特定投资相关的风险的方法，可用于帮助做出关于拥有哪些投资的明智决策。这些模型基于对股票、债券和衍生品行为的统计理解，可用于量化投资者对利率、股票价格和商品价格变化的敏感程度。
00:10:00 该视频解释了 VAR 模型用于衡量风险并确定投资者需要持有多少资金来支持特定市场的头寸。该视频还概述了时间序列分析，用于了解市场随时间的行为。
00:15:00 视频讨论了风险价值 (VAR) 的概念，这是一种使用概率来衡量公司可能遭受的潜在损失的财务模型。该视频使用一个简单的例子来说明这些概念。
00:20:00 风险价值 (VAR) 模型帮助个人评估在任何一天通过投资决策亏损的可能性。时间序列的标准差告诉投资者随着时间的推移平均回报偏离均值的程度。以均值加上或减去一个标准差对证券进行估值可以了解证券的风险调整后潜在回报。
00:25:00 风险价值 (VAR) 模型可以识别投资可能在五年内损失超过其价值 4.2% 的情景。此信息有助于确定投资是否可能获利。
00:30:00 该视频解释了风险价值 (VAR) 模型的工作原理以及它们如何帮助降低风险。引入的概念包括百分比变化和日志变化，以及使用 PV1 和持续时间来衡量风险。该视频还介绍了金融行业中 VAR 模型的使用。
00:35:00 该视频讨论了风险价值 (VAR) 的概念，这是一种风险管理工具，用于计算公司或个人可能因资产波动而遭受的潜在财务损失。还讨论了收益率，并解释说它们由无风险利率和信用利差组成。演示者提供了一个示例，说明如何使用 VAR 来估计公司可能因资产价格变化而遭受的潜在财务损失。
00:40:00 该视频讨论了衡量金融市场风险的风险价值模型。协方差和相关性是风险的两个度量，协方差矩阵是对称的，方差在对角线上，协方差在非对角线上。相关性也是对称的，可以使用协方差除以标准差的乘积来计算。
00:45:00 视频讨论了风险价值 (VAR) 的概念，该概念用于衡量与资产组合相关的财务损失风险。该视频解释了可以使用协方差矩阵和相关矩阵计算 VAR。协方差矩阵衡量资产之间的相关程度，而相关矩阵衡量资产和负债之间的相关程度。然后，该视频展示了如何使用协方差矩阵和相关矩阵计算 VAR 的示例。
00:50:00 风险价值 (VAR) 模型是一种衡量与金融投资相关的风险的方法。该模型使用来自收益和协方差的数据来计算位置向量和顺序统计量。然后将其用于确定投资的风险水平。
00:55:00 该视频提供了关于风险价值模型的 7 张幻灯片演示文稿的要点。在满足某些条件的情况下，这些模型用于计算财务损失的概率。缺失数据可能是个问题，可以使用多种方法来填补空白。该演示文稿还讨论了假设的影响如何对模型的结果产生重大影响。
01:00:00 该视频讨论了风险价值 (VAR) 模型。该模型使用参数化方法，但还有另一种方法使用蒙特卡洛模拟。此方法更灵活，并允许进行更多自定义。
01:05:00 风险价值 (VAR) 模型用于估计因资产价格波动而造成财务损失的可能性。这些模型可用于量化与特定投资或投资组合相关的风险。
01:10:00 在此视频中，作者讨论了风险价值 (VAR) 模型的重要性，并解释说这些模型有助于确保公司不会出现负特征值。他接着说，如果您有上千个观察值，则需要使用称为“缺失数据插补”的过程来填充缺失数据。最后，John 演示了如何创建一个关联随机法线的变换矩阵。
01:15:00 在此视频中，演示者解释了如何使用蒙特卡洛模拟创建模拟投资结果的模型。他还讨论了如何使用高斯 copula 生成更准确的模型。
01:20:00 该视频解释了如何创建合成数据集以使其具有与历史数据集相同的属性。它还演示了如何使用三角学来描述温度数据中的季节性模式。

7. Value At Risk (VAR) Models

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Kenneth AbbottThi...

Quantitative trading 需要编码方面的帮助 Need help with coding

MetaQuotes 2023.06.13 14:00 #103

8. 时间序列分析Ⅰ

8. 时间序列分析Ⅰ

在本视频中，教授首先重新审视最大似然估计法作为统计建模的主要方法。他们解释了似然函数的概念及其与正态线性回归模型的联系。最大似然估计被定义为使似然函数最大化的值，表明观察到的数据被赋予这些参数值的可能性有多大。

教授深入研究解决正态线性回归模型的估计问题。他们强调误差方差的最大似然估计是 n 上的 beta 帽子的 Q，但警告说这个估计是有偏差的，需要通过将它除以 n 减去 X 矩阵的秩来进行校正。随着更多参数被添加到模型中，拟合值变得更加精确，但也存在过度拟合的风险。该定理指出，回归模型的最小二乘估计（现在是最大似然估计）服从正态分布，残差平方和服从自由度等于 n 减去 p 的卡方分布。 t 统计量被强调为评估模型中解释变量重要性的重要工具。

广义 M 估计作为一种通过最小化 beta 函数 Q 来估计未知参数的方法被引入。可以通过为函数 h 选择不同的形式来定义不同的估计量，这涉及对另一个函数的评估。该视频还介绍了稳健的 M 估计器，它利用函数 chi 来确保与估计有关的良好属性，以及分位数估计器。稳健估计器有助于减轻最小二乘估计中离群值或大残差的影响。

然后主题转移到 M 估计量及其在拟合模型中的广泛适用性。介绍了应用于资产定价的线性回归模型的案例研究，重点是资本资产定价模型。教授解释了股票回报如何受到整体市场回报的影响，并根据股票的风险进行衡量。案例研究提供了有关如何使用统计软件 R 收集数据的数据和详细信息。提到了回归诊断，强调了它们在评估个体观察对回归参数的影响方面的作用。引入杠杆作为识别有影响的数据点的度量，并提供了它的定义和解释。

引入了将原油收益等其他因素纳入股票收益模型的概念。分析表明，市场本身并不能有效地解释某些股票的回报，而原油作为一个独立因素有助于阐明回报。以石油公司埃克森美孚为例，展示其回报与油价的相关性。本节以散点图结束，该散点图根据个案与自变量质心的马氏距离指示有影响力的观察结果。

讲师继续讨论单变量时间序列分析，其中涉及将随时间变化的随机变量作为离散过程进行观察。他们解释了严格平稳性和协方差平稳性的定义，协方差平稳性要求过程的均值和协方差随时间保持不变。介绍了自回归移动平均 (ARMA) 模型，以及它们通过集成自回归移动平均 (ARIMA) 模型扩展到非平稳性。还包括平稳模型的估计和平稳性测试。

讨论了协方差平稳时间序列的 Wold 表示定理，指出这样的时间序列可以分解为线性确定性过程和系数由 psi_i 给出的白噪声的加权平均值。白噪声分量 eta_t 具有恒定的方差并且与自身和确定性过程不相关。 Wold 分解定理为此类过程建模提供了一个有用的框架。

讲师讲解了时间序列分析的Wold分解法，包括初始化参数p（代表过去观察的次数），根据最后的p lag值估计X_t的线性投影。通过使用时间序列方法检查残差，例如评估与较长滞后的正交性和与白噪声的一致性，可以确定合适的移动平均模型。 Wold 分解方法可以通过在 p 接近无穷大时采用投影的极限来实现，收敛到数据在其历史上的投影并对应于投影定义的系数。然而，p 与样本大小 n 的比率接近零以确保模型估计有足够的自由度是至关重要的。

强调了在时间序列模型中使用有限数量的参数以避免过度拟合的重要性。滞后算子，表示为 L，是作为时间序列模型中的基本工具引入的，它可以将时间序列移动一个时间增量。滞后算子用于使用多项式 psi(L) 来表示任何随机过程，多项式 psi(L) 是涉及滞后的无限阶多项式。脉冲响应函数被讨论为衡量创新在特定时间点对过程的影响，在该点及以后影响它。演讲者举了一个例子，使用美联储主席的利率变化来说明创新的时间影响。

长期累积响应的概念与时间序列分析有关。这种反应代表了随着时间的推移过程中一项创新的累积效应，并表示该过程正在收敛的价值。它计算为多项式 psi(L) 捕获的各个响应的总和。 Wold 表示是无限阶移动平均值，可以使用多项式 psi(L) 的倒数将其转换为自回归表示。介绍了自回归移动平均 (ARMA) 过程的类别及其数学定义。

然后重点转向 ARMA 模型上下文中的自回归模型。在解决移动平均过程之前，讲座从更简单的案例开始，特别是自回归模型。探索了平稳性条件，并通过用复变量 z 代替多项式函数 phi 引入了与自回归模型相关的特征方程。如果特征方程的所有根都在单位圆之外，则认为过程 X_t 是协方差平稳的，这意味着复数 z 的模大于 1。单位圆外的根必须具有大于 1 的模才能确保平稳性。

在视频的后续部分中，讨论了一阶自回归过程 (AR(1)) 中的平稳性和单位根的概念。给出模型的特征方程，说明协方差平稳性要求phi的量级小于1。表明当phi为正时，自回归过程中X的方差大于新息的方差当 phi 为负时更小。此外，证明了 phi 介于 0 和 1 之间的自回归过程对应于指数均值回归过程，该过程已被用于金融利率模型。

视频进展到特别关注自回归过程，尤其是 AR(1) 模型。这些模型涉及的变量往往会在短期内回归到某个均值，而均值回归点可能会在长期内发生变化。本讲座介绍了用于估计 ARMA 模型参数的 Yule-Walker 方程。这些方程依赖于不同滞后观测值之间的协方差，可以求解所得方程组以获得自回归参数。 Yule-Walker 方程经常用于指定统计包中的 ARMA 模型。

解释了用于统计估计的矩原理方法，特别是在指定和计算似然函数变得具有挑战性的复杂模型的背景下。讲座继续讨论移动平均模型并给出 X_t 期望值的公式，包括 mu 和 gamma 0。时间序列中的非平稳行为通过各种方法解决。讲师强调了适应非平稳行为以实现准确建模的重要性。一种方法是转换数据以使其静止，例如通过差分或应用 Box-Jenkins 的使用一阶差分的方法。此外，还提供了线性趋势回归模型的示例，作为处理非平稳时间序列的一种方法。

演讲者进一步探讨了非平稳过程及其与 ARMA 模型的结合。如果差分（无论是第一次差分还是第二次差分）产生协方差平稳性，则可以将其集成到模型规范中以创建 ARIMA 模型（自回归综合移动平均过程）。这些模型的参数可以使用最大似然估计来估计。为了评估不同的模型集并确定自回归和移动平均参数的顺序，建议使用 Akaike 或 Bayes 信息准则等信息准则。

讨论了向模型添加额外变量的问题，以及惩罚的考虑。讲师强调需要为纳入额外参数建立证据，例如评估超过特定阈值的 t 统计量或采用其他标准。贝叶斯信息准则假设模型中的变量数量有限，假设它们是已知的，而 Hannan-Quinn 准则假设变量数量无限但确保它们的可识别性。模型选择是一项具有挑战性的任务，但这些标准为决策提供了有用的工具。

总之，该视频涵盖了统计建模和时间序列分析的各个方面。它首先解释最大似然估计及其与正态线性回归模型的关系。介绍了广义M估计和鲁棒M估计的概念。介绍了将线性回归模型应用于资产定价的案例研究，然后解释了单变量时间序列分析。在协方差平稳时间序列的背景下讨论了 Wold 表示定理和 Wold 分解方法。强调了时间序列模型中有限数量参数的重要性，以及自回归模型和平稳性条件。该视频最后介绍了自回归过程、Yule-Walker 方程、矩量法、非平稳行为和使用信息标准的模型选择。

00:00:00 在本节中，教授回顾了作为统计建模中主要估计方法的最大似然估计方法，同时讨论了似然函数及其与正态线性回归模型的关系。教授解释说，最大似然估计是使观察到的数据最有可能的函数最大化的值，并且这些值根据未知参数生成数据值的可能性来衡量未知参数。
00:05:00 在本节中，教授讨论了如何解决正态线性回归模型的估计问题。误差方差的最大似然估计是 Q of beta hat over n，但这个估计是有偏差的，需要通过除以 n 减去 X 矩阵的秩来校正。添加到模型中的参数越多，拟合值越精确，但也增加了曲线拟合的危险。该定理指出回归模型的最小二乘法（现在是最大似然估计）呈正态分布，残差平方和呈卡方分布，自由度由 n 减去 p。 t 统计量是评估模型中不同解释变量相关性的重要方法。
00:10:00 在本节中，视频解释了广义 M 估计的概念，它涉及通过最小化 beta 函数 Q 来估计未知参数。通过为 h 选择不同的函数形式，它是另一个函数的评估总和，可以定义不同类型的估计量，例如最小二乘法和最大似然估计。该视频还讨论了稳健的 M 估计量，其中涉及定义函数 chi 以具有良好的估计特性和分位数估计量。稳健估计有助于控制最小二乘估计下非常大的值或残差的不当影响。
00:15:00 在本节中，教授讨论了 M 估计量以及它们如何包含拟合模型中遇到的大多数估计量。该课程介绍了一个案例研究，该案例研究将线性回归模型应用于资产定价。资本资产定价模型被解释为表明股票回报取决于整体市场的回报，并根据股票的风险程度进行衡量。案例研究提供了使用 R 收集数据所需的数据和详细信息。教授提到了回归诊断以及它们如何确定个体观察对回归参数的影响。最后，利用杠杆识别有影响力的数据点，并给出定义和解释。
00:20:00 在本节中，教授介绍了在股票收益建模中添加另一个因素（例如原油收益）以帮助解释收益的概念。分析表明，在本案例研究中，市场无法有效解释 GE 的回归；原油是另一个有助于解释回报的独立因素。另一方面，石油公司埃克森美孚 (Exxon Mobil) 有一个回归参数，该参数显示原油随着油价的上涨和下跌，对其回报率有何影响。本节以散点图结尾，该散点图指示与个案与自变量质心的马氏距离相关的有影响的观察结果。
00:25:00 在本节中，讲师介绍了单变量时间序列分析的主题，它涉及观察随时间变化的随机变量，是一个离散的时间过程。解释了严格和协方差平稳性的定义，其中协方差平稳性较弱并且要求只有过程的均值和协方差随时间保持不变。还讨论了自回归移动平均模型的经典模型及其对集成自回归移动平均模型的非平稳性的扩展，以及如何估计平稳模型和检验平稳性。
00:30:00 在视频的这一部分，演讲者讨论了协方差平稳时间序列的 Wold 表示定理。该定理指出，零均值协方差平稳时间序列可以分解为两个部分：线性确定性过程和白噪声的加权平均值，其系数由 psi_i 给出。演讲者还解释说，白噪声元素 eta_t 具有恒定方差，并且与自身和确定性过程不相关。 Wold 分解定理为此类过程建模提供了一个令人信服的结构。
00:35:00 本节讨论时间序列分析的Wold分解法。该方法涉及初始化参数 p，它表示线性确定性项中过去观察的数量，并估计 X_t 在最后 p lag 值上的线性投影。通过时间序列方法对残差进行分析，如评估残差是否与较长滞后正交、是否与白噪声一致等，可以指定一个移动平均模型并评估其适用性。当 p 变大时，Wold 分解方法可以实现为投影的极限，收敛到数据在其历史上的投影并对应于投影定义的系数。但是，p/n 比需要接近 0，以避免在估计模型时耗尽自由度。
00:40:00 在本节中，演讲者强调了在估计时间序列模型时使用有限数量参数的重要性，因为这有助于避免过度拟合。滞后算子是时间序列模型中的一个重要工具，其中时间序列使用算子 L 以一个时间增量向后移动。任何随机过程都可以使用滞后算子表示，其中 psi 为 L，L 是无限阶多项式滞后。脉冲响应函数与创新在某个时间点的影响有关，该影响会影响该点及以后的过程。演讲者使用美联储主席利率变化的例子来帮助解释随着时间的推移创新的影响。
00:45:00 在本节中，将结合时间序列分析讨论长期累积响应的概念。长期累积响应是流程中一项创新随时间的影响，以及流程正在移动的价值。该响应由各个响应的总和给出，由带有滞后算子的 psi 的多项式表示。 Wold 表示是无限阶移动平均线，它可以使用 L 多项式的 psi 的倒数进行自回归表示。还向观众介绍了具有数学定义的自回归移动平均过程类。
00:50:00 在本节中，重点是 ARMA 模型中的自回归模型。为了更好地理解这些模型，将研究更简单的案例，从自回归模型开始，然后转向移动平均过程。还将探索平稳性条件，其中多项式函数 phi，如果用复数变量 z 代替，将是与自回归模型相关的特征方程。 X_t 的过程是协方差平稳的当且仅当此特征方程的所有根都在单位圆外，即复数 z 的模大于 1，并且根在单位圆外的模大于比 1。
00:55:00 在视频的这一部分中，讨论了一阶自回归过程中的平稳性和单位根的概念。给出模型的特征方程，确定协方差平稳性要求phi的量级在量级上小于1。当 phi 为正时，自回归过程中 X 的方差显示大于新息的方差，当 phi 小于 0 时，X 的方差更小。此外，证明了 phi 在 0 和 1 之间的自回归过程对应于指数均值回归过程已在理论上用于金融利率模型。
01:00:00 在本节中，重点是自回归过程，特别是 AR(1) 模型。这些模型涉及的变量通常会在短时间内返回到某个均值，但均值回归点可能会在很长一段时间内发生变化。本讲座解释了用于估计 ARMA 模型参数的 Yule-Walker 方程。这些方程涉及不同滞后观测值之间的协方差，由此产生的方程组可以求解自回归参数。最后，值得注意的是，Yule-Walker 方程经常用于指定统计包中的 ARMA 模型。
01:05:00 在本节中，解释了统计估计的矩原理方法，特别是在似然函数难以指定和计算的复杂模型中，以及使用参数的无偏估计。然后讨论移动平均模型，计算 X_t 的期望值的公式，其中包括 mu 和 gamma 0。还讨论了时间序列中非平稳行为的调整，特别是通过将数据转换为平稳、Box 和 Jenkins 使用一阶差分的方法，以及线性趋势回归模型的示例。
01:10:00 在本节中，演讲者讨论了非平稳过程以及如何将它们纳入 ARMA 模型。他解释说，如果一阶或二阶差分导致协方差平稳，则可以将其合并到模型规范中以创建 ARIMA 模型或自回归积分移动平均过程。可以使用最大似然指定这些模型的参数，并且可以使用信息标准（例如 Akaike 或贝叶斯信息标准）评估不同的模型集以及自回归和移动平均参数的阶数。
01:15:00 在这一部分，演讲者讨论了在模型中添加额外变量的问题以及应该给予什么样的惩罚。他建议有必要考虑需要哪些证据来纳入额外参数，例如超过某个阈值或其他标准的 t 统计数据。贝叶斯信息准则假设模型中的变量数量有限并且我们知道它们，而 Hannan-Quinn 准则假设模型中的变量数量无限但确保它们是可识别的。模型选择的问题具有挑战性，但可以使用这些标准来解决。

8. Time Series Analysis I

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading 机器学习模型的变量评估和选择 MQL5 中的统计分布 - 充分利用

MetaQuotes 2023.06.13 14:00 #104

9.波动率建模

9.波动率建模

该视频提供了波动率建模的广泛概述，探索了该领域的各种概念和技术。讲师首先介绍自回归移动平均 (ARMA) 模型及其与波动率建模的相关性。 ARMA 模型用于捕捉布朗运动过程中冲击的随机到达。演讲者解释说，这些模型假设存在一个过程 pi of t，它代表一个泊松过程，计算发生的跳跃次数。跳跃由服从泊松分布的随机变量 gamma sigma Z_1 和 Z_2 表示。这些参数的估计是通过 EM 算法使用最大似然估计进行的。

然后，该视频深入探讨了模型选择和标准的主题。讨论了不同的模型选择标准以确定最适合给定数据集的模型。 Akaike 信息准则 (AIC) 用于衡量模型与数据的拟合程度，并根据参数数量对模型进行惩罚。贝叶斯信息准则 (BIC) 类似，但对添加的参数引入对数惩罚。 Hannan-Quinn 准则提供了介于对数项和线性项之间的中间惩罚。这些标准有助于为波动率建模选择最佳模型。

接下来，视频介绍了 Dickey-Fuller 检验，这是评估时间序列是否符合简单随机游走或是否显示单位根的宝贵工具。讲师解释了该测试在检测非平稳过程中的重要性，这在使用 ARMA 模型时可能会带来挑战。重点介绍了与使用 ARMA 模型对非平稳过程建模相关的问题，并讨论了解决这些问题的策略。

该视频最后展示了 ARMA 模型在真实世界示例中的应用。讲师演示了如何在实践中应用波动率建模以及 ARMA 模型如何捕捉时间相关的波动率。该示例用于说明波动率建模技术的实际相关性和有效性。

总之，本视频全面概述了波动率建模，涵盖 ARMA 模型的概念、Dickey-Fuller 检验、模型选择标准和实际应用。通过探索这些主题，该视频提供了对金融市场等各个领域中波动性建模和预测所涉及的复杂性和策略的见解。

00:00:00 作者讨论了波动率模型及其如何帮助估计统计模型。作者指出，有多种模型选择标准可用于确定哪个模型最适合给定的数据集。
00:05:00 Akaike 信息标准衡量模型与数据的拟合程度，它根据模型参数的大小对模型进行惩罚。贝叶斯信息准则类似，但对添加的参数有 log n 惩罚。 Hannan-Quinn 标准在 log n 和 2 之间有一个惩罚。 Dickey-Fuller 检验是一种检验时间序列是否与简单随机游走一致的检验。
00:10:00 该视频概述了波动率建模，包括自回归移动平均 (ARMA) 模型和 Dickey-Fuller 检验的概念。然后视频继续讨论使用 ARMA 模型对非平稳过程建模时可能出现的问题以及如何处理这些问题。最后，该视频提供了 ARMA 模型在真实示例中的应用。
00:15:00 该视频简要介绍了波动率建模，包括对 ACF 和 PACF 函数的讨论、单位根的 Dickey-Fuller 检验和回归诊断。
00:20:00 波动性是衡量金融市场价格或回报可变性的指标。历史波动率是通过计算给定时间段内价格对数的差异来计算的。波动率模型旨在捕捉时间相关的波动率。
00:25:00 波动性衡量证券价格随时间变化的程度。波动率可以通过样本方差的平方根来衡量，并可以转换为年化值。可以使用风险度量方法来估计历史波动率。
00:30:00 波动率模型可以用来预测未来的股票价格，几何布朗运动是常用的模型。 Choongbum 将在后面的讲座中更详细地介绍随机微分方程和随机微积分。
00:35:00 波动率模型是一种预测证券价格随时间变化的数学模型。该模型使用高斯分布来计算给定时间段内的价格。当时间尺度改变时，需要调整模型。
00:40:00 波动率建模可以根据时间的测量方式产生不同的结果。例如，在几何布朗运动模型下，每日收益是从高斯分布中采样的，而在正态模型下，绘制了拟合高斯分布的百分位数。在任何一种情况下，拟合模型的累积分布函数都应以实际百分位数为中心。
00:45:00 Garman-Klass 估计器是一种用于估计波动率的模型，它考虑的信息不仅仅是收盘价。它假设增量为每天一次，对应于每天，并且考虑了一天中市场开盘的时间（用小 f 表示）。
00:50:00 此波动率模型计算开盘至收盘收益的方差以及此估计相对于收盘至收盘估计的效率。
00:55:00 波动率模型是模拟金融资产波动率的随机微分方程。 Garman 和 Klass 的论文发现，最好的尺度不变估计量是仅随尺度因子变化的估计量，并且该估计量的效率为 8.4。
01:00:00 该视频介绍了波动率建模，这是一种处理冲击随机到达布朗运动过程的方法。该模型假设有一个过程pi of t，它是一个泊松过程，统计已经发生的跳跃次数。这些跳跃由 gamma sigma Z_1 和 Z_2 表示，它们是服从泊松分布的随机变量。这些参数的最大似然估计是使用 EM 算法完成的。
01:05:00 “9. 波动率建模”视频介绍了 EM 算法和 ARCH 模型，它们用于对时间相关的波动率进行建模。 ARCH 模型考虑到波动率的时间依赖性，同时仍保持参数约束。该模型用于估计欧元/美元汇率。
01:10:00 波动率建模是估计驱动股价的基本过程的过程。这涉及将自回归模型拟合到平方残差，并测试 ARCH 结构。如果没有 ARCH 结构，那么回归模型将没有可预测性。
01:15:00 GARCH 模型是给定资产平方回报波动率的简化表示。该模型能够很好地拟合数据，并且具有表明波动率具有时间依赖性的特性。
01:20:00 该视频讨论了与预测中的其他模型相比使用波动率模型的好处。 GARCH 模型被证明在捕捉时变波动率方面特别有效。报名实地考察的最后一天是下周二。

9. Volatility Modeling

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading

MetaQuotes 2023.06.13 14:01 #105

10. 正规定价和风险模型

10. 正规定价和风险模型

在这个内容丰富的视频中，广泛涵盖了利率产品（特别是债券和掉期）的正规定价和风险模型的主题。演讲者首先解决了这些模型中不适定性的挑战，其中即使输入的微小变化也会导致显着的输出。为了克服这一挑战，他们提出使用平滑基函数和惩罚函数来控制波动率表面的平滑度。 Tikhonov 正则化是作为一种技术引入的，它可以对振幅进行惩罚，减少噪声的影响并提高模型的意义。

演讲者深入探讨了交易者在该领域采用的各种技术。他们讨论了样条技术和主成分分析 (PCA)，用于识别市场差异并做出明智的交易决策。解释了债券的概念，涵盖定期支付、期限、面值、零息债券和永续债券等方面。强调了构建收益率曲线为不同期限的掉期投资组合定价的重要性。

详细讨论了债券和掉期的利率和定价模型。演讲者承认单一数字模型在预测价格变化方面的局限性，并介绍了掉期的概念以及交易者如何为掉期利率报出价和报价水平。解释了定价掉期收益率曲线的构建，以及用于校准和样条类型的输入工具的选择。使用实际示例演示了使用三次样条校准掉期并确保它们按面值重新定价的过程。

该视频进一步探讨了三个月远期利率的曲线以及与市场观察相匹配的公平价格的必要性。然后重点转移到交易点差和确定最具流动性的工具。讨论了创建对市场变化不敏感的曲线的挑战，强调了与此类策略相关的巨大成本。解决了对改进对冲模型的需求，并提出了一个新的投资组合风险通用公式。主成分分析用于分析市场模式和场景，使交易者能够使用流动性和成本效益高的掉期进行对冲。

深入探讨了正则化定价和风险模型，强调了 PCA 模型的缺点，例如不稳定性和对异常值的敏感性。强调了将风险转化为更易于管理和流动性更强的数字的好处。该视频解释了关于风险矩阵行为的额外约束和想法如何增强这些模型。讨论了使用 B 样条、罚函数、L1 和 L2 矩阵以及吉洪诺夫正则化来提高稳定性和减少定价错误的方法。

演讲者解决了校准波动率曲面的挑战，提供了对不确定问题和不稳定解决方案的见解。解释了表面作为矢量的表示和基函数的线性组合的使用。重新审视不适定性的概念，并强调使用平滑基函数约束输出的重要性。

涵盖了各种技术和方法，包括截断奇异值分解 (SVD) 和使用样条技术的拟合函数。解释了插值图的解释及其在校准和套利市场差异中的应用。讨论了掉期及其在波动率建模中的作用，以及它们为交易者带来的机会。

该视频最后强调了规范化定价和风险模型在识别市场异常和促进知情交易决策方面的相关性。它强调债券的流动性和使用掉期建立曲线，同时也承认在没有稳定曲线的情况下对 PCA 模型的依赖。总体而言，该视频提供了对利率产品的正规化定价和风险模型的全面理解，为观众提供了该领域的宝贵知识。

00:00:00 在本节中，来自摩根士丹利的演讲嘉宾 Ivan Masyukov 博士讨论了利率产品的正则化定价和风险模型，其中涉及向模型添加额外的约束，也称为正则化项。讲座首先解释债券，这是市场上最简单的利率产品之一，涵盖债券的定期支付、到期日和面值。还讨论了直到到期才支付任何费用的零息债券和提供无限支付的永久债券。讲座最后解释了用于分析的现金流量图，绿色箭头表示收到的东西，红色箭头表示支付的东西。
00:05:00 本节引入货币时间价值的概念，未来现金流量越多，贴现系数越小，导致折旧。如果我们有贴现因子，可以找到计算现金流量的公允价值，可以使用贴现模型来表示。讨论了使用一个参数即到期收益率的简单模型。债券的价格可以表示为未来现金流量的线性组合，如果已知债券价格，则可以通过求解债券收益率来求出债券收益率，反之亦然。
00:10:00 在本节中，讨论了债券定价与收益率的概念。债券的经济价值体现在债券价格和现金流量上。收益率将未来现金流量与债券价格相关联，并假设所有时间点的贴现率都是恒定的，但是，它可能并不总是最优的。债券价格对收益率的敏感性及其随市场变化的方式对于确定债券的久期至关重要。债券的久期是时间的加权总和公式，与未来现金流量的现值成正比。收益率与债券价格之间的关系为负号，零息债券的久期等于到期日，而普通息票债券的久期小于到期日。债券久期模型假设所有利率以平行方式变动。
00:15:00 在本节中，演讲者讨论了债券和掉期的利率和定价模型。他们承认单一数字模型可能不足以预测价格变化，并建议使用二阶导数来解释无法解释的损失。关于掉期，演讲者解释了交易者如何使用固定和浮动现金流的现值为最重要的掉期数量（即掉期利率）报出价和报价水平。他们还指出，进入互换不需要任何货币交换，而且固定利率的设定是为了使固定现金流量的现值减去浮动现金流量的净值为零。
00:20:00 在本节中，解释了互换利率作为远期利率加权和的概念，其权重由贴现因子确定。该视频解释了构建收益率曲线来为具有不同期限的整个掉期投资组合定价的必要性，以及选择用于校准和样条类型的输入工具的过程。最后一步是调整控制点，以确保当工具使用数学对象重新定价时，结果与市场价格相匹配。
00:25:00 在本节中，Ivan Masyukov 解释了如何使用三次样条来构建平滑曲线，其中曲线形状的函数形式是三次多项式，同时保持每个节点的最大导数数观点。 B 样条作为一种新型样条引入，可以表示为基函数的线性组合，从而可以表示具有这些节点的任何曲线。然后 Masyukov 继续解释如何使用求解器校准掉期以确保它们按面值重新定价。这使用收益率曲线工具的示例进行了证明，IRS 掉期期限为 1 年至 30 年，报价为 0.33% 至 2.67%。
00:30:00 在本节中，Ivan Masyukov 解释了三个月远期利率的曲线，主要由标准利率美元掉期浮动部分的三个月支付频率的 LIBOR 利率驱动，是前五年不平坦且陡峭，后来达到高原，在 20 年区域具有某些特征。由于无法在假设所有参数收益率都只有一个的情况下获得曲线，因此他们需要一些额外的术语来获得公平的价格并与市场可观察到的价格相匹配。额外的期限将是对收益率曲线的小幅修正，而不是对曲线平坦的粗略假设。这种方法更适合在我们的投资组合中拥有一致的债券和掉期模型，以及了解债券流动性和信用利差。
00:35:00 在本节中，重点将转移到如何交易价差以及哪些工具被认为最具流动性。据透露，债券是最具流动性的期权，而十年期互换和债券之间的利差是第二大流动性期权。在创建曲线时，这种转变值得信赖，因为输入的微小变化可能会导致输出发生较大变化，这是交易员关注的一个原因。一种典型的情况是交易者希望他们的模型的价值对市场变化不敏感，为此他们需要购买尽可能多的一年期掉期 plus 200，两年期掉期和 minus 一样多1.3，等等。然而，它可能会很昂贵，成本约为 360 万美元，并且与特定工具的出价成正比。
00:40:00 在本节中，讨论了对更好的对冲模型的需求，因为当前对交易者的对冲方法并不有效。提出了一种新的投资组合风险通用公式，其特征在于投资组合风险向量、对冲投资组合和该投资组合的权重。主成分分析用于解决问题并分析市场的典型模式和情景，交易者借此选择流动性和廉价的掉期进行对冲。呈现了典型主成分的图表，市场的主要行为是利率目前没有变动，但由于美联储的刺激，未来将会变动。
00:45:00 在本节中，演讲者讨论了正则化定价和风险模型，特别是 PCA 模型的缺点。 PCA 模型是使用对冲工具制定的，以消除最小化的需要，但系数不是很稳定，特别是对于市场上最近的模型。此外，该模型对异常值很敏感，并可能导致对历史数据的过度拟合，从而使假设它们在未来有效是有风险的。该模型的优势包括能够将风险转化为数量更少、流动性更强的数字，这些数字比以前小了几个数量级，使交易者能够做出明智的决定。
00:50:00 在本节中，视频讨论了正则化定价和风险模型，以及如何对风险矩阵的行为施加额外的约束或想法可以改善这种情况。演讲者解释了风险矩阵的 PCA 解释，以及它如何是主要成分的线性组合，一次对一种对冲工具产生偏移。他们还讨论了一种超越历史数据并根据远期利率构建收益率曲线的方法，以通过惩罚方程式来最小化非平滑度，其中雅可比矩阵是一个矩阵，用于转换收益率曲线输入的偏移。该视频还重点介绍了定价引擎和校准过程如何使用 HJM 模型对波动性进行定价。
00:55:00 在本节中，演讲者解释了蒙特卡罗模拟所需的远期利率演变方程，其中远期利率是被同化的数量。演讲者讨论了远期利率的漂移，它在一定程度上依赖于远期利率对 beta 的幂。引入了波动率表面，它给出了用于日历和远期时间的波动率数量，并简要提及了相关性和因子结构。演讲者解释说，三角形曲面用于每个箭头的转换波动率，并显示了波动率曲面的示例。问题在于计算维度为 240 x 240 的三角矩阵，需要长达 60 年的数据，这是一项具有挑战性的任务。
01:00:00 在视频的这一部分，演讲者解释了如何解决校准波动率曲面的问题。由于要校准的元素数量很大，因此存储 28K x 28K 矩阵的形式化解决方案并不实用。此外，由于校准仪器的数量少于要校准的元素的数量，因此这是一个不确定的问题，会产生不稳定的解决方案。为了解决这个问题，他们将表面表示为一个向量，并使用基函数的线性组合，这些基函数对应于具有与输入仪器相同数量的基函数的合理函数。虽然它校准得很好，但生成的表面看起来不太像波动率表面，而更像是曼哈顿天际线与哈德逊河和建筑物的形状。这种方法很常用，但会产生不稳定的结果。
01:05:00 在视频的这一部分，演讲者讨论了定价和风险模型中的不适定性问题，这意味着输入的微小变化可能导致输出的剧烈变化。为了解决这个问题，他们建议使用开始时平滑的基函数（例如 B 样条）对输出施加约束，并使用惩罚函数来控制波动率表面的变化和平滑度。通过这样做，他们可以产生有意义的结果，而不必针对每个输入仪器进行精确校准。演讲者演示了如何在二维中构造基函数并使用线性组合进行组合。
01:10:00 在本节中，演讲者讨论了正规化定价和风险模型的概念。演讲者解释说，如果需要平滑方法，可以使用由值 1 和 -1 组成的 L1 和 L2 矩阵来惩罚向量的梯度。为了解决小噪声和微不足道的模式可能导致输出发生重大变化的不适定问题，可以采用 Tikhonov 正则化技术。该技术涉及对振幅添加惩罚以减少噪声的影响。演讲者强调，由于被校准的数字始终存在不确定性，并且模型并不总是完美的，因此有必要进行正则化以最大程度地减少定价错误。
01:15:00 在本节中，讨论了正则化定价和风险模型的概念。引入吉洪诺夫正则化作为提高病态问题稳定性的方法。通过惩罚解的振幅或线性组合，正则化可以提供更有意义和更现实的结果，尽管可能带有偏差解。截断 SVD 是另一种方法，可用于仅选择重要的奇异值，从而产生更稳健的模型。关键是要识别和惩罚需要正则化的具体数量，而不是盲目地应用教科书方法。
01:20:00 在本节中，Ivan Masyukov 回答了听众提出的有关用于拟合函数的技术，尤其是样条技术的问题。他解释说，当输入数量有限并且您想在两者之间绘制时，会使用样条曲线或插值法。他还讨论了插值图的解释以及交易者如何使用它来校准和套利他们看到的任何差异。此外，他还解释了如何将掉期期权用于波动率建模，以及交易者如何根据他们看到的任何差异进行交易。
01:25:00 在本节中，演讲者讨论了市场交易者用来发现市场异常并通过交易利用它们的正规定价和风险模型。这些模型可以包含输入，例如关于远期利率的平滑假设或主成分分析 (PCA) 的组合。虽然债券是市场上流动性最强的工具，但它们并不是连续交易的，因此掉期更适合建立曲线。一旦建立了掉期曲线，债券交易员就将其用于对冲，因为债券比掉期更具流动性。然而，由于缺乏稳定的曲线，只交易债券的交易者往往依赖 PCA 模型或其他方法。

10. Regularized Pricing and Risk Models

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Ivan MasyukovThis...

Quantitative trading Experts: earlyTopProrate Machine Learning and Neural

MetaQuotes 2023.06.13 14:02 #106

11.时间序列分析二

11.时间序列分析二

本视频以上一讲关于波动率建模的讨论为基础，深入探讨了时间序列分析的各个方面。教授首先介绍了 GARCH 模型，该模型提供了一种灵活的方法来衡量金融时间序列的波动性。探讨了最大似然估计与 GARCH 模型的结合使用，以及使用 t 分布作为时间序列数据建模的替代方法。还讨论了 t 分布与正态分布的近似。接下来是多元时间序列，讲座涵盖了互协方差和 Wold 分解定理。演讲者阐明了向量自回归过程如何将高阶时间序列模型简化为一阶模型。此外，还讨论了稳态 VAR 过程的均值计算及其作为回归方程组的表示。

然后，讲座更深入地研究了用于时间序列分析的多元回归模型，通过每个组件序列的单独单变量回归模型强调了其规范。引入了矢量化算子的概念，证明了它在将多元回归模型转换为线性回归形式方面的实用性。还解释了估计过程，包括最大似然估计和模型选择标准。本讲座最后展示了向量自回归模型在分析与增长、通货膨胀、失业和利率政策影响相关的时间序列数据中的应用。脉冲响应函数用于理解时间序列的一个组成部分中的创新对其他变量的影响。

此外，还讨论了上一课的波动率建模的延续。定义了允许金融时间序列中随时间变化的波动性的 ARCH 模型。 GARCH 模型是 ARCH 模型的扩展，具有附加参数，突出了其优于 ARCH 模型的优势，为波动率建模提供了更大的灵活性。讲师强调 GARCH 模型假设收益序列中的新息服从高斯分布。

此外，探索了使用最大似然估计的 GARCH 模型的实现。平方残差的 ARMA 模型可以表示为新息的多项式滞后来衡量条件方差。通过确保算子的根位于单位圆之外来确定长期方差的平方根。最大似然估计涉及基于数据和未知参数建立似然函数，联合密度函数表示为时间序列的连续条件期望的乘积。这些条件密度服从正态分布。

讨论了与估计 GARCH 模型相关的挑战，主要是由于对基础参数的限制。为了优化一个凸函数并找到它的最小值，需要将参数变换到一个没有限制的范围内。拟合模型后，使用各种测试评估残差以评估正态性和分析不规则性。一个名为 rugarch 的 R 程序包用于拟合欧元兑美元汇率的 GARCH 模型，在拟合汇率回报的平均过程后使用正常的 GARCH 项。使用 Akaike 信息准则确定自回归过程的顺序，并生成自回归残差的正态分位数-分位数图以评估模型。

讲师还强调了 t 分布的使用，与高斯分布相比，它提供了更重的尾部分布，用于建模时间序列数据。具有 t 分布的 GARCH 模型可以有效地估计波动率并计算风险价值限制。 t 分布可以很好地近似于正态分布，讲师鼓励探索不同的分布以增强时间序列建模。此外，还讨论了 t 分布与正态分布的近似。当 t 分布具有 25-40 个自由度时，可以认为它是正态分布的合理近似。讲师展示了一个比较标准正态分布和具有 30 个自由度的标准 t 分布的概率密度函数的图表，证明这两个分布相似但尾部不同。

在讲座中，教授继续讲解使用向量自回归（VAR）模型分析时间序列数据。重点是了解变量之间的关系以及创新对感兴趣变量的影响。为了分析 VAR 模型中变量之间的关系，使用了多元自相关函数 (ACF) 和偏自相关函数 (PACF)。这些函数捕获变量之间的交叉滞后，并提供对它们之间动态交互的洞察。通过检查 ACF 和 PACF，可以识别显着滞后及其对变量的影响。此外，脉冲响应函数 (IRF) 用于了解创新随时间对变量的影响。创新是指其中一个变量的冲击或意外变化。 IRF 说明了变量如何响应多元时间序列的一个组成部分中的创新。此分析有助于了解冲击在整个系统中的传播和幅度。

例如，如果失业率出现创新，IRF 可以显示这种冲击如何影响其他变量，例如联邦基金利率和消费者价格指数 (CPI)。可以观察响应的幅度和持续时间，从而深入了解系统内的相互依赖性和溢出效应。除了 IRF 之外，还可以使用其他统计方法，例如预测误差方差分解 (FEVD)。 FEVD 将每个变量的预测误差方差分解为自身冲击和其他变量冲击的贡献。该分析允许量化不同冲击在驱动每个变量的可变性方面的相对重要性。通过使用 VAR 模型并分析 ACF、PACF、IRF 和 FEVD，研究人员可以全面了解多变量时间序列中的关系和动态。这些见解对于预测、政策分析和理解经济变量之间复杂的相互作用很有价值。

综上所述，讲座强调了VAR模型在时间序列数据分析中的应用。它强调使用 ACF 和 PACF 捕获交叉滞后，使用 IRF 检查创新的影响，使用 FEVD 量化不同冲击的贡献。这些技术使人们能够更深入地了解多变量时间序列中的关系和动态，从而促进准确的预测和政策决策。

00:00:00 在本节中，教授通过解决承认金融时间序列中随时间变化的波动性的 ARCH 模型的定义，讨论了上一课中波动率建模的延续。 GARCH 模型是 ARCH 模型通过附加参数的扩展，与 ARCH 模型相比具有更多优势并且参数更少。通过添加将当前波动率与过去或滞后值相关联的额外参数，GARCH 模型可以灵活地对波动率进行建模。 ARCH 模型中存在波动率的下界，导致该模型具有硬下界，而 GARCH 模型在预测波动率水平方面具有更灵活的优势。应该注意的是，在这些拟合中，我们假设回报序列中的创新服从高斯分布。
00:05:00 在本节中，主题是 GARCH 模型及其使用最大似然估计的实现。使用 GARCH 模型，我们可以测量波动率并将平方残差的 ARMA 模型表示为创新的多项式滞后。对于条件方差，我们可以通过要求算子的根有单位圆外的根来确定长期方差的平方根。最大似然估计需要在给定未知参数的情况下确定数据的似然函数，联合密度函数可以表示为时间序列的连续条件期望的乘积。这些条件密度是正态随机变量。
00:10:00 在本节中，演讲者讨论了由于对需要强制执行的基础参数的约束而估计 GARCH 模型的挑战。为了优化凸函数并找到凸函数的最小值，优化方法很有效，并且需要将参数转换为范围不受限制的尺度。拟合模型后，需要通过各种正态性检验和分析不规则程度来评估残差。使用称为 rugarch 的 R 包，选择具有正常 GARCH 项的欧元兑美元汇率的 GARCH 模型，并在拟合汇率回报的平均过程后进行拟合。为了评估模型，使用 Akaike 信息准则拟合自回归过程以选择自回归过程的阶数并生成自回归残差的正态 qq 图。
00:15:00 在本节中，演示者讨论了使用重尾分布（特别是 t 分布）对时间序列数据进行建模。与高斯分布相比，t 分布更好地适应残差的高值和低值。演示者展示了具有 t 分布的 GARCH 模型如何与具有高斯分布的 GARCH 模型类似地估计波动率，并且它们可用于计算风险限制值。总的来说，t 分布可以很好地近似于正态分布，演示者鼓励探索不同的分布以更好地对时间序列数据建模。
00:20:00 在本节中，教授讨论了 t 分布与正态分布的近似。通常，t 分布可以被认为是具有 25-40 个自由度的正态分布的良好近似。教授展示了一张比较标准正态分布和具有 30 个自由度的标准 t 分布的概率密度函数的图表。该图表明这两个分布非常接近，但分布的尾部不同。 t 分布比正态分布具有更重的尾部分布。教授还讨论了波动率聚类和 GARCH 模型处理它的能力。此外，教授指出回报比高斯分布有更重的尾巴，作业包括 GARCH 模型如何处理这个问题。
00:25:00 在本节中，讨论了 GARCH 模型及其对金融时间序列建模的实用性。 GARCH 模型适用于对协方差平稳时间序列建模，其中波动性度量是超额回报平方的度量，本质上是具有长期均值的协方差平稳过程。 GARCH 模型非常擅长描述相对于长期平均值的波动率，并且就其预测的有用性而言，它们预测波动率将以某种速度恢复到均值。波动率恢复的速率由持久性参数给出，可以通过 alpha_1 加上 beta_1 来衡量。 alpha_1 加上 beta_1 越大，波动性越持久。 GARCH 模型有很多扩展，在下一主题多元时间序列中，将讨论多元 Wold 表示定理。
00:30:00 在本节中，我们将学习多变量时间序列，这涉及到单变量时间序列的扩展，以模拟随时间变化的多个变量。我们将协方差平稳性的定义扩展到有限且有界的一阶和二阶矩，其中 M 维取值随机变量被视为 M 个不同的时间序列。对于多元过程的第 t 个观测值的方差-协方差矩阵，我们定义 gamma_0，即 X_t 减去 mu 乘以 X_t 减去 mu 素数的期望值。然后通过将协方差矩阵 gamma_0 与对角矩阵与该矩阵的对角线的平方根相乘，获得相关矩阵 r_0。
00:35:00 在本节中，介绍了交叉协方差矩阵的概念，它着眼于多元时间序列的当前值如何与这些值的第 k 个滞后值协变。当前周期向量值 Gamma_k 与这些值的第 k 个滞后值协变。解释了这些矩阵的性质，其中 gamma_0 的对角线是方差对角线项的协方差矩阵。还提到了高等定理Wold分解定理的存在，它扩展了单变量Wold分解定理。该定理有助于识别经济时间序列中变量之间因果关系的判断。
00:40:00 在本节中，介绍了协方差平稳过程的 Wold 分解表示的概念。该过程表示为确定性过程和白噪声的移动平均过程之和。在多变量情况下，确定性过程可以是线性或指数趋势，而白噪声过程是均值为 0 的 m 维向量和半正定方差/协方差矩阵。创新是对建模过程的扰动，不能由先前的信息预测。协方差矩阵中的项之和必须收敛才能使过程协方差平稳。
00:45:00 在本节中，Wold 分解被讨论为一种表示影响过程且以前不可用的信息位的方法。然后本节继续讨论向量自回归过程，该过程模拟多元序列的给定分量如何依赖于其他变量或多元序列的分量。然后解释了将第 p 阶过程重新表示为具有向量自回归的一阶过程的概念，这是一种在时间序列方法中用于简化复杂模型分析的强大技术。
00:50:00 在本节中，演讲者讨论了使用 Z_t 和 Z_(t-1) 向量表示的多元随机过程，以及如何将其转换为具有更大多元序列的一阶时间序列模型。如果伴随矩阵 A 的所有特征值的模都小于 1，则该过程是平稳的，这确保该过程在随时间递增时不会出现爆炸行为。这个要求与多项式方程的所有根都在单位圆外是一样的。这段摘录中没有提到多项式的阶数。
00:55:00 在本节中，重点是通过对等式两边取期望来计算平稳 VAR 过程的均值。求解第二行到第三行的mu，得到过程的无条件均值。向量自回归模型表示为回归方程组，由 m 个回归模型组成，对应于多元序列的每个分量。第 m 个回归模型将矩阵的第 j 列建模为 Z beta j 和 epsilon j，其中 Z 是多元过程滞后值的向量。该计算假设 p 个样本前观察值可用。
01:00:00 在本节中，演讲者解释了用于时间序列分析的多元回归模型。该模型由整个多元序列滞后的线性回归模型组成，直至 p lags，其回归参数由 βj 给出，它对应于 phi 矩阵的各种元素。演讲者定义了多元回归模型，并解释了如何通过分别考虑每个分量序列的单变量回归模型来指定它。这与计量经济学中看似无关的回归有关。
01:05:00 在这节课中，教授讨论了线性回归参数的估计方法以及如何估计创新项的方差和协方差。该过程涉及对线性回归的参数应用直接估计方法，然后估计创新项的方差/协方差。一个重要的结果是，这些分量回归也是多元回归的最佳估计。该理论中使用了 Kronecker 乘积运算符，它适用于采用矩阵并将列堆叠在一起的 vec 运算符。
01:10:00 在本节中，介绍了矢量化运算符的概念，并解释了它在将术语操作为更方便的形式时的用途。多元回归模型采用矩阵结构建立，并以线性回归形式表示。通过矢量化 beta 矩阵、epsilon 和 y，可以使用这些模型定义最大似然估计中的似然函数。未知参数 beta star、sigma 等于此正态线性回归模型的联合密度，对应于先前在回归分析中使用的自变量矩阵 X star 和方差/协方差矩阵 sigma 的更复杂定义星星。
01:15:00 本节讨论了集中对数似然的概念，揭示了回归参数 beta 的估计与协方差矩阵 sigma 无关。这使得在估计协方差矩阵时需要最大化的似然函数成为可能。最大化是通过矩阵行列式的对数减去 n 超过 2 该矩阵的迹乘以它的估计来完成的。此外，还可以应用模型选择标准，例如 Akaike 信息标准、贝叶斯信息标准和 Hannan-Quinn 标准。最后，展示了一个用宏观经济变量拟合向量自回归的例子，证明了了解在增长、通货膨胀、失业和利率政策影响方面影响经济的因素的重要性。
01:20:00 在本节中，演讲者讨论了使用向量自回归模型分析时间序列数据。正在研究的具体变量是失业率、联邦基金和 CPI（衡量通货膨胀的指标）。自相关函数和偏自相关函数的多元版本用于捕获这些模型中变量之间的交叉滞后。然后使用脉冲响应函数来了解多元时间序列的一个组件中的创新对其他变量的影响。这对于理解移动平均表示和这些时间序列模型之间的联系很重要。

11. Time Series Analysis II

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading 交易中的数学: 交易仓结果的评估 MQL5 中的统计分布 - 充分利用

MetaQuotes 2023.06.13 14:02 #107

12.时间序列分析三

12.时间序列分析三

在这个关于时间序列分析的 YouTube 视频中，教授介绍了一系列模型及其在不同场景中的应用。该视频深入探讨了向量自回归 (VAR) 模型、协整和线性状态空间模型等主题。这些模型通过检查自相关和偏自相关系数，对于预测失业、通货膨胀和经济增长等变量至关重要。

该视频首先介绍了用于估计和预测时间序列模型的线性状态空间建模和卡尔曼滤波器。线性状态空间建模涉及建立观察和状态方程以促进模型估计过程。卡尔曼滤波器是一种强大的工具，可计算似然函数并为估计和预测提供基本条件。

然后，讲师解释了如何推导自回归移动平均 (ARMA) 过程的状态空间表示。这种方法允许灵活表示时间序列中变量之间的关系。该视频强调了 Harvey 1993 年工作的重要性，该工作为 ARMA 过程定义了特定的状态空间表示。

接下来，该视频探讨了 VAR 模型在宏观经济变量中的应用，以预测增长、通货膨胀和失业率。通过分析自相关和偏自相关系数，研究人员可以确定变量之间的关系并识别模式和相关性。该视频提供了一个回归模型示例，说明了如何将联邦基金利率建模为滞后失业率、联邦基金利率和 CPI 的函数。这个例子表明，失业率的上升往往会导致下个月的联邦基金利率下降。

然后引入协整的概念，解决非平稳时间序列及其线性组合。协整涉及找到一个向量 beta，它在与感兴趣的变量组合时产生一个平稳的过程。该视频讨论了利率期限结构、购买力平价以及现货和期货关系等示例。一个使用能源期货，特别是原油、汽油和取暖油合约的例子展示了协整的概念。

该视频进一步探讨了 VAR 模型的估计和协整向量自回归过程的分析。参考了 Sims、Stock 和 Watson 的工作，其中展示了如何将最小二乘估计量应用于这些模型。还提到了协整关系的最大似然估计和秩检验。介绍了关于裂纹扩展数据的案例研究，包括使用增强的 Dickey-Fuller 测试来测试非平稳性。接下来，视频重点介绍原油期货数据以及非平稳和整合订单的确定。 Johansen 程序用于检验协整过程的秩。与平稳关系相对应的特征向量提供了对原油期货、汽油 (RBOB) 和取暖油之间关系的见解。

然后讲座介绍了线性状态空间模型，作为表达经济和金融中使用的各种时间序列模型的一种方式。解释了状态方程和观测方程，展示了该建模框架的灵活性。该视频说明了将具有时变贝塔值的资本资产定价模型表示为线性状态空间模型。通过在回归参数中加入时间依赖性，该模型捕获动态变化。此外，讲师讨论了随时间改变回归参数的概念，假设它们遵循独立的随机游走。解释了联合状态空间方程及其在添加新数据时递归更新回归的实现。 P 阶自回归模型和 Q 阶移动平均模型表示为线性状态空间模型。

然后讲座深入研究状态方程和观察方程，强调它们在基本状态之间转换中的作用。探讨了 ARMA 过程的状态空间表示的推导，突出了定义状态和基础转换矩阵的灵活性。
本讲座概述了线性状态空间模型在时间序列分析中的应用。演讲者解释说，这些模型可用于通过结合观察到的数据和潜在状态来估计和预测感兴趣的变量。通过利用作为递归算法的卡尔曼滤波器，模型可以计算给定观察数据的状态的条件分布，以及预测未来状态和观察结果。

本讲座强调理解线性状态空间模型的关键组成部分的重要性。状态方程表示基础状态随时间的转变动力学，而观察方程将观察到的数据与基础状态相关联。这些方程以及初始状态分布定义了模型结构。
讲师继续讨论线性状态空间模型的估计过程。最大似然估计通常用于根据观测数据估计模型的未知参数。卡尔曼滤波器通过计算似然函数在这个过程中起着至关重要的作用，似然函数衡量模型和数据之间的拟合优度。

此外，讲座强调线性状态空间模型为模拟各种经济和金融现象提供了一个灵活的框架。它们可用于表示自回归模型、移动平均模型，甚至更复杂的模型，例如具有时变贝塔的资本资产定价模型。这种多功能性使线性状态空间模型成为经济学和金融领域研究人员和从业人员的宝贵工具。为了进一步说明线性状态空间模型的实际应用，讲座介绍了原油期货合约的案例研究。通过分析原油、汽油和取暖油等不同期货合约价格之间的关系，演讲者展示了如何利用线性状态空间模型来识别能源市场的模式、预测价格和评估风险。

总之，该视频全面概述了线性状态空间模型及其在时间序列分析中的应用。通过利用卡尔曼滤波器，这些模型使研究人员能够估计和预测感兴趣的变量，了解潜在状态的动态，并捕捉变量之间的复杂关系。该讲座强调了线性状态空间模型在各种经济和金融环境中的灵活性和实用性，使其成为实证分析和决策制定的宝贵工具。

00:00:00 在本节中，教授介绍了可用于预测经济增长、通货膨胀和失业率的宏观经济变量，并着重总结了向量自回归拟合模型。模型中特征多项式的根被证明是非平稳的，表明应该使用不同的系列对此进行建模。为了消除这种非平稳性，教授建议对一阶差分进行建模，这可以通过对所有系列进行差分并消除缺失值来完成。该图显示了差异序列的时间序列属性，包括对角线自相关函数和互相关，它们显示出具有统计显着性。还讨论了偏自相关函数，它涉及变量与另一个滞后之间的相关性，并解释了所有较低程度的滞后。
00:05:00 在本节中，视频讨论了向量自回归模型的使用，该模型允许研究人员对多个宏观经济变量之间的结构关系进行建模。该示例侧重于三个变量：失业率、联邦基金利率和 CPI。通过检查自相关和偏自相关系数，研究人员可以确定这些变量之间的关系并识别模式和相关性。该视频还提供了联邦基金利率作为滞后失业率、联邦基金利率和 CPI 函数的回归模型。该模型表明，如果失业率上升，美联储利率可能会在下个月下降。该视频强调了在估计自回归参数和解释系数时了解信噪比的重要性。
00:10:00 在视频的这一部分，演讲者介绍了协整的概念，这是处理非平稳时间序列的时间序列分析中的一个主要主题。讨论从协整相关的上下文开始，重点关注按某个阶数 d 积分的随机过程，这意味着第 d 个差值是平稳的。虽然采取一阶差分会导致平稳性，但该过程会丢失一些信息，而协整提供了一个框架来系统地表征统计建模的所有可用信息。非平稳过程仍然可以具有向量自回归表示，可以表示为 x 等于白噪声 epsilon 的多项式滞后，将其降低为平稳性需要取 d 阶差分。
00:15:00 在视频的这一部分中，引入了协整的概念，作为处理多元时间序列的线性组合可能是平稳的情况的一种方法，这意味着它们代表了过程的平稳特征。协整涉及找到向量 beta，使得 x 和 beta 素数 X_t 上的线性权重是一个平稳过程。协整向量可以任意缩放，但通常的做法是将过程的第一个组成序列设置为 1。这种关系在经济学和金融学中以多种方式出现，包括利率期限结构、购买力平价、货币需求、覆盖利率平价、一价定律、现货和期货。举一个能源期货的例子来说明这个概念。
00:20:00 在本节中，教授讨论了在 CME 交易的原油、汽油和取暖油期货合约的时间序列。他解释了汽油和取暖油的期货价格应如何取决于输入成本，即原油。教授展示了期货价格图，它代表相同单位的产出相对于投入。他指出，虽然汽油和取暖油的期货价格始终高于原油输入期货价格，但它们会因哪个更高而有所不同。取暖油期货与原油期货的价差代表产出减去投入的价差，其中包括炼油成本、供求关系、季节性影响和炼油厂利润。
00:25:00 在本节中，讲座讨论了扩展单变量模型的 p 阶向量自回归模型。讲座解释了一个序列的自回归依赖于所有其他序列，这形成了具有均值 0 和某种协方差结构的多维白噪声。还讨论了对一阶进行积分的过程，以及与一些额外项的差异相关的推导过程。最后，讲座提供了级数差分的方程，它等于一个常数加上一阶差分多元级数的矩阵倍数，再加上另一个矩阵乘以二阶差分，一直到第 p不同之处。
00:30:00 在本节中，视频讨论了使用滞后和差分序列消除时间序列中的非平稳性的过程。该模型表示差分序列的随机过程模型，是平稳的。虽然作为滞后矩阵倍数的项是平稳的，但 pi X_t 项包含涉及识别矩阵 pi 的协整项。由于原始序列有单位根，矩阵 pi 降阶，它定义了协整关系。 beta 的列定义协整 x 的线性独立向量。 pi的分解不是唯一的，通过在过程平稳的r维空间定义坐标系，矩阵pi可以表示为alpha beta prime。
00:35:00 在本节中，演讲者讨论了向量自回归模型的估计以及 Sims、Stock 和 Watson 的工作，展示了如何使用原始模型的最小二乘估计量来分析协整向量自回归过程.演讲者还提到了有关这些模型估计方法的高级文献，包括最大似然估计，它可以检验协整关系的等级。还讨论了关于裂纹扩展数据的案例研究，其中涉及使用增强的 Dickey-Fuller 测试来测试基础系列中的非平稳性，该测试为第一个最近的合约 CLC1 产生的 p 值为 0.164。
00:40:00 在本节中，主持人讨论了原油期货数据的非平稳性和整合顺序，建议在指定模型时需要适应非平稳性。进行 Johansen 程序检验协整过程秩的结果表明不存在强非平稳性，平稳关系对应的特征向量由原油期货系数 1、RBOB 系数 1.3 和-1.7 取暖油。随着时间的推移，原油加汽油减去取暖油的组合似乎是固定的，这对于希望对冲其生产风险的炼油厂可能有用。
00:45:00 在这一部分，演讲者介绍了线性状态空间模型的主题，它可以用来表达经济和金融中使用的许多时间序列模型。该模型涉及时间 t 的观察向量、基础状态向量、时间 t 的观察误差向量和状态转换创新误差向量。演讲者解释了模型中的状态方程和观测方程，它们是状态和观测加上噪声的线性变换，以及如何将它们一起写成一个联合方程。该符号可能看起来很复杂，但它在指定变量之间的关系方面提供了很大的灵活性。
00:50:00 在本节中，演讲者讨论了将具有时变贝塔值的资本资产定价模型表示为线性状态空间模型。该模型通过向回归参数添加时间依赖性来扩展前一个模型。 alpha 和 beta 现在随时间变化，alpha 是高斯随机游走，beta 也是高斯随机游走。通过添加随机游走项来调整状态方程，使 s_(t+1) 等于 T_t s_t 加上 R_t eta_t，在线性状态空间框架中具有复数表示。观测方程由一个Z_t矩阵定义，它是r_(m,t)的单位元素行矩阵。协方差矩阵具有分块对角结构，epsilons的协方差为H，R_t eta_t的协方差为R_t Q_t R_t转置。最后，演讲者考虑了线性回归模型的第二种情况，其中 p 个自变量可能随时间变化。
00:55:00 在本节中，介绍了时间序列中随时间变化的回归参数的概念，假设它们遵循独立的随机游走。解释了联合状态空间方程以及用于在添加新数据时递归更新回归的线性状态空间实现。还讨论了 P 阶自回归模型，概述了线性状态空间模型如何演化的结构。最后，将Q阶移动平均模型表示为线性状态空间模型。
01:00:00 在本节中，讲师讨论了状态方程和观测方程，它们用于给出基础状态之间的转换。他们使用自回归移动平均模型的示例来演示线性状态空间模型的设置如何促进模型估计过程。讲座接着解释了 Harvey 在 93 年的工作如何为 ARMA 过程定义了一个特定的状态空间表示，以及一个给定的过程如何有许多不同的等效线性状态空间模型，这取决于一个人如何定义状态和底层转换矩阵 T。最后，讲座继续推导 ARMA 过程的状态空间表示。
01:05:00 在本节中，演讲者解释了如何通过使用观测值迭代求解第二状态并重写模型方程，为线性状态空间模型中的转移矩阵 T 建立一个简单模型。此过程用观察值替换基础状态，并生成一个转移矩阵 T，该矩阵的第一列是自回归分量，R 矩阵中是一个移动平均分量向量。线性状态空间建模的有效性在于卡尔曼滤波器的完整规范，它在给定时间 t 的信息的情况下递归计算 t+1 时基础状态的概率密度函数，以及未来状态的联合密度和 t+1 处的观察，给定时间 t 之前的信息，以及下一个观察的边际分布给定时间 t 之前的信息。卡尔曼滤波器的实现需要涉及条件均值、协方差和由 omegas 确定的均方误差的符号。
01:10:00 在本节中，文字记录讨论了卡尔曼滤波器，它有四个步骤，可帮助预测时间序列中的状态向量和观察值。滤波器增益矩阵用于根据发生的情况调整基础状态的预测，并表征我们从每次观察中获得的信息量。通过最小化我们观察到的和我们预测的之间的差异，可以减少时间 t 状态的不确定性。还有一个预测步骤，它预测前一个周期的状态，并在给定先前状态的情况下更新未来状态的协方差矩阵。最后，平滑步骤表征了在整个时间序列中给定信息的基础状态的条件期望。
01:15:00 在本节中，演讲者介绍了卡尔曼滤波器作为计算线性状态空间模型的似然函数和连续预测过程的工具。他们解释说，似然函数是给定数据历史的每个连续观察的条件分布的乘积。卡尔曼滤波器提供了该估计的所有必要项，如果误差项呈正态分布，则这些估计的均值和方差表征了过程的精确分布。此外，卡尔曼滤波器更新基础状态和观察分布的均值和协方差矩阵。

12. Time Series Analysis III

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading 交易中的数学: 交易仓结果的评估 MQL5 中的统计分布 - 充分利用

MetaQuotes 2023.06.13 14:03 #108

13.商品模型

13.商品模型

在这段视频中，演讲者深入探讨了复杂的商品模型世界，强调了定量分析师在该领域面临的挑战。他们提供了富有洞察力的例子，例如 Trafigura 在 2009 年创纪录的利润，这是通过战略性原油采购和储存实现的。演讲者讨论了存储投标的各种策略、优化问题以及商品模型中稳定性和鲁棒性的重要性。此外，他们探索了商品价格建模的复杂性，重点关注电力价格所需的独特考虑因素。演讲者提出了一种适合商品环境的替代方法，将其与固定收益、外汇和股票市场中使用的方法区分开来。

该视频首先阐明了商品领域定量分析师解决的具体问题。举了一个说明性的例子，以 Trafigura 为特色，该公司从 2009 年的油价急剧下跌中获利巨大。演讲者解释了期货合约如何在商品市场中发挥作用，强调了期货溢价和现货溢价的概念。 Contango 是指未来现货价格超过当前现货价格的情况，使交易者即使在价格下跌期间也能产生利润。

接下来，演讲者深入探讨了托克在 2009 年 2 月至 2010 年原油价格从每桶 35 美元飙升至 60 美元期间的盈利策略。通过以 35 美元的价格借款，购买和储存原油，然后以 60 美元的更高价格出售，托克获得了每桶 25 美元的可观利润。这一策略被大规模采用，涉及数百万桶的存储，从而带来了显着的收益。演讲者强调需要在存储拍卖中仔细制定战略，以有效收回成本并产生额外利润。

该视频继续讨论了两种不同的商品模型存储投标策略。第一种策略涉及交易员竞标 8 月份的期货合约，并在 12 月份卖出，而无需借款。宽客采用的第二种策略是卖出 8 月和 12 月合约之间的价差期权。该期权的价值由两份合约之间的价格差异决定，正差异为期权所有者带来利润，负差异则没有利润。虽然第二种策略更为复杂，但它为公司提供了额外的价值。

使用商品模型在 8 月 1 日销售产品的优势将在后续部分讨论。通过在特定日期出售期权，卖方将获得一个由公式确定的期权价值，通常高于当前市场价值。这使卖方在投标过程中处于有利地位，使他们能够获得自己选择的利润率。演讲者还阐明了期权风险的计算以及如何利用实物或实物资产来减轻该风险。

然后，该视频深入探讨了商品模型中差价期权的复杂性，强调需要在考虑技术、合同、法律和环境限制的同时确定最有价值的期权组合。演讲者强调了以保证在期权到期时提取价值的方式出售期权组合的重要性，同时考虑到注入和提取率的限制。

另一个部分讨论了涉及商品模型和存储的优化问题。问题围绕着当存储容量耗尽时从商品选项中提取价值，以及当存储容量变空时从存储中出售。演讲者解释了问题中涉及的变量和约束，并演示了如何通过一系列选项优化投资组合以实现利润最大化。问题的复杂性要求使用布尔变量并关注利润最大化。

该视频进一步探讨了商品模型的挑战，特别是与注入和提取率、产能限制以及数量和价格等未知变量相关的挑战。这些因素导致问题的非线性性质，使得在处理大量变量和约束时极难解决。可以采用包括近似、蒙特卡洛模拟和随机控制在内的几种方法来解决商品模型的复杂性。然而，结果的准确性在很大程度上取决于所用参数的精度。如果参数不正确，即使是最细致的方法也可能导致错误的结果。

然后，演讲者继续讨论他们选择的商品建模方法，该方法优先考虑稳健性和稳定性，而不是捕捉价格行为的完整丰富性。他们告诫不要过度参数化模型，因为它会引入不稳定，导致即使是微小的变化也会显着影响其价值。通过采用不同的方法，他们优先考虑稳定性和稳健性，允许外部监管机构验证模型。此外，模型的每个组件都可以在市场上交易，这在当前的市场格局中具有重要意义。还解释了动态对冲的概念，展示了如何在没有活跃期权市场的情况下使用简单的播放器函数复制期权的价值并实现支付。

演讲者深入探讨了通过动态对冲复制期权支付的概念。这种策略使交易者即使在没有买家的情况下也可以出售投资组合。他们强调制定战略以提取价值并与存储设施运营商合作以成功执行计划的重要性。演讲者解释了如何将这种方法扩展到对实体资产（例如油轮和发电厂）建模，以根据电力和燃料价格做出明智的决策来实现利润最大化。虽然每项资产的性质可能不同，但概念方法保持不变，因此需要全面了解与每项资产相关的独特复杂性和限制。

在随后的部分中，视频探讨了根据发电厂效率计算生产一兆瓦时电力的成本的过程。效率量化为以毫米 BTU 为单位的热耗率，表示产生一兆瓦时电力所需的天然气量。与天然气发电厂对应的常数通常介于 7 到 20 之间，值越低表示效率越高。还考虑了与生产一兆瓦时相关的额外成本，例如空调和人工。该视频进一步深入探讨了确定发电厂的价值以及构建价格和燃料成本分布以确定收购发电厂的适当付款。

商品价格建模的挑战，尤其是电力价格，将在下一节中讨论。由于数据中存在肥尾和尖峰，因此无法使用布朗运动准确地对电价分布进行建模。此外，与股票市场相比，电价的波动性要高得多。讲师强调这些挑战在所有地区都很普遍，并强调了捕捉尖峰均值回归以准确表示电价行为的必要性。其他现象，如高峰态、状态切换和非平稳性也需要纳入模型中。

该视频探讨了与商品价格建模相关的挑战，重点介绍了各种方法，包括均值回归、跳跃和状态转换。然而，这些模型往往很复杂且难以管理。相反，演讲者提出了一种专门针对商品领域量身定制的独特方法，与固定收益、外汇和股票市场采用的方法不同。这种方法更符合商品市场的特点和复杂性。

发言者强调商品价格主要受供需动态驱动。然而，事实证明，仅基于价格的传统方法不足以捕捉商品价格行为的复杂性。为了解决这个问题，演讲者建议结合基本面建模，同时确保模型与可用的市场数据保持一致。他们解释了电力价格是如何通过拍卖来自不同效率的发电厂的投标来形成的，以及最终价格是如何根据需求来确定的。由于随机燃料价格因素的影响，描绘需求与价格之间关系的散点图显示出多样化的分布。

此外，演讲者解释说，电力价格由需求和燃料价格共同决定，因为发电成本取决于燃料价格。此外，需要对停电的发生进行建模，因为市场是有限的，如果少数发电厂出现停机，电价可能会受到影响。为了整合这些因素，演讲者建议构建一个发电堆栈，它代表市场中每个参与者的发电成本。通过考虑燃料价格和停电，可以调整发电堆以准确匹配市场价格和期权价格。

视频继续讨论如何为不同的商品建模以了解电价的演变。演讲者解释了燃料价格、停电和需求行为的建模过程。随后，构建发电堆，表示由需求、停电、可变成本和燃料价格等因素决定的曲线。仔细选择参数以匹配电力价格和其他相关市场参数的远期曲线。这种方法可以相对轻松地捕获电力市场中的价格峰值。演讲者指出，天然气、取暖油和燃料油是可储存的商品，使它们的行为更有规律，更容易建模。

展望未来，演讲者强调了如何利用商品模型来预测市场电价，同时考虑温度、供应和需求等因素。通过利用蒙特卡罗模拟和对燃料价格分布的全面了解，可以实现对温度波动引起的价格峰值的准确模拟。该模型还可以准确地捕获市场的相关结构，而无需将其作为输入。然而，需要强调的是，维护这样的模型需要大量的信息和组织，因为必须跟踪每个发电厂和市场变化。

在视频的最后一部分，演讲者承认了为不同市场构建商品模型所面临的挑战。该过程是一项艰巨的任务，需要多年的开发，使其成为一项昂贵的工作。尽管涉及复杂性，演讲者认为所涵盖的主题是结束讨论的好点，并邀请观众提出他们可能有的任何遗留问题。

总体而言，该视频对定量分析师在构建商品模型时所面临的挑战提供了宝贵的见解。它强调了在建模方法中优先考虑稳定性和稳健性的重要性、商品价格建模的复杂性以及供应、需求和燃料价格等基本因素在影响电价中的作用。演讲者还强调了与行业利益相关者合作的重要性，以及为不同市场维护和更新商品模型所需的持续努力。

00:00:00 在本节中，演讲者讨论了与其他市场中的问题相比，定量分析师在商品世界中解决的问题。他以 Trafigura 为例，该公司在 2009 年实现了创纪录的利润，那一年油价跌至历史最低水平。他还谈到了期货合约及其在商品市场中的运作方式，特别是讨论了期货溢价和现货溢价的概念。 Contango 意味着未来的现货价格比当前的现货价格更贵，这使得交易者即使在价格低的时候也能获利。
00:05:00 在本节中，演讲者解释了 Trafigura 如何在 2009 年 2 月至 2010 年期间原油价格从 35 美元上涨至 60 美元期间赚钱。公司借了 35 美元，买了一桶原油，并储存起来，直到能以更高的价格卖到 60 美元。这使他们每桶赚取 25 美元的利润，这使超过 50-60 百万桶的存储架增加了巨额金额。演讲者强调，要在拍卖中竞标存储，必须仔细规划如何收回为存储支付的资金并获得一些额外利润。
00:10:00 在本节中，视频讨论了商品模型中存储投标的两种策略。第一种是标准策略，交易者在 8 月份的期货合约上出价并在 12 月份卖出，而无需借钱。第二种策略是宽客使用的策略，他们出售 8 月至 12 月的价差期权，该期权由 12 月和 8 月合约的价格差异决定，正差值支付期权所有者，负差值支付零。后一种策略更为复杂，但为公司提供了附加值。
00:15:00 在本节中，演讲者讨论了使用商品模型在 8 月 1 日销售产品的优势。他解释说，通过在给定日期出售期权，卖方获得期权的公式确定价值，该价值通常高于当前市场价值。这使卖方在投标过程中具有优势，他们可以获得自己选择的利润率。演讲者还解释了如何计算期权的风险以及如何使用实物或实物资产来降低风险。
00:20:00 在本节中，演讲者讨论了差价期权的概念，并进一步阐明了它们在现实中的复杂性。他解释说，要优化可根据存储出售的期权组合的价值，需要在考虑技术、合同、法律和环境限制的同时确定最有价值的期权组合。发言人进一步指出，期权组合的出售方式应保证期权到期时可以提取价值，并且对注入和提取率有限制。
00:25:00 在本节中，演讲者讨论了涉及商品模型和存储的优化问题。问题涉及在存储空间不足时找到一种从商品期权中提取价值的方法，反之，在存储空间为空时找到一种从存储空间中出售的方法。演讲者解释了问题的变量和约束，并展示了如何通过一系列选项优化投资组合。总的来说，优化问题很复杂，但可以借助布尔变量和关注利润最大化来解决。
00:30:00 在本节中，演讲者讨论了商品模型的复杂性，包括注入和提取率、最大和最小容量限制以及数量和价格等未知变量。问题变得非线性并且很难用大量的变量和约束来解决。包括近似、蒙特卡洛模拟和随机控制在内的几种方法可用于求解商品模型，但结果的准确性取决于所用参数的准确性。如果参数不正确，即使是最精确的方法也可能是错误的。
00:35:00 在本节中，演讲者讨论了他们选择的商品建模方法，该方法旨在优先考虑稳健性和稳定性，而不是捕捉价格行为的丰富性。他们解释说，过度参数化模型会导致不稳定和微小的变化，而这些变化可能会大大改变价值。为了优先考虑稳定性和健壮性，他们通过使用不同的方法牺牲了一些价值。此外，他们使用的模型可以得到外部监管机构的验证，模型的每个组件都可以在市场上交易，这在当今时代至关重要。此外，他们还解释了动态对冲的概念，以及如何使用它来复制期权的价值，并在没有活跃期权市场的情况下通过简单的玩家功能满足支出。
00:40:00 在本节中，演讲者讨论了通过使用动态对冲策略复制期权支付的概念，即使没有买家，交易者也可以出售投资组合。他强调了制定提取价值战略以及与运营存储设施的人员合作以成功执行该计划的重要性。演讲者随后解释了如何使用这种方法对油轮和发电厂等实物资产进行建模，以根据电力和燃料的价格做出明智的决策来实现利润最大化。虽然每项资产的性质不同，但概念方法保持不变，需要了解每项资产的细微差别和限制。
00:45:00 在本节中，视频讨论了根据发电厂效率计算生产一兆瓦时电力的成本的过程。效率，称为热耗率，以毫米 BTU 为单位测量，它告诉我们需要燃烧多少单位的天然气才能产生一兆瓦时的电力。天然气发电厂对应的常数通常在 7 到 20 之间，其中 7 是最有效的。还考虑了与生产一兆瓦时相关的其他成本，例如空调和劳动力。然后视频继续讨论确定发电厂价值和构建价格和燃料成本分布以计算为发电厂支付多少费用的过程。
00:50:00 在本节中，讲师讨论了商品模型的挑战，特别是在电价的情况下。由于数据中存在肥尾和尖峰，因此无法使用布朗运动对电价分布进行建模。波动性也远高于股票市场。讲师指出，这些挑战在所有地区都很普遍，峰值均值回归对于捕捉电价行为是必要的。其他需要捕获的现象包括高峰度、状态切换和非平稳性。
00:55:00 在本节中，演讲者讨论了商品价格建模的挑战以及如何使用不同的模型，包括均值回归、跳跃和状态转换。然而，这些模型过于复杂且难以管理。演讲者提出了一种与固定收益世界、外汇和股票完全不同的方法，从商品的角度来看更合适也更容易理解。
01:00:00 在本节中，演讲者讨论了商品价格如何主要受供求关系驱动。然而，仅根据价格本身对商品价格建模的标准方法已被证明是困难的。演讲者建议引入一些基本模型来解决这个问题，同时还要确保他的模型与所有可用的市场数据相匹配。讲者接着解释电价是如何通过不同能效水平的发电厂的竞标而形成的，以及最终价格是如何根据需求来确定的。由于燃料价格的随机因素，由此产生的需求与价格散点图显示了一个胖图。
01:05:00 在本节中，演讲者解释说电力价格由需求和燃料价格共同决定，因为发电成本取决于燃料价格。还需要对停电进行建模，因为市场是有限的，如果一些发电厂出现故障，电价可能会受到影响。为了对这些因素进行建模，演讲者建议构建发电堆栈，即市场中每个参与者的发电成本。通过了解燃料价格和停电，可以生成节拍堆栈，节拍堆栈将跟随生成堆栈并进行调整以匹配市场价格和期权价格。
01:10:00 在本节中，演讲者解释了如何对不同的商品建模并用于确定电价的演变。他们首先对燃料价格、停电和需求的演变进行建模，然后构建发电堆栈，这是一条由需求、停电、可变成本和燃料决定的曲线。他们选择参数来匹配电价和其他市场参数的远期曲线。这种方法可以毫不费力地捕捉到电价的峰值，天然气、取暖油和燃料油是可储存的商品，使它们的行为更规律，更容易建模。
01:15:00 在视频的这一部分，演讲者解释了商品模型如何根据温度和供需因素来预测市场电价。通过使用蒙特卡罗模拟并了解燃料价格的分布，他们能够准确捕捉和模拟温度变化引起的价格飙升。此外，该模型无需将其作为输入即可准确捕获市场的相关结构。然而，这种方法的消极方面是，由于需要跟踪每个发电厂以及市场上可能发生的任何变化，因此需要大量信息和组织来维护。
01:20:00 在本节中，演讲者讨论了为不同市场构建商品模型的挑战。它需要一项艰巨的任务，需要数年的时间才能开发，这使其成为一个昂贵的过程。演讲者认为这是一个很好的停止点，但邀请观众提问。

13. Commodity Models

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Alexander Eydelan...

奇迹仍在继续! The miracles continue! _rdb_The Best Free EA

MetaQuotes 2023.06.13 14:04 #109

14. 投资组合理论

14. 投资组合理论

投资组合理论是金融学中的一个基本概念，侧重于投资组合的绩效和最佳构建。它涉及分析多种资产的预期回报、波动性和相关性，以确定最有效的投资组合分配。有效边界代表一系列具有不同波动水平的可行投资组合。通过引入无风险资产，可行集扩展到包括无风险资产和其他资产的组合，形成一条直线。

参数的准确估计对于评估投资组合和解决投资组合优化的二次规划问题至关重要。公式用于计算基于各种约束的最佳权重，例如只做多头的投资组合、持有约束和基准敞口约束。效用函数用于定义财富偏好并在考虑风险规避的同时最大化预期效用。

该视频深入探讨了使用交易所交易基金 (ETF) 和市场中性策略的投资组合理论的应用。可以实施不同的约束来控制投资组合中的风险和变化，包括对市场因素的敞口限制和最小交易规模。演讲者探讨了投资于美国市场各个工业部门的九只 ETF 的最佳配置，考虑了投资组合分析工具和资本约束对最佳投资组合的影响。还讨论了对冲基金采用的市场中性策略，强调了它们分散化和降低相关性的潜力。

在评估投资组合时，选择适当的风险措施至关重要。均值-方差分析是常用的，但平均绝对偏差、半方差、风险值和条件风险值等替代风险度量可以提供额外的见解。因子模型的使用有助于估计方差-协方差矩阵，提高投资组合优化的准确性。

在整个视频中，演讲者强调了准确参数估计的重要性、约束对投资组合构建的影响以及风险度量在投资组合评估中的重要性。投资组合理论提供了一个框架，可以在不确定的情况下做出理性的投资决策，同时考虑对更高回报、更低波动性和风险规避的偏好。通过应用这些概念，投资者可以构建适合其风险承受能力和投资目标的均衡投资组合。

在视频的后续部分中，演讲者进一步探讨了投资组合理论的复杂性及其实际意义。以下是所涵盖要点的摘要：

投资组合优化的历史理论：演讲者首先讨论了投资组合优化的历史基础，重点是马科维茨均值方差优化。这种方法根据平均收益和波动率分析投资组合。它为理解风险和回报之间的权衡提供了一个框架，并作为现代投资组合理论的基础。
不确定性下的效用理论和决策：引入效用理论，特别是冯·诺伊曼-摩根斯坦效用理论，以指导不确定性下的理性决策。效用函数用于表示投资者对财富的偏好，考虑到更高回报和更低波动性等因素。演讲者解释了投资组合理论中常用的各种效用函数，包括线性函数、二次函数、指数函数、幂函数和对数函数。
约束和替代风险措施：该视频探讨了在投资组合优化中包含约束。可以实施这些限制以确保特定的投资标准，例如只做多头的投资组合、周转率限制和对某些市场因素的敞口限制。此外，演讲者还讨论了传统均值-方差分析之外的替代风险度量，例如考虑偏度、峰态和连贯风险度量的度量。
解决投资组合优化问题：演讲者提供了解决投资组合优化问题的数学见解。通过将其表述为二次规划问题，可以确定投资组合的最佳权重。拉格朗日条件和一阶条件用于求解这些权重，二阶导数表示协方差矩阵。该解决方案允许在特定约束条件下最大化回报，同时最小化波动性。
有效边界和资本市场线：引入有效边界的概念，代表一组在给定风险水平下实现最高回报的最优投资组合。演讲者解释了有效边界是如何根据各种投资组合的风险回报曲线形成的。此外，还讨论了资本市场线，说明了将无风险资产与市场组合相结合时风险与收益之间的关系。它使投资者能够确定任何所需风险水平的预期回报。
参数估计和风险度量：突出了准确参数估计的重要性，因为它显着影响投资组合分析。演讲者强调使用因子模型来估计方差-协方差矩阵，为优化提供更精确的输入。此外，还解释了不同的风险度量，例如平均绝对偏差、半方差、风险价值和条件风险价值，它们的适用性取决于所投资资产的具体特征。

在整个视频中，演讲者强调了使用交易所交易基金 (ETF) 和市场中性策略的投资组合理论的实际应用。详细讨论了使用约束来管理投资组合中的风险和变化、资本约束对最优投资组合的影响以及市场中性策略对多元化的好处。

总的来说，该视频全面概述了投资组合理论，涵盖了从历史基础到实际实施的各个方面。它强调准确估计的重要性、约束的结合、风险措施的选择以及不同投资策略的潜在收益。通过理解这些概念，投资者可以做出明智的决定，以构建符合其风险偏好和投资目标的投资组合。

00:00:00 在视频的这一部分，Peter Kempthorne 介绍了投资组合理论这一主题，这是金融领域最重要的主题之一。他首先讨论了投资组合优化的历史理论，其中涉及马科维茨均值方差优化，用于分析投资组合在平均收益和波动率收益方面的绩效特征。然后将分析扩展到包括无风险资产的投资，并引入效用理论的主题，即冯·诺伊曼-摩根斯坦效用理论，以在不确定的情况下以理性的方式做出决策。此外，Kempthorne 还介绍了用于扩展简单均值方差分析的投资组合优化约束和替代风险度量。最后，他解释了单期分析、如何表示投资组合以及如何计算投资组合的预期收益和方差。
00:05:00 在本节中，演讲者介绍了投资组合分析问题，并考虑了具有两种资产的简化设置。目标是找到投资于这两种资产的最佳投资组合，同时考虑它们的预期回报和波动性，以及它们之间可能的相关性。均值-方差分析用于分析可行的投资组合集并确定最优和次优投资组合。演讲者随后强调了马科维茨理论及其扩展在为这些问题提供优雅答案方面的重要性。最后，进行模拟以检查不同投资组合中每种资产的累积回报。
00:10:00 在本节中，将讨论平均回报率为 15% 且波动率为 25% 的模拟资产。每周回报的散点图显示没有明显的相关性，尽管存在样本相关性。右图显示了可行的投资组合集，配置资产 2 可以提高投资组合的回报率，而不会影响波动性。还讨论了最小方差投资组合，不同资产的权重与其平方波动率成反比。蓝色图表稍微靠近资产 1，表明资产 1 的权重略高。
00:15:00 在本节中，研究了次优投资组合的概念，得出的结论是散点图上的所有点都是次优投资组合，必须在回报率和波动率之间进行权衡。讨论了当两个完全不相关的资产汇集在一起时分散化的好处，并检查了负相关对可行集和降低波动性的影响。两种资产之间的相关性为 -1 可导致零波动性投资组合，这在市场上很少见，但在定价理论中，该投资组合的回报应等于无风险利率。
00:20:00 在视频的这一部分，演讲者讨论了投资组合理论中相关性和多元化之间的关系。模拟表明，增加资产之间的相关性会导致多元化收益减少，这意味着投资组合的方差不能降低太多。演讲者强调了在评估投资组合时使用准确估计平均回报、波动率和相关性的重要性，因为样本估计可能与总体参数不同并且具有一定的可变性。投资组合优化的二次规划问题涉及在投资组合均值和全部投资的约束条件下最小化投资组合的平方波动率，这可以使用拉格朗日条件和一阶条件来解决。
00:25:00 在本节中，演讲者解释了如何求解权重和最小方差。一阶条件是解，因为拉格朗日的二阶导数等于协方差矩阵，可以解。通过将给定的 alpha 代入解决方案，也可以解决最优投资组合的方差。这个问题可以用其他两种方式来看待，一种是在波动率约束下最大化回报，另一种是在方差负倍数的情况下最大化回报。这些是由同一个拉格朗日量解决的等价问题。
00:30:00 在本节中，我们将了解有效边界，它是给定一系列可行目标回报和波动率值的所有可能解决方案的集合。在双资产案例中，有效边界是一条抛物线，添加另一项资产会创建多个抛物线，这些抛物线定义了可行集。有效边界是曲线的顶部。添加无风险资产将可行集扩展为无风险资产点与有效边界上任意点之间的直线，从而允许对无风险资产和其他资产的组合进行投资。
00:35:00 在本节中，讲师讨论了解决目标是最小化波动性同时确保回报等于的问题的数学
一个特定的值。通过投资于无风险资产，投资者可以以较低的方差获得较高的回报，扩大投资机会。讲师提供了确定最佳投资组合的公式，该投资组合按比例投资于风险资产，但权重分配不同，具体取决于目标回报。这些公式还提供了投资组合方差的封闭式表达式，由于使用最优投资组合时的权衡，它随着目标回报的增加而增加。完全投资的最优投资组合称为市场投资组合。
00:40:00 在本节中，演讲者解释了最优投资组合的概念，即使所有投资组合的平均回报最大化的投资组合。他们提到，无论投资者愿意承担多少风险，每个最优投资组合都投资于无风险资产和市场投资组合的组合。演讲者给出了市场组合的期望收益和方差的表达式，并给出了最优组合的权重公式。这导致了资本市场线的定义，它允许投资者确定任何给定风险水平的预期回报。
00:45:00 本节讨论投资组合优化的资本市场线。这条线表示任何最优投资组合的预期收益，等于无风险利率加上市场投资组合每风险收益的倍数。通过为市场投资组合分配额外的权重并以无风险利率借入资金，人们可以获得更高的回报和超出市场投资组合的波动性，从而扩大有效边界。本节最后讨论了 von Neumann-Morgenstern 效用理论，该理论考虑了基于预期回报和波动性的投资组合优化决策过程。
00:50:00 本节介绍投资组合理论的概念。投资组合理论涉及根据特定的财富效用函数在不确定的情况下做出投资决策，目的是最大化财富的预期效用。该理论在不确定性下提供理性决策方面非常强大，这些决策考虑了关于更高回报、更低波动性和所用效用函数定义的其他因素的偏好。讨论了效用函数的基本属性，包括风险规避以及绝对和相对风险规避的概念。投资组合理论中使用的效用函数包括线性函数、二次函数、指数函数、幂函数和对数函数。
00:55:00 在本节中，演讲者讨论了二次效用函数下的投资组合理论和高斯分布回报的假设。在这些假设下，均值-方差分析是投资组合优化的最佳方法。然而，对于不同的效用函数，例如那些考虑偏度或峰度惩罚的效用函数，可能需要对基本模型进行扩展。演讲者还指出，实际的投资组合优化问题涉及限制，例如只做多的投资组合、持有限制、简单线性限制、周转率限制和基准敞口限制。在将投资组合从一个时期调整到下一时期时，有必要考虑这些限制。
01:00:00 在本节中，演讲者讨论了可应用于投资组合优化以控制投资组合中的风险和变化的不同类型的约束。其中包括控制投资组合与其基准之间的跟踪误差、限制对不同市场因素的敞口、应用最小交易和持有规模以及整数约束。这些约束可以表示为对权重的线性和二次约束，并且可以与投资组合优化问题一起实施。给出的示例是关于美国部门交易所交易基金的。
01:05:00 在本节中，演讲者讨论了交易所交易基金作为投资股票市场的一种方式的潜力。他们分析了投资于美国市场各个工业部门的九种不同的 ETF。这些 ETF 在 2009 年和上周之间的表现不同，这凸显了它们对多元化投资组合的价值。演讲者通过投资组合分析工具检查了这一时期这些 ETF 的最佳配置。结果显示，代表消费必需品的黄色 ETF 获得高权重，其次是代表能源的绿色 ETF，以及代表健康的橙色，这意味着这些行业具有投资前景。此外，通过限制每项资产的 30% 最大投资来应用均值方差优化。该图表明，当回报率高于无风险利率时，此约束开始生效，这意味着将更多权重分配给其他 ETF，以增加消费者的可自由支配投资组合。
01:10:00 在本节中，讲师讨论资本约束如何影响最优投资组合。他们展示了有效边界图，并展示了投资组合如何随着约束的变化而变化。当考虑 10% 的目标回报率和 30% 的资本约束时，将显示波动率为 10% 的最佳投资组合。然而，当资本约束降低到 15% 时，有效边界下降，投资组合必须分配给其他交易所交易基金，因为约束会更快到来。该讲座强调资本限制在某些情况下是现实的，以及它们如何影响投资政策。
01:15:00 在本节中，演讲者讨论了使用交易所交易基金 (ETF) 和市场中性策略的投资组合优化。 ETF 的例子表明过去的表现如何可以定义投资组合，但它在现实中并不可靠。演讲者随后解释了对冲基金如何使用市场中性策略投资于基于行业的模型，这些模型的相关性往往较低，并提供显着的多元化收益。该图显示，跨这些部门市场中性模型的最佳配置可以帮助实现 10% 的目标波动率，并且由于它们的相关性较低，结合不同的模型有利于投资组合优化。
01:20:00 在本节中，演讲者强调估计回报率、估计波动率和相关性的结果可能会受到估计期选择、估计误差和可以调节这些问题的不同技术的影响。使用因子模型来估计方差-协方差矩阵会导致更精确的优化输入。演讲者还讨论了不同的风险度量，例如平均绝对偏差、半方差和风险价值度量，这些度量现在是投资组合管理和风险资产管理的标准。还有一种风险价值的扩展，称为条件风险价值。适当的风险措施取决于所投资的资产，并且对用于风险分析的连贯风险措施进行了全面讨论。

14. Portfolio Theory

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading DoEasy 函数库中的价格（第六十五部分）：市场深度集合并操控 MQL5.com 信号的类深度神经网络 (第 IV 部)。创建,

MetaQuotes 2023.06.13 14:05 #110

15. 因素建模

15. 因素建模

在本节中，视频深入探讨了因子建模的实际方面，包括基础参数的估计和因子模型的解释。演讲者强调了将模型拟合到特定数据周期的重要性，并承认对因素之间的动态和关系进行建模至关重要。

该视频解释了最大似然估计方法可用于估计因子模型的参数，包括因子载荷和 alpha。估计过程涉及使用具有估计因子载荷和 alpha 值的回归公式来估计因子实现。 EM（期望最大化）算法被强调为复杂似然函数的强大估计方法，因为它在假设已知隐藏变量的情况下迭代地估计隐藏变量。

讨论了因子建模在商品市场中的应用，强调识别驱动回报和协方差的潜在因素。这些估计因素可以作为其他模型的输入，从而更好地了解市场的过去和变化。演讲者还提到了使用变换矩阵 H 考虑估计因子的不同变换的灵活性。

引入似然比检验作为检验因子模型维数的一种方法。通过将估计的因素模型的可能性与简化模型的可能性进行比较，可以评估其他因素的重要性和相关性。这种测试方法有助于确定要包含在模型中的适当数量的因素。

本节最后强调了对因素动态及其结构关系进行建模的重要性。因子模型提供了一个框架，用于理解因子之间的相互作用及其对资产回报和协方差的影响。通过考虑动态和结构关系，投资者和分析师可以获得对金融市场潜在驱动因素的宝贵见解。

总体而言，本节扩展了因子建模主题，探讨了参数估计、因子模型的解释以及因子建模在商品市场中的应用。本节强调需要适当的建模技术和了解因素之间的动态和关系，以获得对金融市场的有意义的见解。

00:00:00 在本节中，讨论的主题是因子建模，旨在通过使用因子来解释回报和协方差，使用多元分析对金融市场进行建模。有两种类型的因素模型，其中因素可以是可观察的或隐藏的，统计因素模型用于指定这些模型。线性因子模型使用因子 f1 到 fk，它是依赖于系数 beta_1 到 beta_k 的随机过程值的状态空间模型。该设置看起来像一个标准的回归模型，向量 beta_i 被称为因子载荷，特定因子被称为资产 i 的 epsilon，周期 t。目标是与大量证券相比，使用少量的潜在因素来表征回报和协方差，从而大大简化问题。
00:05:00 在本节中，视频讨论了一个因子模型，用于解释基于基础因子的资产回报。残差项被认为是随机的，并假设为均值为 0 的白噪声。该模型假设资产回报取决于具有均值 mu_f 和协方差矩阵 omega_f 的基础因素。 psi 矩阵表示具有标的资产的特定方差的对角矩阵。 m 变量随机过程的整体向量的协方差矩阵可以使用条件和无条件期望和协方差来获得。 x的无条件协方差等于残差项协方差的期望加上x的期望值与残差项之间的协方差的两倍。协方差矩阵的参数数量是 m 乘以 m 加 1 加 2。
00:10:00 在本节中，引入因子模型的概念作为减少多元回归中涉及的参数数量的一种方法，特别注意将因子模型解释为一系列时间序列回归。重点是一次将所有资产的所有内容组合在一起，这在拟合这些方面具有计算效率。提出了最简单的因子模型，即夏普的单因子模型，其中股票的超额回报可以建模为市场超额回报的线性回归，通过不同资产的 beta_i 缩放风险。
00:15:00 在本节中，视频讨论了因子建模中的资产协方差矩阵，以及如何使用协方差建模模型简化它，这在投资组合管理和风险管理中很有用。还解释了夏普单指数模型的估计过程，以及可以作为线性因子模型中相关因子的潜在候选者观察到的公共因子变量的概念。潜在因素的有效性是通过拟合模型并查看它对整体协方差矩阵的贡献程度来确定的。
00:20:00 在本节中，视频介绍了因子建模以及将因子转化为意外因子以对宏观经济变量建模的方法。讨论了在这些因素中加入意外变化的力量，这种方法现在被广泛应用。该视频还解释了如何使用简单回归方法和高斯-马尔可夫假设来估计基础参数。还提供了 BARRA 方法的示例，该方法使用基于基本面或特定资产属性的公共因子变量。
00:25:00 在本节中，讨论了 Fama-French 因子建模和风险分析方法，其中涉及根据市值和价值与增长等常见因素对股票进行排名，并将它们分成五分位数以获得等权重平均值. BARRA行业因子模型，将股票分为不同的行业组，作为因子建模的一个简单案例也被提及。因子实现未被观察到，但在这些模型的应用中进行了估计，从而可以计算与单个资产回报的相关性。总的来说，这些方法今天继续广泛用于因子建模。
00:30:00 本节介绍行业因素模型的概念。具体来说，行业因素模型允许关联因素加载，这些因素用于根据资产所属的行业组来加载每项资产。行业因素模型的问题是如何指定潜在因素的实现，这些因素可以用回归模型进行估计。因子实现的估计假设 x 的分量的可变性具有相同的方差，但实际上这些模型中存在异方差性。总的来说，本节概述了行业因素模型的协方差矩阵估计和回归估计。
00:35:00 在视频的这一部分，重点是估计回归参数时的异方差及其对投资组合优化的影响，其中资产按其预期回报加权，并受到高方差的惩罚。因子模拟投资组合用于确定因子交易的真实价值，例如 Fama-French 模型，每个因子的实现是标的资产收益的加权和。通过标准化 k 维实现的行权重，可以为资产分配定义解释潜在投资的因子模拟投资组合。
00:40:00 在本节中，演讲者讨论了统计因子模型，用于分析 T 时间单位内 m 种资产的资产收益时间序列，其中潜在因子未知。演讲者将因子分析和主成分分析解释为揭示那些可以根据数据本身定义的潜在因素的方法。演讲者指出，在定义因子模型时具有灵活性，矩阵 B 或因子 f 的任何给定规格都可以通过 k x k 可逆矩阵 H 进行转换。
00:45:00 在本节中，讨论了因子建模和转换的概念，强调了线性函数如何根据基础因子的协方差矩阵保持不变。讨论转向定义对角化因子的矩阵 H，这允许考虑具有不相关因子分量的因子模型。做出某些假设（例如正交和零均值因子）可将模型简化为协方差矩阵 sigma_x，因为因子载荷 B 乘以其转置，再加上一个对角矩阵。还在具有正态分布的基础随机变量的正态线性因子模型的背景下讨论了最大似然估计，从而得出数据的联合密度函数。
00:50:00 在本节中，视频讨论了因子建模以及如何应用最大似然估计方法来使用 EM 算法指定 B 和 psi 矩阵的所有参数。可以使用回归公式估计因子载荷和 alpha 来估计因子实现。 EM 算法是一种强大的估计方法，它可以通过估计隐藏变量（假设隐藏变量已知）并迭代该过程来简化复杂的似然函数。因素实现可用于风险建模。
00:55:00 在本节中，演讲者讨论了统计因素分析在商品市场中的应用，以及确定驱动回报和协方差的潜在因素。估计的潜在因素也可以用作其他模型的输入，这有助于了解过去及其变化方式。演讲者还提到了考虑对任何给定的一组估计因子进行变换的H矩阵的不同变换的灵活性。此外，还提到了使用统计因素分析来解释潜在因素，以及在测量智商和寻找因素负荷轮换方面的应用，这些因素使因素更易于解释。最后，本节介绍似然比检验和因子模型维数检验。
01:00:00 本节介绍主成分分析（PCA）的概念，它是一种利用协方差矩阵的特征值和特征向量将多元结构缩减到更小维度空间的理论框架。 PCA创建了一个新的坐标系，不改变数据的相对位置，只是旋转了坐标轴，简化了
原始变量 x 的仿射变换。主成分变量的平均值为 0，协方差矩阵由特征值的对角矩阵给出，它们表示一个线性因子模型，其因子载荷由 gamma_1 给出，残差项由 gamma_2 p_2 给出。但是，gamma_2 p_2 向量可能没有对角协方差矩阵。
01:05:00 在本节中，视频解释了线性因子模型和主成分分析之间的差异。对于线性因子模型，假设残差向量具有等于对角线的协方差矩阵，而主成分分析可能正确也可能不正确。然后视频继续讨论经验主成分分析，其中样本数据用于获取均值和协方差矩阵的估计值。还引入了可变性的概念，其中第一主成分变量定义为坐标轴具有最大可变性的维度。然后第二个主成分变量是与第一个方差最大的方向正交的方向，继续这个过程来定义所有 m 个主成分变量。
01:10:00 在本节中，演讲者解释了如何使用主成分分析来分解协方差矩阵 σ 的不同主成分变量的可变性，它表示多元数据集的总方差。矩阵的非对角线项为零，表明主成分变量不相关并且具有自己的可变性水平，如特征值所示。作为案例研究，演讲者以 2000 年至 2013 年美国国债收益率为例，专门研究了收益率的变化。重点是 2001 年至 2005 年的五年期间，分析包括该期间收益率的每日波动和负水平。
01:15:00 在本节中，演示者讨论了使用主成分分析对收益率变化进行因子建模。收益率变化的相关矩阵显示，较短期限的相关性较高，而随着远离对角线，相关性会降低。演示者使用图表直观地表示相关性，并表明第一个主成分变量解释了总可变性的 85%。碎石图证实前几个主成分解释了大量的可变性。最后，演示者将原始收益率变化的标准差与主成分变量的标准差进行比较。
01:20:00 在本节中，展示了前几个主成分变量的不同产量变化的载荷图，这给出了对主成分变量的解释。第一个主成分变量衡量整个范围内的平均收益率变化，并给予五年期更大的权重，它衡量收益率曲线的水平变化，而第二个主成分变量着眼于收益率之间的差异长期期限与短期期限的变化。此外，第三个主成分变量提供了期限结构曲率的度量以及它如何随时间变化。主成分变量彼此之间的相关性为零，随着时间的推移累积的主成分变量表明这些潜在因素在一段时间内是如何演变的。
01:25:00 在本节中，演讲者讨论了将统计因素分析模型拟合到数据并比较五年期间的结果。发言人强调了在特定时期指定模型的重要性，并指出拟合模型只是一个起点。最终，有必要对这些因素的动态及其结构关系进行建模。

15. Factor Modeling

2015.01.06
www.youtube.com

MIT 18.S096 Topics in Mathematics with Applications in Finance, Fall 2013View the complete course: http://ocw.mit.edu/18-S096F13Instructor: Peter KempthorneT...

Quantitative trading MQL5 中的统计分布 - 充分利用

1 ...4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ...39

新评论