Matstat 计量经济学 Matan

Roman 2021.05.06 00:00 #1

关于交易、自动交易系统和交易策略测试的论坛

从理论到实践。第二部分

Aleksey Nikolayev, 2021.05.05 22:38

粗略地说，混合会削弱依赖性，但不会完全消除。
事实上，在实际应用方面，概率依赖是该定理最重要的部分。
当我在麻省理工学院看了一个针对工程师的youtube理论家课程时，都是关于这个的。

你是指决定系数r2吗？
还是按概率依赖的其他东西？

我实时考虑r2，以估计变量x对y的 "影响强度 "
，令人惊讶的是，在一些货币系列上，它在高值时保持相当稳定

。

Dmitry Fedoseev 2021.05.06 02:00 #2

难道概率还不够吗？如果这是概率理论...

Roman 2021.05.06 02:35 #3

Dmitry Fedoseev:
仅仅是概率还不够吗？如果是概率论...

我想澄清在这种情况下是指哪个评价标准。
如果是常规的相关关系，那么与r2他们的计算方法有差异，相应的估计也不同。
在统计学中，他们通常建议使用r2作为更可靠的方法。

十分钟后

Aleksey Nikolayev 2021.05.06 05:52 #4

Roman:

你是指决定系数r2吗？
或者你说的概率依赖是指其他的东西？

概率（随机）依赖是理论化和Matstat中最重要的概念之一。这个概念（通过条件概率）首先被定义为随机事件，然后以条件分布的形式转移到随机变量。依赖性是指条件分布与无条件分布的不一致性，而独立性是指它们的重合性。对依赖性的一个流行解释是- 知道一个c.c.得到什么价值，就能得到另一个c.c.的价值信息。依赖性位于其两个极端状态之间--独立和刚性的功能连接。

一般意义上讲，我们总是从随机变量的联合分布开始，在此基础上构建各种具体的依赖度量。这些可以是共线性、相互熵、相关性等。

相关性、R2等只有在联合分布为多变量正态时才合理适用。在实践中，当常态性不确定时，也会应用它们（由于简单），但这时它们的作用只能由经验决定。

Roman 2021.05.06 16:44 #5

Aleksey Nikolayev:

概率（随机性）是理论研究和数学统计中最重要的概念之一。这个概念（通过条件概率）首先为随机事件定义，然后以条件分布的形式转移到随机变量。依赖性是指条件分布与无条件分布的不一致性，而独立性是指它们的重合性。对依赖性的一个流行解释是- 知道一个c.c.得到什么价值，就能得到另一个c.c.的价值信息。依赖性位于其两个极端状态之间--独立和刚性的功能连接。

一般意义上说，我们总是从随机变量的联合分布开始，在此基础上构建各种具体的依赖度量。这些可以是共线性、相互熵、相关性等。

相关性、R2等只有在联合分布为多变量正态时才合理适用。在实践中，当没有确定的常态性时，它们也被应用（由于简单），但此时它们的效用只由经验决定。

啊，这是一个棘手的分布，我总是忘记它 ))
所以所有的统计模型都需要这个标准？
由于价格序列不存在正态性，因此开始了准备数据的折磨，
，以便以某种方式使它们更接近于正态分布，而不失去原来的属性。

由此产生了如何准备这些数据的问题。
按照我的理解，标准化、cusum、派生等并不能带来高质量的结果。
所以他们开始变瘦或什么的。一般来说有哪些方法？

所以我再次得出结论，为统计模型准备定性数据是一个巨大的研究课题。
我搜索了关于这个主题的教程，但什么也没找到，bigdata、MO、neuronka到处都是，但如何为它们准备定性数据，由于某些原因，没有披露。

Roman 2021.05.06 17:26 #6

我只是不能理解以下的反常现象，为什么会发生这种情况。
我计算了一个正交模型，它应该比MNC更好。
我得到了起始系数。
然后通过中位数算法调整模型参数（系数），即对离群值的一种稳健性。
该模型定性地描述了初始系列。

蓝色--原创系列。
灰色是模型。

但在其中一个历史部分，我观察到了一个分歧，这个分歧进一步收敛到上面的截图中的确切位置

我看不到真相，为什么会发生这种情况？是什么促成了它？
系数在每一步都会重新计算，并且应该适合（x）和（y）
，这是一个拟合错误吗？我明白，在一个或两个甚至三个计算步骤中可能会出现错误，
，但似乎很奇怪，错误应该持续这么久。也许这不是一个装配错误？是别的东西吗？

Aleksey Nikolayev 2021.05.06 17:56 #7

Roman:

我只是不能理解以下的反常现象，为什么会发生这种情况。
我计算了一个正交模型，它应该比MNC更好。
我得到了起始系数。
然后通过中位数算法调整模型参数（系数），即对离群值的一种稳健性。
该模型定性地描述了初始系列。

蓝色--原创系列。
灰色是模型。

但在其中一个历史部分，我观察到了一个分歧，这个分歧进一步收敛到上面的截图中的确切位置

我看不到真相，为什么会发生这种情况？那么是什么促成了这种情况呢？
系数在每一步都会重新计算，并且应该适合（x）和（y）
，这是一个拟合错误吗？我明白，在一个或两个甚至三个计算步骤中可能会出现错误，
，但似乎很奇怪，错误应该持续这么久。也许这不是一个装配错误？是别的东西吗？

我只能建议找到一些实现你的模型（或类似的模型）的统计包，看看它在你的数据中是如何表现的。这可能有助于你了解问题是模型有问题还是执行错误。

secret 2021.05.06 18:14 #8

Roman:

由于价格序列中没有正态性，准备数据的曲折任务，
，就是以某种方式近似于正态分布而不失去原有的属性。

对数增量就不能用了？

Roman 2021.05.06 18:43 #9

Aleksey Nikolayev:

我所能建议的是找到一个能实现你的模型的统计包（或与之相似的），看看它在你的数据上的表现。它可能有助于了解问题是模型有问题还是执行错误。

谢谢你的想法，我没有意识到这一点。

Roman 2021.05.06 18:53 #10

secret:
增量的对数 - 不够好？

是的，这基本上是我正在做的一个或多或少的好选择。
在另一个类似的模型上，我有时也会观察到小的分歧，如发散。
但并不像上面的截图那么长，而是相当短的时间。这让我想知道为什么会发生这样的情况。
我曾尝试过这种模式，看到了更长时间的分歧。

所以我不明白这种分歧从何而来。不是一个正确的模型或低质量的源数据。
我不明白行动的逻辑。
要么我应该把初始数据大约调整到正常，
，要么我应该铲除不同的模型。
但要尽量先写好这个模型，不是那么容易就能检查出来并扔掉的 ))