什么是自相关性?

分类: 365提款超过7天 时间: 2025-08-23 01:38:49 作者: admin 阅读: 9539 点赞: 706
什么是自相关性?

自相关或序列相关会分析时间序列数据,以寻找时间序列中不同点位置的值的相关性。这一重要的分析方法可衡量某个值与自身的相关性。我们并非计算不同变量(如 X1 和 X2)之间的相关系数,而是计算变量自身在整个数据集的各时间步长上的相关程度。构建线性回归模型时,其中一项主要假设是预测该模型中独立变量的误差均相互独立。很多时候,在处理时间序列数据时,您会发现与时间相关的误差。换言之,出现误差依赖性的原因在于时间因素。随时间相关的误差项被称为自相关误差。此类误差会导致某些更常见的线性回归创建方法(例如,普通最小二乘法)出现问题。解决这些问题的方法是:使用自相关检验所确定的时间滞后对因变量自身进行回归。“滞后”仅为因变量的先前值。如果您有月度数据且想预测即将到来的月份,则可将前两个月的值用作输入。这意味着您会用当前值对前两个滞后进行回归。

与相关性衡量两个变量之间的线性关系相同,自相关性通过线性模型衡量时间序列的滞后值之间的关系。当数据具有趋势时,小滞后的自相关性往往很大且为正,因为时间上接近的观测值在值上也接近。因此,趋势时间序列的自相关性函数(通常称为 ACF)往往具有随着滞后增加而缓慢减小的正值。

当数据存在季节性波动或某些模式时,季节性滞后(季节性周期的倍数)的自相关性则比其他滞后的自相关性更高。当趋势性和季节性数据同时存在时,则会看到这些效应的结合。未显示自相关的时间序列属于真正的随机流程,且被称为白噪声。ACF 是时间序列中两个值之间的相关系数。

自相关检验的几种主要方法如下:

您可以计算残差,并绘制时间 t 时的标准误差(通常写为 et,针对 t)。位于零线一侧的任何残差聚类都可能表明自相关性的存在位置以及其显著性。

运行 Durbin-Watson 检验可以帮助确定时间序列是否包含自相关性。要在 R 中执行此操作,请创建一个线性回归,使因变量回归时间,然后传递该模型来计算 Durbin-Watson 统计数据。要在 Python 中执行此操作,您可以将残差从拟合的线性回归模型传递到检验。

另一种选择是使用 Ljung Box 检验,将时间序列的值直接传递给检验。Ljung-Box 检验的零假设是残差独立分布,备择假设是残差不独立分布且表现出自相关性。这实际上意味着,小于 0.05 的结果表明时间序列中存在自相关性。Python 和 R 库都提供了运行此检验的方法。

最常见的选择是,使用由时间序列中特定滞后期之间的相关性生成的可视化相关图。结果中的模式表明存在自相关性。这是通过显示整个时间序列中不同滞后的相关性程度来绘制的。示例图如下所示:

相关推荐