自相关
缩写 :-> ACF
1 | # https://github.com/Arturus/kaggle-web-traffic/blob/master/make_features.py#L88 |
$$R_{k}=\frac{\sum_{i=1}^{n-k}\left(X_{i}-\bar{X}\right)\left(X_{i+k}-\bar{X}\right)}{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}$$
取值范围 -1 到 1,越大越相关
比如一个序列长度是 L,如果具有周期性且周期性为 t,那么子序列
0:L-1-t和 子序列t:L-1的相关性是最大的
Ref