时间序列预测/Ref
关于时间序列预测的一些总结 - 知乎 (zhihu.com)
特征工程使用滑动窗口,最小值,最大值,均值,方差
概念漂移
目标标量的统计特征随着时间的推移以不可预见的方式变化,每过一段时间序列的规律会变化。
不能用全部时间内的数据去训练
序列自相关性
如果预测结果和实际值存在滞后性,可能序列存在自相关性,可以通过差分运算消除自相关性
计算一个基准值,用基准值做为预测结果计算平均绝对误差或 r2 系数
-
- 针对明显周期和非平稳时序数据,可以利用经验模式分解(empirical mode decomposition,EMD)和长短期记忆(long short-term memory, LSTM)的组合算法应用于预测
时间序列和回归分析有什么本质区别? - 知乎 (zhihu.com)
时间序列分析的目标是:了解过去,预测未来
时间序列数据的特征是
自相关性
不可交换性(样本顺序不能交换)
时间序列利用数据之间的相关性进行预测,回归分析假设每个数据点都是独立的。
有什么好的模型可以做高精度的时间序列预测呢? - 知乎 (zhihu.com)
预测打车订单和预测风速的区别
形成机制
前者人的行为驱动,后者由自然因素驱动
人为因素驱动内在机理比较清楚
自然因素驱动内在机理难以刻画
预测人群行为相对来说更加简单
个人行为有明显的规律性(早晚)
个人行为有明显的周期性(每周)
不同人的行为近似独立(你打车和我打车没有关系)
打车订单可以看成大量的独立随机变量之和,波动性不大,呈现出明显的周期性
风速预测难点
时间粒度细
影响风速的因素多,且难以量化
风的周期通常以年为单位,对短期风速预测帮助不大
风通常分为大风年和小风年,没有趋势项。搞清楚了大小风年有利于评估全年风力资源,但对短期风速预测帮助不大。
[[ARIMA]] 描述平稳的时间序列自相关性的典型方法
当残差通过白噪声检验,表示建立一个合理的模型。
如果需要给出置信区间,需要对残差的平方进行白噪声检验。
如果存在异方差,需要通过 [[GARCH]] 进一步提取残差信息
-
STH 分解
时间序列分解为周期项 + 趋势项 + 节假日项
趋势项通过线性函数、对数函数和指数函数拟合
周期项通过傅里叶分解、周期核函数拟合
信号分解
将时间序列分解为高频和低频信号,对分离后的信号用模型拟合
分解方法
傅里叶分解
小波分解
经验模态分解 EMD
变分模态分解 VMD
LN 分解
- 将时间序列数据分解成线性项L和非线性项N,再拟合。