2024-10-052024-10-05 随手记 4 分钟读完 (大约645个字) 0次访问

Web Traffic Time Series Forecasting 1st place solution

局部特征
- 当发现有一个趋势，希望趋势持续。自回归模型
- 当发现一个流量高峰，高峰逐渐衰减。[[移动平均]]
- 当发现节假日流量高，期望未来的节假日流量都会高。季节性
全局特征
- 按年、按月有很强的 [[自相关]]
  - y轴是自相关系数，90 天和 365 天的系数比较大

Feature preprocessing

模型

tags:: #[[Model Architecture]] [[Encoder-Decoder]] [[Seq2Seq]] [[GRU]]

解决长时间序列(700天)依赖

+ 取过去重要节点的编码器输出，用 FC 压缩维度，加到解码器的输入特征中

  + 减少 noise 进行平滑：`attn_365 = 0.25 * day_364 + 0.5 * day_365 + 0.25 * day_366`

  + 利用 1D CNN 计算平滑的权重

^^lagged datapoint 滞后数据特征^^ [[lag feature]]
- 捕捉固定周期的历史信息
- 将每个日期对应前四个季度的数据输入到解码器中

Losses and regularization

1
2
3

epsilon = 0.1
summ = tf.maximum(tf.abs(true) + tf.abs(predicted) + epsilon, 0.5 + epsilon)
smape = tf.abs(predicted - true) / summ * 2.0

Reducing model variance

使用不同种子训练 3 个模型，每次训练在 10500-11500 区间保存 10 个 checkpoints，最后预测合并。
- 无法知道如何 early stopping
SGD averaging (ASGD) SGD + 动量
相当于[[bagging]] 模型

Hyperparameter tuning

Ref

Web Traffic Time Series Forecasting 1st place solution

Ryen Xiang

2024-10-05

2024-10-05

网络回响