对于来自 Yandex 雷达( https://radar.yandex.ru/search )的时间序列,我想建立一个 SARIMA 模型。数据集如下所示:
时间 | 视图 |
---|---|
2015年1月30日 | 117567557 |
2015年1月31日 | 100875949 |
2015年2月1日 | 110401452 |
2015年2月2日 | 128047549 |
2015年2月3日 | 126892621 |
- 时间序列不是平稳的
- 数据频率 每日
- 没有通行证
我使用 pmdarima 的 auto_arima 找到了该模型的参数。顺序 = (1,1,1) 季节性顺序 = (2,0,1,7)
y_train = train_data['Views']
y_test = test_data['Views']
model = sm.tsa.statespace.SARIMAX(y_train, order = (1,1,1),seasonal_order = (2,0,1,7))
model_fit = model.fit()
forecast = model_fit.predict(start=0, end=len(y_train) + len(y_test))
print(forecast)
plot(forecast, y_train, y_test, name.upper())