时序预测之四 _Prophet 时序模型

1. 说明

Prophet 是 FaceBook 开源的时序框架。非常简单实用,你不需要理解复杂的公式,看图,调参,调用十几行代码即可完成从数据输入到分析的全部工作,可谓懒人之利器。

在效果方面,我在同一项目中尝试了 ARIMA,将星期和节假日作为特征代入 GBDT,Prophet,相对来说,Prophet 效果最好,当然这与数据有关,也不能一概而论。总之,Prophet 效果挺好的,训练速度也挺快。

Prophet 的原理是分析各种时间序列特征:周期性、趋势性、节假日效应,以及部分异常值。在趋势方面,它支持加入变化点,实现分段线性拟合。在周期方面,它使用傅里叶级数(Fourier series)来建立周期模型 (sin+cos),在节假和突发事件方面,用户可以通过表的方式指定节假日,及其前后相关的 N 天。可将 Prophet 视为一种针对时序的集成解决方案。

使用 Prophet 具体使用步骤就是:根据格式要求填入训练数据,节假日数据,指定要预测的时段,然后训练即可。除了预测具体数值,Prophet 还将预测结果拆分成 trend, year, season, week 等成份,并提供了各成份预测区间的上下边界。不仅是预测工具,也是一个很好的统计分析工具。

当然 Prophet 也有它的弱项,比如可调节的参数不多,不支持与其时序特征结合等等,不过这些也可以通过预测处理和模型融合来解决。

2. 安装

在 Ubuntu 系统中可通过以下命令安装 prophet:

1
$ sudo pip install fbprophet

通过以下命令下载源码(下面例程中用到了源码中的数据,请先下载源码)

1
$ git clone https://github.com/facebookincubator/prophet.git

3. 例程

  具体使用可参考源码的 notebook 目录中的例程,很多中文例程都使用了其中的 quick_start.ipynb,代码在下面列出。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import pandas as pd
import numpy as np
from fbprophet import Prophet
import matplotlib.pyplot as plt

# 读取时间数据文件,文件也在源码目录中
file_path= 'examples/example_wp_peyton_manning.csv'
df = pd.read_csv(file_path)

# 输入节假日数据,注意lower_window, upper_window是前后影响天数
playoffs = pd.DataFrame({
'holiday': 'playoff',
'ds': pd.to_datetime(['2008-01-13', '2009-01-03', '2010-01-16',
'2010-01-24', '2010-02-07', '2011-01-08',
'2013-01-12', '2014-01-12', '2014-01-19',
'2014-02-02', '2015-01-11', '2016-01-17',
'2016-01-24', '2016-02-07']),
'lower_window': 0,
'upper_window': 1,
})
superbowls = pd.DataFrame({
'holiday': 'superbowl',
'ds': pd.to_datetime(['2010-02-07', '2014-02-02', '2016-02-07']),
'lower_window': 0,
'upper_window': 1,
})
holidays = pd.concat((playoffs, superbowls))

# 训练和预测
prophet = Prophet()
df['y'] = np.log(df['y'])
prophet.fit(df)
future = prophet.make_future_dataframe(freq='D',periods=10) # 测试之后十天
forecasts = prophet.predict(future)

# 训练结果作图
prophet.plot(forecasts).show()
prophet.plot_components(forecasts).show()
plt.show()

趋势,周期分析图