時系列分析 - データ解析編 ~Prophet
概要
簡単に原理について
このアルゴリズムは、一般化加法モデル(GAM)になり、次の要素で構成されています。
- g(t): トレンド項。周期的な傾向ではない部分を表現。
- s(t): 季節要因の項。周期的な情報を表現する部分。
- h(t): 休日やイベント等の情報を表示する項。
g(t) トレンド項について
大きく、「ロジスティック非線形トレンド」「線形トレンド」でを表現する方法が2つ用意されている。
ロジスティック非線形トレンドについて
以下の式で表現される。
- C: 曲線の最大値
- k: 成長率 (曲線の傾き)
- m: オフセット
これに併せて、任意の時点での、成長率と上限値の変化点を手動で設定できます。 これにより、実際のビジネス現場で起こった重要なリリースの日付に関する影響を表現できます。
線形トレンド
一定の成長率を持つ単純な線形モデル。成長が飽和しない問題に最適です。
s(t): 季節要因項
Prophet の本項は、フーリエ級数を使って表現しています。 これによって、週単位や月単位での周期性を表現しています。
h(t): 休日やイベント等の情報を表示する項
予測可能な、イベント等の情報を表現する項目。
エラー項
これらの項目で表現できなかった情報を、正規分布などで補って表現する
次回は、実装&評価をしてみる。