和風ましらに

機械学習とか勉強したことを書き認めるブログ

時系列分析 - データ解析編 ~Prophet

概要

簡単に原理について

このアルゴリズムは、一般化加法モデル(GAM)になり、次の要素で構成されています。

y ( t ) = g ( t ) + s ( t ) + h ( t ) + ϵ t ,

  • g(t): トレンド項。周期的な傾向ではない部分を表現。
  • s(t): 季節要因の項。周期的な情報を表現する部分。
  • h(t): 休日やイベント等の情報を表示する項。

g(t) トレンド項について

大きく、「ロジスティック非線形トレンド」「線形トレンド」で g ( t ) を表現する方法が2つ用意されている。

ロジスティック非線形トレンドについて

以下の式で表現される。 g ( t ) = C 1 + e k ( t m ) ,

  • C: 曲線の最大値
  • k: 成長率 (曲線の傾き)
  • m: オフセット

これに併せて、任意の時点での、成長率と上限値の変化点を手動で設定できます。 これにより、実際のビジネス現場で起こった重要なリリースの日付に関する影響を表現できます。

線形トレンド

一定の成長率を持つ単純な線形モデル。成長が飽和しない問題に最適です。

s(t): 季節要因項

Prophet の本項は、フーリエ級数を使って表現しています。 これによって、週単位や月単位での周期性を表現しています。

h(t): 休日やイベント等の情報を表示する項

予測可能な、イベント等の情報を表現する項目。

エラー項

これらの項目で表現できなかった情報を、正規分布などで補って表現する

次回は、実装&評価をしてみる。