ホドリック=プレスコットフィルタを決して使ってはいけない理由

という刺激的なタイトルの論文をジェームズ・ハミルトンが書き、同名のEconbrowserエントリで紹介している(原題は「Why you should never use the Hodrick-Prescott filter」;H/T Economist's View)。
以下は論文の要旨。

Here’s why. (1) The HP filter produces series with spurious dynamic relations that have no basis in the underlying data-generating process. (2) A one-sided version of the filter reduces but does not eliminate spurious predictability and moreover produces series that do not have the properties sought by most potential users of the HP filter. (3) A statistical formalization of the problem typically produces values for the smoothing parameter vastly at odds with common practice, e.g., a value for λ far below 1600 for quarterly data. (4) There’s a better alternative. A regression of the variable at date t+h on the four most recent values as of date t offers a robust approach to detrending that achieves all the objectives sought by users of the HP filter with none of its drawbacks.


(拙訳)
その理由は以下の通り。

  1. HPフィルタは、元のデータ生成過程には一切基づかない偽の動的関係を持つ系列を生み出す。
  2. フィルタの片側バージョン*1は偽の予測可能性を減らしはするが取り除くことは無く、また、HPフィルタの想定利用者が求める特性を持たない系列を生み出す。
  3. 一般に、問題を統計的に定式化すると、平滑化パラメータとして通常の慣行から大きく外れる値がもたらされる。即ち、λの値が四半期データについて1600を大きく下回る。
  4. もっと良い選択肢がある。t+h時点の変数をt時点の直近4期の値に回帰することは、HPフィルタの利用者が求める目的をすべて達成し、かつ、同フィルタの欠点が一切無い頑健なトレンド除去の手段となる。


Econbrowserエントリの解説によると、HPフィルタで生成されたトレンドと原系列との乖離を大サンプルの中央付近で定式化した場合、その式には原系列の4次の差分項が出てくる。しかし、完全に予測不可能な系列を生み出すのが1次の差分で十分な時に、さらに3次の差分を掛けると、データの本来の動きとは全く無関係な動学が生み出されてしまう。エントリでは、HPフィルタを掛けたことによって株価や消費の偽の自己相関が生み出された例を図で示している。


ただ、特殊なケースとして、トレンドの2次の差分と、原系列とトレンドの差が、いずれも予測不可能である場合には、HPフィルタを掛けることが最適となる。だが、その場合に平滑化パラメータをデータから推計すると、概ね1になってしまい、一般に使われる値1600より3桁小さくなる。


一方、ハミルトンが提唱する回帰法は、d次の差分で定常になる系列のt+h時点の値は、t時点の直近d期の値と何らかの定常過程の和として表せる、という洞察に基づいている。yt+hを定数項とyt, yt-1, ..., yt-d+1に回帰することは、まさにその線形式を求めることになるという。というのは、その回帰係数についての残差は定常的になるが、他の係数については残差は非定常となるからである。
ハミルトンによれば、この方法には

  • トレンドの特性を把握する必要がない
    • 単に回帰を用いて残差の平方和を最小化する係数を求めればよい
  • dの真の値を知っている必要がない
    • p > dとなるpを使えば、推計された回帰係数のうちd個はトレンドを表し、残りのp-d個の回帰係数は残差と共に定常項を表すことになる
  • 季節要因も一緒に取り除かれる

というメリットがあるとの由。

*1:論文本文によると、将来時点のデータを使わない方法を指す。