非定常系列の主成分分析

というNBER論文をジェームズ・ハミルトンらが上げているungated版)。原題は「Principal Component Analysis for Nonstationary Series」で、著者はJames D. Hamilton(UCサンディエゴ)、Jin Xi(同)。
以下はその要旨。

This paper develops a procedure for uncovering the common cyclical factors that drive a mix of stationary and nonstationary variables. The method does not require knowing which variables are nonstationary or the nature of the nonstationarity. An application to the FRED-MD macroeconomic dataset demonstrates that the approach offers similar benefits to those of traditional principal component analysis with some added advantages.
(拙訳)
本稿では、定常変数と非定常変数の組み合わせにおける共通循環要因を明らかにする手順を構築する。この手法では、どの変数が非定常であるかを知っている必要はなく、非定常性の性格を知っている必要もない。FRED-MDマクロ経済データセット*1への応用により、この手法が従来の主成分分析と同様の便益を提供するとともに、幾つかの利点を追加で提供することが示される。

この論文は、以前「ホドリック=プレスコットフィルタを決して使ってはいけない理由 - himaginary’s diary]」で紹介したハミルトンの考え方を発展させたもので、2年前以前の自系列で回帰した残差は定常的になる、という考えに基づいている。説明スライドでは以下のように記述している。

The error in predicting a variable 2 years from now as a linear function of recent values:
– is a stationary population magnitude for a broad class of nonstationary processes such as ARIMA(p,d,q) or processes stationary around dth-order polynomial time trends
– could be described as cyclical component of the series
– can be consistently estimated by OLS regression without knowing d
(拙訳)
直近の値の線形関数で今から2年後を予測した誤差は:

  • ARIMA(p,d,q)や、d次の多項式タイムトレンド周りで定常的な過程のような広範な種類の非定常過程について、定常的な母集団の尺度である
  • 系列の循環要因として描写できる
  • dを知ることなく、通常回帰で一致性をもって推計できる

スライドでは、Δyitが定常的な場合(d=1)、
  yit= yi,t-h+ Σj=0 to h-1 Δyi,t-j
という恒等式により、yitが 、yi,t-hと何か定常的なものとの線形関数で表せることを指摘している。
同様に、Δ2yitが定常的な場合(d=2)、
  yit= yi,t-h+ hΔyi,t-h + Σj=0 to h-1 (j+1)Δ2yi,t-j
という恒等式により、yitが 、yi,t-hと yi,t-h-1と何か定常的なものとの線形関数で表せる。

応用例としてスライドでは、以下の異なる満期の国債利回りの時系列を挙げている。

これには下方トレンドがあるように見えるため、一階の階差を取る研究者もいるが、多くのファイナンス研究者は利回りそのもので主成分分析を行う。一階階差と元の系列では当然ながら特性が違うため、こうした研究者による手法の違いは異なる結果をもたらしてしまう。ハミルトンの手法を適用すると、利回りそのものの主成分分析で問題ないことが示されるとのことである。

2つ目の応用例が、上の要旨で言及されているMcCracken=NgのFRED-MDマクロ経済データセットである。このデータセットでは定常になるように一部の系列に対し変換を行っているほか、外れ値処理も行っている。ハミルトンの手法では、そうした変換や外れ値の処理が不要になる、とのことである*2

EViewsには既にこの手順のアドインが実装されているようである

*1:cf. FRED-MD: A Monthly Database for Macroeconomic Research- Working Papers - St. Louis Fed

*2:月次で2年、即ち24個の残差を取ると、その分布が中心極限定理によりかなり正規分布に近くなるから、との由