長期予測回帰のバイアス

というNBER論文が上がっているungated(SSRN)版)。原題は「Biases in Long-Horizon Predictive Regressions」で、著者はJacob Boudoukh(IDC ヘルツェリア大)、Ronen Israel(AQR Capital)、Matthew P. Richardson(NYU)。
以下はその要旨。

Analogous to Stambaugh (1999), this paper derives the small sample bias of estimators in J-horizon predictive regressions, providing a plug-in adjustment for these estimators. A number of surprising results emerge, including (i) a higher bias for overlapping than nonoverlapping regressions despite the greater number of observations, and (ii) particularly higher bias for an alternative long-horizon predictive regression commonly advocated for in the literature. For large J, the bias is linear in (J/T) with a slope that depends on the predictive variable’s persistence. The bias adjustment substantially reduces the existing magnitude of long-horizon estimates of predictability.
(拙訳)
スタンボー(1999)と同様に、本稿は、J期先予測回帰の小サンプルバイアスを導出し、その推計値の調整式を提示する。数々の驚くべき結果が得られたが、その中には以下のようなものがある。(i)オブザベーション数が多くなるにもかかわらず重複回帰の方が非重複回帰よりもバイアスが大きい。(ii)この研究分野で一般に提唱される代替的な長期予測回帰について特にバイアスが大きくなる。Jが大きくなると、バイアスは(J/T)について線形に増加し、その傾きは予測変数の持続性に依存する。バイアスを調整すると、既存研究の長期推計値の予測性の高さは著しく減退する。


以下はungated版の導入部の概要。

資産価格モデルの実証研究では通常以下の式が用いられる。
 Rt:t+1 = α1 + β1Xt + ut+1
 Xt+1 = ω + ρXt + vt+1                      (1)
ここでRt:t+1は資産のリターン、Xtはラグ付きの何らかの予測変数で、T期のデータを使うものとする。Xtはバリュエーションレシオやイールドといった対象資産の価格ベースの指標であることが多く、それ自体が持続的で平均回帰的な性格を持つ。
影響力の大きなスタンボー(1999*1)の研究が示したのは、(株式リターン予測の研究で通常見られるように)σuv≠0ならば、OLS推計値にはバイアスがある、ということである。実際、(1)式のモデルについて彼は以下のバイアスの式を導出している。
 E[β^1 - β1] = (σuvv2)E[ρ^ - ρ] ≒ - (σuvv2){(1+3ρ)/T}
今や回帰係数の推計値をこのバイアスについて調整することが標準の手続きとなっている。そうした調整を行うと、予測回帰の結果は極めて芳しくなくなり、決定係数は低く、t値は非有意になる。

研究者たちは、検証結果を改善するため、低頻度の期待リターンが平均回帰的であるという理論(行動ファイナンスのものでもリスクベースの研究のものでも)に動機付けられ、長期の予測に目を向けた。通常の長期回帰では、T期のデータを使って、資産のJ期先までのリターンRt:t+Jをラグ付きの何らかの予測変数Xtに回帰する。
 Rt:t+J = αJ + βJXt + εt:t+J                      (2)
研究者が、J期毎のサンプルという重複の無いサンプル長T/Jのデータ(nolと表記される)を用いて(2)式を推計すれば、標準的な通常の最小二乗法(OLS)が適用される。しかし、Jが大きいとサンプルサイズが小さくなるのが一般的であるため、研究者は重複する全データ(olと表記される)を用いて(2)式を推計する。データが多いと推計値の漸近的効率性は向上するが、自己相関のある誤差によってOLSの標準誤差の特定の誤りも生じる。そのため、研究者は、これまで開発された様々な分散不均一性・自己相関(heteroscedasticity and autocorrelation=HAC)調整済み推計値のどれかを使って標準誤差を調整する。中でもNewey and West(1987)がファイナンス研究では良く使われる。

これまで(2)式についてファーマ=フレンチ(1988、1989)やコクラン(2011*2)が実証研究を行ってきた。コクランは、標準誤差の問題はあるにせよ、配当利回りを予測変数とした回帰係数は経済的に大きく、Jと共に上昇する、と報告しており、それがこの分野での主流派見解となっている。

長期予測回帰の回帰係数の推計値が小サンプルでバイアスを生じることは知られていたものの、これまでの研究はその点の指摘をシミュレーションによる実証に頼っており、スタンボー(1999)のような解析的な結果は導出されていなかった。おそらくはそうした理論的結果の不在により、長期の回帰をそのバイアスについて調整するということは殆ど行われてこなかった。コクランもその一例である。
本稿では、長期回帰について小サンプルバイアスを解析的に導出した。スタンボーの式と同じく、長期の重複回帰の係数推計値のバイアスは、リターンと予測変数のイノベーション間の相関(σuv)、予測変数の自己相関ρ、およびサンプルサイズTの関数となるが、さらにJも入ってくる。実際の式は以下の通り。
 E[β^Jol - βJ] = (1/T)[ J(1+ρ) + 2ρ{(1-ρJ)/(1-ρ)} ](σuvv2)
この式を用いてコクランの結果を調整すると、下図の通り、係数は経済的に有意ではなくなる(赤線が調整前、黒線が調整後)。
f:id:himaginary:20200705051852p:plain
上式はバイアスが非線形的にではあるがJとρと共に単調に増加することを示している。大きなJについては、バイアスは(J/T)と共に傾き(1+ρ)(σuvv2)で線形に増加し、重要なことに、決して漸近的に収束することはない。

小サンプルのHAC標準誤差の推計に付き纏う問題のため、研究者たちは、(2)式の重複回帰の代替策として、非重複回帰や、1期のリターンの予測変数のラグ和Σj=1...JXt-jへの回帰(Jegadeesh (1991)/Hodrick (1992))や、(1)の構造が含意する長期の係数を用いることがある。本稿では、それらの長期回帰の派生形についても小サンプルバイアスを導出した。幾つかの興味深い結果が得られたが、中でも驚くべきは、すべてのρとJについて、小サンプルバイアスの方が重複/非重複回帰の話よりも深刻であった、ということである。また、人気のあるJegadeesh (1991)/Hodrick (1992)の代替策にも深刻なバイアスがあった。

*1:cf. ここ

*2:ここでリンクした(ここでも触れた)米ファイナンス学界会長講演。