定常過程のランダムウォーク予測のバイアスは低い

というNBER論文が上がっている2年前のWP)。原題は「Random Walk Forecasts of Stationary Processes Have Low Bias」で、著者はKenneth D. West(ウィスコンシン大)、Kurt G. Lunsford(クリーブランド連銀)*1
以下はその要旨。

We study the use of a misspecified overdifferenced model to forecast the level of a stationary scalar time series. Let x(t) be the series, and let bias be the sample average of a series of forecast errors. Then, the bias of forecasts of x(t) generated by a misspecified overdifferenced ARMA model for Δx(t) will tend to be smaller in magnitude than the bias of forecasts of x(t) generated by a correctly specified model for x(t). Formally, let P be the number of forecasts. The bias from the model for Δx(t) has a variance that is O(1/P^2), while the variance of the bias from the model for x(t) generally is O(1/P). With a driftless random walk as our baseline overdifferenced model, we confirm this theoretical result with simulations and empirical work: random walk bias is generally one-tenth to one-half that of an appropriately specified model fit to levels.
(拙訳)
我々は、定常的なスカラーの時系列の水準を予測する際に、仕様を誤って過度に差分化されたモデルを用いることについて調べた。x(t)を系列とし、バイアスを予測誤差系列のサンプル平均とする。すると、仕様を誤って過度に差分化されたΔx(t)についてのARMAモデルで生成されたx(t)の予測のバイアスは、正しい仕様のx(t)についてのモデルで生成されたx(t)の予測のバイアスよりも、大きさが小さい傾向にある。正式には、Pを予測の数として、Δx(t)についてのモデルによるバイアスは分散がO(1/P^2)である一方で、x(t)についてのモデルによるバイアスは分散が一般にO(1/P)である。ドリフト項の無いランダムウォークをベースラインの過度に差分化されたモデルとして我々は、この理論的な結果をシミュレーションと実証研究で確認した。ランダムウォークのバイアスは一般に、適切な仕様で水準に当てはめたモデルのバイアスの10分の1から2分の1である。

WPの本文では単純な例として以下を示している。
定常的な単変量の時系列xtについて1期先の予測をするものとしよう。データはt=P+1まであるものとする。予測はx2、次いでx3、...、最後にxP+1の順で行われ、全部でP個の予測がなされる。ドリフト項の無いランダムウォークモデルでは、x2の予測はx1、x3の予測はx2、...、xP+1の予測はxPである。従って、予測誤差の時系列はx2-x1、x3-x2、...、xP+1-xPである。予測誤差の平均値(即ちバイアス)は
 b = {(x2-x1)+(x3-x2)+...+(xP+1-xP)}/P = (xP+1-x1)/P
となる。bの期待値E(b)はゼロで、分散は
 var(b)={2var(xt) - 2cov(xt, xt+P)}/P2 < c/P2
 ただしc = 4var(xt):
となる。即ち、バイアスbの期待値はゼロで、分散はO(1/P2)である。

なお、要旨の「x(t)についてのモデルによるバイアスは分散が一般にO(1/P)」というのは、標準誤差^2=標準偏差^2/Pという一般的な関係において、標準偏差の2乗が定常過程では定数ないし定数に近いことから導出されることと思われる。それに対し、上記の例ではその関係における標準偏差の2乗が期せずして1/Pのオーダーになることを示している(=本来はvar(b)がPvar(x)/P2のオーダーになるべきところが予測誤差の時系列の打ち消し合いによってvar(x)/P2のオーダーになっている)。

論文はこの後、上記の結果を1期先予測からh期先(hは固定、もしくはPと共に適切な伸び率で増加)に一般化した上で、シミュレーションや実証分析を行っている。