時系列における回帰不連続とイベントスタディ

と題したエントリ(原題は「Regression Discontinuity and Event Studies in Time Series」)でFrancis Dieboldが、Catherine Hausman(ミシガン大)とDavid S. Rapson(UCデービス)の「Regression Discontinuity in Time: Considerations for Empirical Applications」というNBER論文ungated版)を紹介している*1
以下は論文の要旨。

Recent empirical work in several economic fields, particularly environmental and energy economics, has adapted the regression discontinuity framework to applications where time is the running variable and treatment occurs at the moment of the discontinuity. In this guide for practitioners, we discuss several features of this "Regression Discontinuity in Time" framework that differ from the more standard cross-sectional RD. First, many applications (particularly in environmental economics) lack cross-sectional variation and are estimated using observations far from the cut-off. This is in stark contrast to a cross-sectional RD, which is conceptualized for an estimation bandwidth going to zero even as the sample size increases. Second, estimates may be biased if the time-series properties of the data are ignored, for instance in the presence of an autoregressive process. Finally, tests for sorting or bunching near the discontinuity are often irrelevant, making the methodology closer to an event study than a regression discontinuity design. Based on these features and motivated by hypothetical examples using air quality data, we offer suggestions for the empirical researcher wishing to use the RD in time design.
(拙訳)
環境とエネルギーの経済学をはじめとする幾つかの経済学分野における近年の実証研究では、時間を割り当て変数とし、不連続時点で処置が発生する回帰不連続の枠組みを適用して応用研究を行っている。同手法の実践者に向けた本ガイドでは、標準的なクロスセクションの回帰不連続とは異なる、この「時系列における回帰不連続」の幾つかの特徴を論じる。第一に、多くの応用(特に環境経済学)においてはクロスセクションほどの変動が存在せず、閾値から遠く離れた観測値を用いて推計がなされている。これは、サンプルサイズが増える場合でも推計帯域がゼロに近付くとして概念化されているクロスセクションの回帰不連続とは非常に対照的である。第二に、例えば自己回帰過程が存在する場合、データの時系列特性を無視すると、推計値にバイアスが生じる恐れがある。最後に、不連続の近くの順序変更や集中についての検定は上手くいかないことが多く、その結果、この手法は回帰不連続デザインというよりはイベントスタディに近くなる。我々は、以上の特徴と、大気の質のデータを用いた仮想例を基に、時系列のデザインで回帰不連続を使いたい実証研究者向けの提案を行う。


この要旨で言及されているイベントスタディと推計帯域について、Dieboldは以下のように書いている(その際、論文のタイトルの一部である「Regression Discontinuity in Time」を[論文に倣って]RDiTと略している)。

It's interesting in part because it documents and contributes to the largely cross-section regression discontinuity design literature's awakening to time series. But the elephant in the room is the large time-series "event study" (ES) literature, mentioned but not emphasized by Hausman and Rapson. [In a one-sentence nutshell, here's how an ES works: model the pre-event period, use the fitted pre-event model to predict the post-event period, and ascribe any systematic forecast error to the causal impact of the event.] ES's trace to the classic Fama et al. (1969). Among many others, MacKinlay's 1997 overview is still fresh, and Gürkaynak and Wright (2013) provide additional perspective.
One question is what the RDiT approach adds to the ES approach, and related, what it adds to well-developed time-series toolkit of other methods for assessing structural change. At present, and notwithstanding the Hausman-Rapson paper, my view is "little or nothing". Indeed in most respects it would seem that a RDiT study *is* an ES, and conversely. So call it what you will, "ES" or "RDiT".
But there are important open issues in ES / RDiT, and Hausman-Rapson correctly emphasize one of them, namely issues and difficulties associated with "wide" pre- and post-event windows, which is often the relevant case in time series.
Things are generally "easy" in cross sections, where we can usually take narrow windows (e.g., in the classic scholarship exam example, we use only the test scores very close to the scholarship threshold). Things are also "easy" in time series *IF* we can take similarly narrow windows (e.g., high-frequency financial asset return data facilitate taking narrow pre- and post-event windows in financial applications). In such cases it's comparatively easy to credibly ascribe a post-event break to the causal impact of the event.
But in other time-series areas like macro and environmental, we might want (or need) to use wide pre- and post-event windows. Then the trick becomes modeling the pre- and post-event periods successfully enough so that we can credibly argue that no structural change is operative apart from that due to the event -- very challenging, but not hopeless.
Hats off to Hausman and Rapson for beginning to bridge the ES and regression discontinuity literatures, and for implicitly helping to push the ES literature forward.
(拙訳)
この論文が興味深いのは、一つには、専らクロスセクションを対象としていた回帰不連続デザインの研究分野が時系列に目を向け始めたことを記録し、かつ、それに貢献したことにある。しかしそこで無視できないのが、時系列のイベントスタディ(ES)という一大研究分野である。ハウスマン=ラプソンはそれに言及しているが、強調はしていない。[一言でイベントスタディを要約すると、次のようになる:イベント前の期間をモデル化し、当てはめたイベント前モデルを使ってイベント後の期間を予測して、体系的な予測誤差をすべてイベントの影響に因るものだとする] イベントスタディは、古典的なファーマらの研究(1969)に遡る。そのほか、マッキンレーの1997年の概観も依然として新鮮であり、ギュルカイナク=ライト(2013)は追加的な見通しを提供する。
一つの疑問は、RDiT手法がES手法に加える付加価値は何か、ということだ。それと関連した話として、構造変化を評価する時系列の分析ツールはそれ以外にもかなり開発されているが、それらに加える付加価値は何か、という疑問もある。現時点では、ハウスマン=ラプソン論文を見た上でも、「ほとんど、もしくは全く無い」というのが私の見解だ。実際のところ、多くの点でRDiTの研究はイベントスタディそのものであるように思われ、その逆も真のように思われる。従って、イベントスタディと呼ぼうがRDiTと呼ぼうが変わりはない。
しかしES/RDiTには重要な未解決の問題があり、ハウスマン=ラプソンは正しくもその一つを強調している。それは、イベントの前後のウインドウが「広い」ことに起因する問題と課題であり、時系列を扱う場合にしばしば重要なものとなる件である。
ウインドウが狭いのが普通であるクロスセクションでは、事態は一般に「簡単な」ものとなる(奨学金試験という代表的な例では、閾値のすぐ近くの試験の点数しか使わない)。時系列においても、仮に同じような狭いウインドウを用いることができれば、事態はやはり「簡単な」ものとなる(例えば、金融資産の高頻度のリターンデータは、金融の研究においてイベントの前後の狭いウインドウを取ることを可能にする)。その場合には、イベント後の不連続が、確かにイベントの影響に因るものだと言うことが比較的容易である。
しかしマクロや環境のような他の時系列の領域では、イベント前後のウインドウを幅広く取りたい(もしくは取らざるを得ない)ことがある。その場合には、イベント以外の構造的変化が関与していないと確かに言えるほど、イベント前後の期間を上手くモデル化することがカギとなる。そうした作業は、非常に難しくはあるが、まったく見込みがないわけではない。
イベントスタディと回帰不連続の研究分野の橋渡しを開始したこと、および、イベントスタディの研究を陰ながら前に進めるのに貢献したことについて、ハウスマン=ラプソンに敬意を表したい。


不連続の近くの順序変更や集中についての検定の難しさについては、ungated版の本文で以下のように記述されている。

Finally, if the intervention may alter behavior in the neighborhood of the discontinuity, we would like to be able to test for this and, if necessary, control for it. In a cross-sectional RD, a density test such as the McCrary (2008) test is a key check for strategic behavior or selection. It is generally used to rule out these confounding factors, thus making it unnecessary to control for them. When time is the running variable, however, it is generally not possible to test for strategic behavior or selection around the threshold. While the researcher can check for discontinuities in other covariates at the threshold, and for discontinuities in the outcome variable at other thresholds, the researcher cannot check for discontinuities in the conditional density of the forcing variable. That the density of the forcing variable (time) is uniform renders such tests logically irrelevant.
(拙訳)
最後に、もし介入によって不連続の近くの行動が変わるならば、我々は、それを検定できれば良いと考えるし、必要ならばコントロールしたいとも考える。クロスセクションの回帰不連続では、マクラリー(2008)*2検定のような密度検定が、戦略的行動や選択を確認する主な方法である。一般にその方法は、それら交絡要因を取り除くのに使われ、それによってコントロールは不要になる。しかし、時間が割り当て変数の場合には、閾値周辺の戦略的行動や選択を検定するのは一般に不可能である。他の共変数の閾値での不連続を確認することや、別の閾値における結果変数の不連続を確認することは可能であるが、割り当て変数の条件付き密度の不連続を確認することは不可能である。割り当て変数(時間)の密度が一様であることが、そうした検定を論理的に不可能なものとしている。

この後、論文では、大気の質のデータを用いた仮想例における順序変更の例として、発電所が排出制御装置を規制発動より早めに取り付けることを挙げている。これは、奨学金試験という標準的な回帰不連続の例において、処置対象外の生徒が行動を変えることによって上手く処置を受けることに相当するが、生徒の場合はマクラリーの方法で検定できるものの、地域の平均データを扱うこの論文の大気の質の例については検定はできないとの由。

*1:cf. 予告エントリ。なお、回帰不連続デザインについては、日本語のWikipediaが意外に(?)詳しい=回帰不連続デザイン - Wikipedia

*2:WP