TSLSが実際にLATEとなるのはどのような場合か?

というNBER論文が上がっているungated版)。原題は「When is TSLS Actually LATE?」で、著者はChristine Blandhol(プリンストン大)、John Bonney(スタンフォード大)、Magne Mogstad(シカゴ大)、Alexander Torgovitsky(同)。
以下はその要旨。

Linear instrumental variable estimators, such as two-stage least squares (TSLS), are commonly interpreted as estimating positively weighted averages of causal effects, referred to as local average treatment effects (LATEs). We examine whether the LATE interpretation actually applies to the types of TSLS specifications that are used in practice. We show that if the specification includes covariates, which most empirical work does, then the LATE interpretation does not apply in general. Instead, the TSLS estimator will in general reflect treatment effects for both compliers and always/never-takers, and some of the treatment effects for the always/never-takers will necessarily be negatively weighted. We show that the only specifications that have a LATE interpretation are "saturated" specifications that control for covariates nonparametrically, implying that such specifications are both sufficient and necessary for TSLS to have a LATE interpretation, at least without additional parametric assumptions. This result is concerning because, as we document, empirical researchers almost never control for covariates nonparametrically, and rarely discuss or justify parametric specifications of covariates. We develop a decomposition that quantifies the extent to which the usual LATE interpretation fails. We apply the decomposition to four empirical analyses and find strong evidence that the LATE interpretation of TSLS is far from accurate for the types of specifications actually used in practice.
(拙訳)
二段階最小二乗法(TSLS)のような線形操作変数推定は、局所的平均処置効果(LATEs)と呼ばれる、因果効果のプラスのウエイトによる加重平均として解釈されるのが一般的である。我々は、実際に使われているタイプのTSLSの設定にLATE解釈が本当に当てはまるかどうかを調べた。大半の実証研究で行われているように設定に共変量が含まれている場合は、LATEは一般に当てはまらないことを我々は示す。その場合、TSLS推定量は一般に、操作変数に応じて処置を受ける群、および、操作変数にかかわらず常に処置を受ける/決して処置を受けない群*1の双方の処置効果を反映し、常に処置を受ける/決して処置を受けない群の処置効果の一部は必然的にウエイトがマイナスとなる。我々は、LATEとして解釈される設定は、共変量をノンパラメトリックにコントロールする「飽和」設定だけであることを示す。そのことが意味するのは、少なくとも追加的なパラメータの仮定が無い限り、TSLSがLATE解釈されるのはそうした設定が必要十分条件である、ということである。我々が資料で示すように、実証研究者が共変量をノンパラメトリックにコントロールすることはほぼ無く、共変量のパラメータの設定を議論ないし正当化することも滅多に無いため、この結果は懸念すべきことである。我々は、通常のLATE解釈がどの程度成立しないかを定量化する分解法を開発した。我々はその分解法を4つの実証分析に適用し、TSLSのLATE解釈は、現場で実際に使われているタイプの設定においては正確とは程遠いことを示す。

*1:この辺りの用語の訳はぐぐって見つけた各資料を参考にした。