計量経済学は因果関係の推定のみに非ず

Francis Dieboldが、Joshua D. AngristとJörn-Steffen PischkeのNBER論文噛み付いている(H/T Economist's View)。
以下は同論文のungated版の一節。

How should changes in our use of econometrics change the way we teach econometrics?
Our take on this is simple. We start with empirical strategies based on randomized trials and quasi‐experimental methods because they provide a template that reveals the challenges of causal inference, and the manner in which econometric tools meet these challenges. We call this framework the design‐based approach to econometrics because the skills and strategies required to use it successfully are related to research design. This viewpoint leads to our first concrete prescription for instructional change: a revision in the manner in which we teach regression.
Regression should be taught the way it’s now most often used: as a tool to control for confounding factors. This approach abandons the traditional regression framework in which all regressors are treated equally. The pedagogical emphasis on statistical efficiency and functional form, along with the sophomoric narrative that sets students off in pursuit of “true models” as defined by a seemingly precise statistical fit, is ready for retirement. Instead, the focus should be on the set of control variables needed to insure that the regression‐estimated effect of the variable of interest has a causal interpretation.
(拙訳)
我々の計量経済学の使用法が変わったことによって、計量経済学の教え方はどのように変わるべきだろうか?
この件に関する我々の見解は単純である。我々の起点となるのは、ランダム化試験と疑似実験法に基づく実証手法である。というのは、その手法によって、因果関係の推定の問題、ならびに、計量経済学のツールがそれらの問題に取り組む方法を明らかにする雛型が提供されるからである。このやり方を上手く使いこなすのに必要な技術と手法は研究のデザインと関連しているため、我々はこの枠組みを、計量経済学へのデザインベースのアプローチと呼ぶ。この観点は、教え方の変更についての第一の明確な指示につながる。それは即ち、回帰を教えるやり方の見直しである。
回帰は、今や最も良く使われる方法で教えられるべきである。即ち、交絡因子をコントロールするツールとして教えられるべきである。このアプローチでは、すべての説明変数が平等に扱われる従来の回帰の枠組みは放棄される。統計的効率性や関数形に重点を置く教育法、および、外見的に正確な統計的当てはまりで定義される「真のモデル」を学生に追い求めさせるような中二病的お話は、お払い箱にするべきである。重点を置くべきは、回帰推定された対象変数の影響を因果関係として解釈することを保証するようなコントロール変数群である。


以下はDieboldのエントリからの引用。

Here's what AP get right:

(G1) One of the major goals in econometrics is predicting the effects of exogenous "treatments" or "interventions" or "policies". Phrased in the language of estimation, the question is "If I intervene and give someone a certain treatment ∂x,x∈X, what is my minimum-MSE estimate of ∂y?" So we are estimating the partial derivative ∂y/∂x.

AP argue the virtues and trumpet the successes of a "design-based" perspective for achieving G1. In my view they are largely correct as regards G1. ...the econometric simplicity of design-based methods is tremendously intoxicating. It's mostly just linear regression of y on x and a few cleverly-chosen control variables -- you don't need a full model -- with White-washed standard errors. ...
Here's what AP miss/dismiss:

(G2) The other major goal in econometrics is predicting y. In the language of estimation, the question is "if a new person i arrives with covariates Xi, what is my minimum-MSE estimate of her yi? So we are estimating a conditional mean E(y|X), which in general is very different from estimating a partial derivative ∂y/∂x.

The problem with the AP paradigm is that it doesn't work for goal G2.
(拙訳)
次の点についてはAP(Angrist=Pischke)は正しく捉えている:

(G1)計量経済学の主な目標の一つは、外生的な「処置」ないし「介入」ないし「政策」の影響を予測することにある。推計の用語で言えば、問題は「もし私が介入して誰かにある処置∂x、x∈Xを施したならば、∂yの最小平均二乗誤差推定は何か?」ということになる。従って我々は偏微分∂y/∂xを推計していることになる。

APはG1を達成する上での「デザインベース」の考え方の利点を論じ、その成功を高らかに謳っている。私の見解では、彼らはG1については概ね正しい。・・・デザインベース手法の計量経済的な単純さは非常に魅力的である。それは大体において、ホワイトウォッシュ*1された標準誤差を使った、xと巧妙に選択された数個のコントロール変数へのyの単なる線形回帰であって、完全なモデルは必要としない。・・・
次の点についてはAPは見逃している、ないし、棄却している:

(G2)計量経済学のもう一つの主な目標は、yを予測することにある。推計の用語で言えば、問題は「もし共変量Xiを持つ新たな人iがやってきたならば、彼女のyiの最小平均二乗誤差推定は何か?」ということになる。従って我々は条件付き平均E(y|X)を推計することになるが、それは一般に偏微分∂y/∂xの推計とはかなり異なる。

APパラダイムの問題点は、目標G2については機能しない、ということにある。

G2の推計については関数形などのモデル化が重要になるが、それはまさにAngrist=Pischkeが古臭いとして捨て去ったものである、とDieboldは指摘している。

*1:これはおそらく、whitewashという一般用語と、論文でその手法が参照されているHalbert Whiteを掛けている。