識別は因果関係ではなく、逆も同様

という論文をMarc F. BellemareがMetrics Mondayで紹介している。論文の原題は「Identification Is Not Causality, and Vice Versa」で、著者はミシガン大のR. Jay KahnとToni M. Whited。
以下はその要旨。

We distinguish between identification and establishing causality. Identification means forming a unique mapping from features of data to quantities that are of interest to economists. Establishing causality by finding sources of exogenous variation is often considered synonymous with identification, but these two concepts are distinct. Exogenous variation is only sometimes necessary and never sufficient to identify economically interesting parameters. Instead, even for causal questions identification must rest on an underlying economic model. We illustrate these points by analyzing identification in three recent papers and by examining the estimation of a simple dynamic model.
(拙訳)
我々は、識別と因果関係の立証とを区別する。識別は、データの特性から経済学者にとって興味のある量へのユニークな写像を生成することを意味する。外生的な変動の源を突き止めることにより因果関係を立証することは、識別と同義と見做されることが多いが、この2つの概念は違うものである。外生的な変動は、経済的に興味のあるパラメータを識別する上で必要条件となる場合もあるに過ぎず、十分条件となることは決してない。一方、識別は、因果関係の問題についても経済モデルに基いている必要がある。我々は、以上の点を、3本の最近の論文における識別を分析し、単純な動学モデルの推計を調べることにより説明する。

以下は論文の冒頭。

In terms of its pure statistical definition, identification is simple. An applied econometrician defines an objective function over parameters and a data population, and her goal is to select parameters that minimize this objective function, in which the population has been replaced by a specific sample. A parameter is identified if there is a unique minimum for the objective function at its true value in the population. Yet discussion of this pure statistical issue of identification is not of particular interest to applied economists because the parameter at the minimum of the objective function may or may not be of interest from an economic point of view. For example, if we say a regression of price on quantity does not identify demand, we are not arguing that the regression itself is not well-formed. Ordinary least squares produces an unbiased estimate of the slope coefficient on price. However, we are stating that this estimation has not identified an economic parameter, typically a utility parameter, that we find interesting. The true problem of identification is then using an econometric objective function to form a mapping from observed data to relevant economic parameters. Unfortunately, identifying an economically interesting parameter is far more difficult than the sheer statistical definition of identification might suggest.
The purpose of this paper is to delineate the relationship between estimating a causal effect and the more general issue of identification.
(拙訳)
純粋に統計的な定義としては、識別は単純である。応用計量経済学者はパラメータとデータ母集団について目的関数を定義するが、その目的は、母集団を特定のサンプルで置き換えたこの目的関数を最小化するパラメータを選択することにある。パラメータが識別されるのは、母集団の真の値で目的関数の唯一の最小点が存在する場合である。しかし、この純粋に統計的な識別問題に関する議論は、応用経済学者にとって取り立てて興味があるものではない。というのは、目的関数が最小となる時のパラメータは、経済学的な観点から興味のあるものとなることもあれば、そうでないこともあるからである。例えば、価格を数量に回帰しても需要が識別できない、と我々が言う時は、回帰そのものが正しく定式化されていない、と論じているわけではない。最小二乗法は価格の傾きの係数の不偏推定値を与える。我々がそこで述べているのは、その推計が、我々にとって興味がある経済パラメータ――通常は効用パラメータ――を識別していない、ということである。すると、識別の真の問題は、観測データから関連する経済パラメータへの写像を生成する計量経済学的な目的関数を用いること、となる。残念ながら、経済的に興味のあるパラメータを識別することは、識別の完全に統計的な定義が示唆するよりも遥かに困難である。
本稿の目的は、因果関係の推計と、より一般的な識別問題との線引きをすることにある。