機械学習と計量経済学が協力すべき最重要分野

昨日紹介したFrancis Dieboldの3連エントリの2番目にHal Varianがコメントし、Dieboldが指摘した問題――機械学習は因果関係の無い予測に重点を置くが、計量経済学は因果関係のある予測に重点を置く――について自分が以前書いた論文を2篇紹介している。一つ機械学習に詳しい人向けで、もう一つは経済学者向けとの由。
以下は前者の論文「Causal inference in economics and marketing」の要旨。

This is an elementary introduction to causal inference in economics written for readers familiar with machine learning methods. The critical step in any causal analysis is estimating the counterfactual—a prediction of what would have happened in the absence of the treatment. The powerful techniques used in machine learning may be useful for developing better estimates of the counterfactual, potentially improving causal inference.
(拙訳)
これは、機械学習の手法に馴染みのある読者向けに書かれた、経済学における因果関係の推定についての初歩的な手引きである。どんな因果関係の分析においても重要なのは、反実仮想――処置が無かった場合に何が起きていたかの予測――の推定である。機械学習で用いられている強力な技法は、より優れた反実仮想の推定を開発するに当たって有用と考えられ、因果関係の推定を改善する可能性がある。


以下は後者の論文「Big Data: New Tricks for Econometrics」の一節。

There are a number of areas where there would be opportunities for fruitful collaboration between econometrics and machine learning. I mentioned above that most machine learning uses independent and identically distributed data. However, the Bayesian Structural Time Series model shows that some of these techniques can be adopted for time series models. It is also possible to use machine learning techniques to look at panel data, and there has been some work in this direction.
However, the most important area for collaboration involves causal inference. Econometricians have developed several tools for causal inference such as instrumental variables, regression discontinuity, difference-in-differences, and various forms of natural and designed experiments (Angrist and Krueger 2001). Machine learning work has, for the most part, dealt with pure prediction. In a way, this is ironic, since theoretical computer scientists, such as Pearl (2009a, b) have made significant contributions to causal modeling. However, it appears that these theoretical advances have not as yet been incorporated into machine learning practice to a significant degree.
(拙訳)
計量経済学機械学習が実りある協力を行う機会のある分野は多数ある。前述したように、大半の機械学習は、互いに独立で同一の分布に従うデータを用いる。しかし、ベイジアン構造時系列モデルは、そうした技法の中に時系列モデルに適用できるものもあることを示している。機械学習の技法はパネルデータの分析にも使うことができ、そうした研究も幾つかなされている。
しかし、両者が協力すべき最も重要な分野は因果関係の推定に関するものである。計量経済学者は、操作変数、回帰不連続デザイン、差の差分析、および、様々な形の自然実験や計画された実験のように、因果関係の推定のためのツールを幾つか開発してきた(Angrist and Krueger 2001)。機械学習は、大体において、純粋な予測を扱ってきた。ある意味で、これは皮肉なことである。というのは、Pearl(2009a *1, b)のような理論コンピュータ科学者は因果関係のモデル化に顕著な貢献をしてきたからである。にも関わらず、そうした理論的進展は未だに機械学習の実務にそれほどは浸透していないように思われる。

*1:第一版の邦訳:

統計的因果推論 -モデル・推論・推測-

統計的因果推論 -モデル・推論・推測-