熱帯におけるランダム化再訪:主旋律と11の変奏曲

というNBER論文をアンガス・ディートンが上げている。原題は「Randomization in the Tropics Revisited: a Theme and Eleven Variations」で、Revisitedとなっているのは、元論文としてこちらのおよそ10年前の自著論文「Instruments of development: Randomization in the tropics, and the search for the elusive keys to economic development」を意識しているものと思われる。
以下はその要旨。

Randomized controlled trials have been used in economics for 50 years, and intensively in economic development for more than 20. There has been a great deal of useful work, but RCTs have no unique advantages or disadvantages over other empirical methods in economics. They do not simplify inference, nor can an RCT establish causality. Many of the difficulties were recognized and explored in economics 30 years ago, but are sometimes forgotten. I review some of the most relevant issues here. The most troubling questions concern ethics, especially when very poor people are experimented on. Finding out what works, even if such a thing is possible, is in itself a deeply inadequate basis for policy
(拙訳)
ランダム化比較試験は経済学で50年に亘って使われており、開発経済学では20年以上に亘って精力的に使われている。有用な研究も数多くあるが、経済学の他の実証手法と比べてRCTに独自の長所ないし短所があるわけではない。推定を簡単にするわけではなく、RCTによって因果関係が確立されるわけでもない。問題点の多くが30年前に経済学で認識・追究されているが、時として忘れられている。最も厄介な問題は倫理絡みのものであり、特に極めて貧しい人々が実験対象になった場合はそうである。仮に何が機能するかを見い出すことが可能だとしても、そのこと自身は政策の根拠としてかなり不適切である。


要旨だけを読むとここで紹介した論文に近い感じを受けるが、本文の導入部では以下のような断りを入れている。

In this essay, I do not attempt to reconstruct the full range of questions that I have written about elsewhere, nor to summarize the long running debate in economics. Instead, I focus on a few of the issues that are prominent in this volume of critical perspectives and that seem to me to bear revisiting.
(拙訳)
本エッセイでは、私が別のところ*1で書いた疑問点すべてを再編成しようとはしていないし、経済学で長期に亘って続いている議論を要約しようともしていない。ここでは、前述の蓄積された批判的観点において、目立っており、再訪に値すると私には思われる幾つかの問題点に焦点を当てたい。


タイトル中の「Theme」については以下のように書いている。

My theme is that RCTs have no special status, they have no exemption from the problems of inference that econometricians have always wrestled with, and there is nothing that they, and only they, can accomplish.
(拙訳)
私の主題は、RCTには特別な地位があるわけではなく、計量経済学者たちが常に取り組んできた推定の問題を免れているわけでもなく、RCTだけが達成できることがあるわけでもない、ということである。


論文(ないしエッセイ)の残りはほぼ「Eleven Variations」に費やされているが、その11の副テーマとして以下が挙げられている(副項は各文の冒頭)。

  1. RCTは有用な知識を学習ないし蓄積する最善の方法か?
    • 時にそうであり、時にそうでない。
  2. RCTでは統計的推論が他の手法より簡単である
    • この誤解は多くの害の原因となった。
  3. RCTは厳密で科学的である
    • このレトリックはレトリック以上のものではない。
  4. 外的妥当性
    • 「何が機能するかを見い出す」というのはもう一つの良く聞くレトリック上のスローガンであり、それが繰り返されることから判断する限り、一般に対して効果的なスローガンのようである。
  5. 比較試験の事前登録
    • 学術誌で結果を公表予定の比較試験の事前登録を米経済学会(AEA)が要求したこと*2に私は反対したが、不成功に終わった。研究を研究そのものの利点に基づいて編集者やレフェリーに評価させるのではなく、AEAが手法について規則を制定するのは悪しき考えだと私は思う。経済学者ならびにAEAの委員を務めた経験から言えば、経済学者間の意見の違いは、実際のところ、政治的なものにせよ個人的なものにせよ、手法上の違いとして提示されることが多かった。
  6. 実験:やってみて結果を見よう
    • 実験には大賛成だが、実験とランダム化の間には論理的な繋がりは無い。
  7. RCTと他の手法
    • RCTに関する多くの議論では、操作変数法(IV)、回帰不連続(RD)、差の差手法を代表とする他の手法と比較が行われる。しかしそれは比較対象として狭すぎる。
  8. 小vs大
    • ラント・プリチェット(Lant Pritchett)*3は、貧困の削減に重要なのは成長であって、金額もしくは鶏で測ったプロジェクトごとの「厳密な」(もしくはそれほど厳密ではない)評価ではない、という彼ならではの雄弁で面白く情熱的な議論を提示している。「貧乏人の経済学*4」でアビジット・バナジー(Abhijit Banerjee)とエスター・デュフロ(Esther Duflo)は正反対の議論を展開し、「小さなこと」のレベルでしか我々は自分たちのやっていることが分からないのだから、ランダム化試験で知識の試行を積み重ねるべきなのだ、と論じた。
  9. モデル
    • モデル構築を要せずに政策推奨ができることには、大いなる魅力がある。データをして語らしめる、もしくは、自らについて語ることのできるデータを生成する、ということの魅力は私も理解できるが、そうした試みは失敗に終わる運命にある、と私は思う。RCTの解釈には常に前提が要求される。
  10. 因果関係
    • 上手に設計されたRCTは因果関係について何かしらを教えてくれる。しかしここでも、データから結論を導き出すためには、多くの前提を立てることが必要となる。
  11. 倫理
    • 経済学者は実験の倫理について考えるべきであり、単に治験審査委員会に下駄を預けるべきではない、というのは重要なことである。

*1:原文の脚注では、これ(本エントリ冒頭で挙げた約10年前のNBER論文の掲載版)、これここで紹介したNBER論文の掲載版)、これ、の3本の論文が挙げられている。

*2:cf. これ

*3:近刊の以下の本に掲載予定の章からの引用とのこと。ただ、ディートンは引用元を同書3章の「Getting random right: a guide for the perplexed practitioner」としているが、オックスフォード大出版の目次ではプリチェットが書いているのは2章の「Randomizing Development: Method or Madness?」となっている。

Randomized Control Trials in the Field of Development: A Critical Perspective

Randomized Control Trials in the Field of Development: A Critical Perspective

  • 発売日: 2020/11/07
  • メディア: ハードカバー

*4: