機械学習の時代の理論と測定

Francis Dieboldがボストンカレッジ経済学部教授のArthur Lewbelの以下の言葉を引用している

The people who argue that machine learning, natural experiments, and randomized controlled trials are replacing structural economic modeling and theory are wronger than wrong.
As ML and experiments uncover ever more previously unknown correlations and connections, the desire to understand these newfound relationships will rise, thereby increasing, not decreasing, the demand for structural economic theory and models.
(拙訳)
機械学習、自然実験、ランダム化比較試験が構造経済モデルや理論に取って代わっている、と論ずる人は、この上なく間違っている。
機械学習や実験がこれまで知られていなかった相関や繋がりをますます明らかにするにつれ、これら新たに発見された関係を理解したいという欲求は高まるので、構造経済理論とモデルへの需要は増えこそすれ減ることはない。


Dieboldはこの主張に賛意を表し、理論と測定の補完関係を強調した以前の自ブログエントリの記述を引用している。

Measurement and theory are rarely advanced at the same time, by the same team, in the same work. And they don't need to be. Instead we exploit the division of labor, as we should. Measurement can advance significantly with little theory, and theory can advance significantly with little measurement. Still each disciplines the other in the long run, and science advances.
(拙訳)
測定と理論が同じチームの同じ仕事によって同時に進歩することは稀である。そしてそうなる必要もない。その点について我々は分業を活用するが、それが本来のやり方である。測定はほとんど理論抜きで大いに進歩することができるし、理論はほとんど測定抜きで大いに進歩することができる。それでも長期的にはお互いを制御しており、そして科学は進歩する。


その上で、以下のように書いている。

The theory/measurement pendulum tends to swing widely. If the 1970's and 1980's were a golden age of theory, recent decades have witnessed explosive advances in measurement linked to the explosion of Big Data. But Big Data presents both measurement opportunities and pitfalls -- dense fogs of "digital exhaust" -- which fresh theory will help us penetrate. Theory will be back.
(拙訳)
理論と測定の振り子は大きく振れる傾向がある。1970年代と1980年代が理論の黄金時代だったとすれば、ここ数十年においてはビッグデータの急増と結び付いた測定の爆発的進歩が見られた。しかしビッグデータは、測定にとって好機と共に「デジタル排気ガス*1の濃霧という陥穽も提起しており、その霧を突破するのに新たな理論が役立つだろう。理論は戻ってくるであろう。

*1:ググってトップに出てくるこちらのサイトの説明(「data exhaust」の説明になっているが、こちらのサイトによれば同義語との由)によれば、「Data exhaust is the data generated as a byproduct of people’s online actions and choices. ...Data exhaust is named for the way it streams out behind the web user similarly to the way car exhaust streams out behind the motorist.」。