機械学習を用いたヘドニック物価指数の構築

前回エントリで紹介したNBER論文と著者たちが一部重なる*1表題のNBER論文が上がっているungated版、H/T 一上さんツイート)。原題は「Using Machine Learning to Construct Hedonic Price Indices」で、著者はMichael Cafarella(MIT CSAIL=MITコンピュータ科学・人工知能研究所*2)、Gabriel Ehrlich(ミシガン大)、Tian Gao(Snowflake Inc.*3)、John C. Haltiwanger(メリーランド大)、Matthew D. Shapiro(ミシガン大)、Laura Zhao(カナダ銀行)。
以下はその要旨。

This paper uses machine learning (ML) to estimate hedonic price indices at scale from item-level transaction and product characteristics. The procedure uses state-of-the-art approaches from hedonic econometrics and implements them with a neural network ML approach. Applying the methodology to Nielsen Retail Scanner data leads to a large hedonic adjustment to the Tornqvist index for food product groups: Cumulative food inflation over the period from 2007 through 2015 is reduced by half from 5.9% to 2.8% -- owing to quality adjustment. These results suggest that quality improvement via product turnover is important even in product groups that are not normally considered to feature rapid technological progress. The approach in the paper thus demonstrates the feasibility and importance of implementing hedonic adjustment at scale.
(拙訳)
本稿は、機械学習を用いて、品目レベルのトランザクションと製品の特性から大規模にヘドニック物価指数を推計した。この推計ではヘドニックの計量経済学の最先端の手法を用い、ニューラルネットワーク機械学習手法でそれを実施した。ニールセン・リテール・スキャナーのデータ*4にその手法を適用したところ、食品グループのトルンクビスト指数*5について大きなヘドニック調整が生じた。即ち、品質調整により、2007年から2015年までの食料品の累積インフレは5.9%から2.8%に半減した。この結果は、急速な技術進歩を特徴とするとは通常見做されない商品グループにおいても、商品の入れ替わりによる品質調整は重要であることを示している。従って本稿の手法は、大規模にヘドニック調整を実施することの可能性と重要性を示している。

*1:実際、両論文でお互いをcompanion paperと表記している。

*2:cf. MITコンピュータ科学・人工知能研究所 - Wikipedia

*3:cf. Snowflake Inc. - Wikipedia

*4:cf. Nielsen Consumer Panel and Retail Scanner Data | Baker Library | Bloomberg Center | Harvard Business School。ちなみに前回エントリで紹介した論文では、そのほかにNPDがセンサス局に提供したデータを用いたとのこと。今回の論文の脚注2では「Ehrlich et al. (2023) focuses on a comparison of demand-based and hedonic models using general merchandise products from NDP(ママ). Unlike our data from Kilts, the NPD data contain rich sets of attributes, so it is possible to implement hedonic procedures using regression techniques.」と説明している。

*5:cf. Törnqvist index - Wikipedia