右裾を正しく把握:医療費分布の裾のモデル化

というNBER論文が上がっている。原題は「Getting the Right Tail Right: Modeling Tails of Health Expenditure Distributions」で、著者はMartin Karlsson(デュースブルク・エッセン大)、Yulong Wang(シラキュース大)、Nicolas R. Ziebarth(コーネル大)。
以下はその要旨。

Health expenditure data almost always include extreme values. Such heavy tails can be a threat to the commonly adopted least squares methods. To accommodate extreme values, we propose the use of an estimation method that recovers the often ignored right tail of health expenditure distributions. We apply the proposed method to a claims dataset from one of the biggest German private health insurers and find that the age gradient in health care spending differs substantially from the standard least squares method. Finally, we extend the popular two-part model and develop a novel three-part model.
(拙訳)
医療費データはほぼ必ず極端な値を含んでいる。そうした厚い裾は、通常採用される最小二乗法にとって脅威となり得る。極端な値を取り込むために我々は、しばしば無視される医療費分布の右裾を復元する推計手法の利用を提唱する。我々は、その提唱した手法をドイツ最大の民間生命保険会社の一つの請求データセットに適用し、医療費の年齢勾配が標準的な最小二乗法で得られるものとかなり違うことを見い出した。また我々は、良く使われる2部モデルを拡張して新たな3部モデルを開発した。