というNBER論文が上がっている(ungated(SSRN)版)。原題は「Missing Data in Asset Pricing Panels」で、著者はJoachim Freyberger(ボン大)、Björn Höppner(同)、Andreas Neuhierl(ワシントン大学セントルイス)、Michael Weber(シカゴ大)。
以下はその要旨。
Missing data for return predictors is a common problem in cross sectional asset pricing. Most papers do not explicitly discuss how they deal with missing data but conventional treatments focus on the subset of firms with no missing data for any predictor or impute the unconditional mean. Both methods have undesirable properties - they are either inefficient or lead to biased estimators and incorrect inference. We propose a simple and computationally attractive alternative using conditional mean imputations and weighted least squares, cast in a generalized method of moments (GMM) framework. This method allows us to use all observations with observed returns, it results in valid inference, and it can be applied in non-linear and high-dimensional settings. In Monte Carlo simulations, we find that it performs almost as well as the efficient but computationally costly GMM estimator in many cases. We apply our procedure to a large panel of return predictors and find that it leads to improved out-of-sample predictability.
(拙訳)
リターン予測変数における欠落データは、クロスセクションの資産価格付けにおいて一般的な問題である。大半の論文は欠落データにどう対処したかについて明示的に記述していないが、通常の対処法では、どの予測変数にも欠落データのない企業の副集合を分析の中心に据えるか、もしくは無条件平均を補完する。どちらの手法にも望ましくない特性があり、有効性に欠けるか、もしくは偏りのある推計値と不正確な推定につながる。我々は、条件付き平均の補完と加重最小二乗法を用い、一般化モーメント法(GMM)の枠組みに投入した、簡単かつ計算面で魅力ある別手法を提示する。この手法は、リターンが観測された観測値すべてを使うことを可能にし、有効な推定をもたらし、非線形や高次元の枠組みにも適用できる。モンテカルロシミュレーションで我々は、有効性があるが計算面のコストが大きいGMM推計とほぼ同等のパフォーマンスを多くのケースで同手法が示すことを見い出した。我々はこの計算法をリターン予測変数の大きなパネルに適用し、アウトオブサンプル予測の改善につながることを見い出した。