査読研究は株式リターン予測に役立つのか?

という論文をタイラー・コーエンが紹介している。原題は「Does Peer-Reviewed Research Help Predict Stock Returns?」で、著者はAndrew Y. Chen(FRB)、 Alejandro Lopez-Lira(フロリダ大)、Tom Zimmermann(ケルン大)。
以下はその本文冒頭。

Academic finance has documented more than 200 cross-sectional stock return predictors (Chen and Zimmermann 2022). The peer review process ensures these findings are supported by high quality evidence. It involves professors from prestigious universities and requires roughly five years to complete on average.
This paper compares the post-sample performance of peer-reviewed predictors with data-mined benchmarks. Our goal is to estimate
E[Post-Sample Performance | In-Sample t-stat > 2.0, Predictor Origin, Controls], (1)
and measure how Predictor Origin (e.g. peer-reviewed vs data-mined) affects this conditional expectation. Estimates of Equation (1) are important to investors. They are also important to academics who care about post-sample robustness.
(拙訳)
学界のファイナンス研究は200以上のクロスセクションの株式リターン予測変数を記録している*1(Chen and Zimmermann 2022*2)。査読プロセスはこれらの発見が質の高い証拠で裏付けられていることを保証している。そうしたプロセスは一流大学の教授が関与しており、完了までに平均しておよそ5年掛かる。
本稿は、査読を受けた予測変数と、データマイニングによるベンチマークのポストサンプルのパフォーマンスを比較する。我々の目的は
 E[ポストサンプルのパフォーマンス|インサンプルのt値 >2.0 , 予測変数のソース , コントロール変数]  (1) 
を推計し、予測変数のソース(例えば、査読を受けた、対、データマイニングによる)がこの条件付き期待値にどのように影響するかを測ることにある。式(1)の推計は投資家にとって重要である。また、ポストサンプルの頑健性を気にする学者にとっても重要である。

29,000の財務比率でt値が2を超えるものをデータマイニングした結果、元々のサンプル期間より後の予測可能性、即ちポストサンプルのパフォーマンスは50%程度になり、査読を受けたものとどっこいどっこいの結果になったとの由。

以下は結論部。

We show that the post-sample performance of published cross-sectional return predictors is remarkably similar to that of data-mined benchmarks. This result holds for most types of research we examine, including research that is risk-based or includes the support of a mathematical equilibrium model. Research that is agnostic about the theoretical foundation for predictability shows some signs of outperformance, but the magnitude is modest. The statistical implication is that whether a predictor is found in a journal or is data mined has little effect on mean inferences about post-sample performance (Equation (1)).
Beyond statistical inference, our findings suggest four deeper implications about cross-sectional stock return predictability: (1) empirical evidence is more informative than theoretical evidence for post-sample prediction, (2) investors do not learn about risk from academic research, (3) data mining is effective, and (4) mispricing is the primary driver. These implications come from analyzing the theoretical foundations of published predictors and their relationship with post-sample performance.
A limitation of our study is that we cannot identify the economic mechanism behind the lack of outperformance. The noisiness of predictor returns makes it difficult to determine the exact timing of decay, and thus makes it hard to separate publication effects (McLean and Pontiff 2016) from technological changes (Chordia, Subrahmanyam, and Tong 2014). We illustrate this difficulty in the Internet Appendix IA.6.
A second limitation is that we study single-predictor strategies. For strategies that use many predictors, the factor structure and spanning are central questions. Table 2 suggests that data-mined accounting predictors are to a significant extent spanned by the ideas in the CZ dataset, but a more systematic investigation is needed.
Last, our study is limited to the peer review process as characterized by the CZ dataset. This dataset is composed of papers that study cross-sectional return predictability, published between the years 1973 and 2016. Each literature has its own norms and practices, which evolve over time. The extent to which our findings generalize is an important question for future research.
(拙訳)
我々は、論文に掲載されたクロスセクションのリターン予測変数のポストサンプルのパフォーマンスが、データマイニングによるベンチマークのパフォーマンスと非常に近いことを示した。この結果は、リスクベースの研究や数学的均衡モデルの裏付けがある研究など、我々が調べた大半の研究タイプについて成立した。理論的基礎を問わない研究にはアウトパフォーマンスの兆候が幾らかあったが、その大きさは小幅であった。統計的な含意は、予測変数が学術誌で見い出されたものであろうがデータマイニングで得られたものであろうが、ポストサンプルのパフォーマンス(式(1))の平均推計値にはあまり影響しない、ということである。
統計的推計以外の面では、我々の発見は、クロスセクションの株式リターンの予測可能性について4つのより奥深い含意を示唆している。(1) 実証的な証拠は理鈍的な証拠よりもポストサンプルのパフォーマンスに関する情報が多い、(2) 投資家は学術研究からリスクについて学びはしない、(3) データマイニングは有効である、(4) ミスプライシングが主要な要因である。以上の含意は、掲載論文の予測変数の理論的基礎と、そのポストサンプルのパフォーマンスとの関係を分析することにより得られた。
我々の研究の限界は、アウトパフォーマンスの不在の背後にある経済的メカニズムを識別できなかったことである。予測変数のリターンのノイズの大きさは、減衰のタイミングを正確に決定することを難しくし、それによって掲載効果(McLean and Pontiff 2016*3)と技術変化(Chordia, Subrahmanyam, and Tong 2014*4)を分離することを難しくする。この困難さを我々はインターネットの補遺IA.6.で説明している。
第二の限界は、我々が単一変数戦略を調べたことである。多くの予測変数を用いる戦略では、ファクター構造とスパニングが中心的な課題となる。表2はデータマイニングされた財務予測変数がCZデータセットの考えによりかなりの程度スパンされていることを示しているが、よりシステマティックな調査が必要である。
最後に、我々の研究はCZデータセットで特徴付けられた査読プロセスに限定されている。このデータセットは、1973年から2016年までに掲載されたクロスセクションのリターンの予測可能性を研究した論文から成っている。各研究には各々の規範と慣行があり、それは時間とともに変化する。我々の発見がどこまで一般化できるかは今後の研究の重要な課題である。