国レベルのCovid-19感染のパネル予測

前回エントリでは感染の確率的挙動を想定し国レベルのパネル推定でその推移を予測した論文を紹介したが、同様の予測を行った表題のNBER論文が上がっている。ただし前回紹介論文が感染率βについてブラウン運動を仮定したのに対し、こちらの論文ではβと回復率γについて自己回帰を仮定するとともに、ベイズ推定の枠組みを適用している*1。論文の原題は「Panel Forecasts of Country-Level Covid-19 Infections」で、著者はLaura Liu(インディアナ大)、Hyungsik Roger Moon(南カリフォルニア大)、Frank Schorfheide(ペンシルベニア大)。
以下はその要旨。

We use dynamic panel data models to generate density forecasts for daily Covid-19 infections for a panel of countries/regions. At the core of our model is a specification that assumes that the growth rate of active infections can be represented by autoregressive fluctuations around a downward sloping deterministic trend function with a break. Our fully Bayesian approach allows us to flexibly estimate the cross-sectional distribution of heterogeneous coefficients and then implicitly use this distribution as prior to construct Bayes forecasts for the individual time series. According to our model, there is a lot of uncertainty about the evolution of infection rates, due to parameter uncertainty and the realization of future shocks. We find that over a one-week horizon the empirical coverage frequency of our interval forecasts is close to the nominal credible level. Weekly forecasts from our model are published at https://laurayuliu.com/covid19-panel-forecast/.
(拙訳)
我々は動学的パネルデータモデルを用いて国/地域パネルの日々のCovid-19感染の密度予測を生成した。我々のモデルの核になっているのは、活動性感染の伸び率が断層のある決定論的な右下がりのトレンド関数周りの自己回帰変動で表現できることを仮定した定式化である。我々の完全にベイジアン的な手法により、不均一性のある係数のクロスセクション分布を柔軟に推計した上で、その分布を暗黙裡に事前分布として用いて個々の時系列のベイズ予測を構築することが可能になった。我々のモデルによれば、パラメータの不確実性と将来のショックが現実化することにより、感染率の推移には多くの不確実性がある。我々は、1週間先の我々の区間予測の実証的な被覆頻度確率は名目の信頼できる水準*2に近いことを見い出した。我々のモデルの週次予測はhttps://laurayuliu.com/covid19-panel-forecast/で公開されている。

以下は公開されている各国の推移から日本を抜き出したもの。
f:id:himaginary:20200530022703p:plain
f:id:himaginary:20200530022724p:plain

日付は予測の起点(グラフ中の破線の縦棒)。丸印は実際の日次の感染者で、実線は起点以前はインサンプルの1期先予測、起点より後は事後予測分布の中央値(=点予測)。薄い灰色は10-90%、濃い灰色は20-80%の事後予測分布の分位。

4月4日時点の予測はかなり楽観的で、実際の感染者はその90%分位を上回って推移した。4月11日時点の予測ではその点が改定され、予測の中央値は引き続き実際の推移を下回ったものの、90%分位は感染爆発を予測する形になっている。次の4月18日予測では中央値も実際の推移を上回った。5月9日予測になると実際のデータの低下傾向が明らかになってきたことにより90%分位の感染爆発が抑えられ、5月16日と23日の予測では収束傾向が明確化している。

*1:また、前回紹介論文は金融市場へのリスクという観点からそうした予測を行っていたが、こちらの論文は予測そのものに主眼を置いている。

*2:cf. Coverage probability - Wikipedia