IHMEモデルの何が問題か?

17日エントリの脚注で触れたようにコーエンはIHME(ワシントン大学保健指標評価研究所)モデルへの批判を展開してきたが、「えへん(ahem)」と題したこちらのエントリでは、ほら見たことか、と言わんばかりにこの問題を取り上げたStatNews記事にリンクし、なぜ感染症学者はもっと声を上げなかったのか、と問うている。17日エントリで紹介した感染症学者のジョセフは、IHMEモデルは感染症モデルというよりは経済モデルに近い、と反論していたが、このコーエンのエントリに対する応答エントリで、我々も批判はしてきたが確かにもっと大きな声を上げるべきだったかもしれない、と書いている。その上で、アンドリュー・ゲルマンが3月末に既に同モデルを批判していたことを紹介している。
以下はジョセフによるゲルマンの引用。

I have a few thoughts on this model. First, yeah, it’s curve-fitting, no more and no less. Second, if they’re gonna fit a model like this, I’d recommend they just fit it in Stan: the methodological appendix has all sorts of fragile nonlinear-least-squares stuff that we don’t really need any more. Third, I guess there’s nothing wrong with doing this sort of analysis, as long as it’s clear what the assumptions are. What the method is really doing is using the second derivative of the time trend on the log scale to estimate where we are on the curve. Once that second derivative goes negative, so the exponential growth is slowing, the model takes this as evidence that the rate of growth on the log scale will rapidly continue to go toward zero and then go negative. Fourth, yeah, what Dorman says: you can’t take the model for the asymptotic limit seriously. For example, in that methodological appendix, they say that they use the probit (“ERF”) rather than the logit curve because the probit fits the data better. That’s fine, but there’s no reason to think that the functional form at the beginning of the spread of a disease will match the functional form (or, for that matter, the parameters of the curve) at later stages. It really is the tail wagging the dog.
(拙訳)
このモデルについては幾つか思うところがある。第一に、確かにこれは曲線当てはめであってそれ以上でもそれ以下でもない。第二に、彼らのやっているようにモデルを当てはめるならば、単純にStanを使って当てはめることをお勧めする。彼らの手法の補遺には、ありとあらゆる脆弱な非線形最小二乗法の話が詰め込まれているが、それは我々にとってもう不要なものだ。第三に、前提が明確である限り、このような分析をすることには何の問題も無いと思う。彼らの手法で実際にやっていることは、対数スケールの時間トレンドの2次微分を使って、我々が曲線上のどこにいるかを推計する、ということだ。2次微分がマイナスに転じれば、指数関数的成長は鈍化しているということで、モデルはこれを対数スケールの伸び率が急速にゼロに近付き、その後マイナスになる証拠と捉える。第四に、ドーマン*1が言うように、確かに漸近的極限についてこのモデルを真面目に受け止めるべきではない。例えば、手法の補遺では、データの当てはまりがプロビットの方が良かったため、ロジット曲線ではなくプロビット曲線(「誤差関数」)を使った、と書かれている。それは結構なのだが、疾病感染の初期時点での関数形(それを言うならば、曲線のパラメータも)が、後の段階での関数形と同じであると考える理由はない。ここではまさに尾っぽが犬を振り回している。

*1:引用部の前段でゲルマンが紹介しているピーター・ドーマンの記述のこと。ただ、Web検索やEconospeakでは原文は見付けられなかった。