バングラデシュのマスク研究から何を結論すべきか?・再訪

以前バングラデシュでのマスク着用に関するRCTについて、Ben Rechtによる批判的な検証を取り上げたことがあった。その後、研究者がデータを公開したとのことで、Rechtが公開自体は賞賛しつつも改めてそのデータを批判的に検証している(H/T タイラー・コーエン)。以下はその概要。

  • 公開されたデータは:
    • 対照群(nC):300村の163,861人、陽性者数(iC)=1,106人
    • 処置群(nT):300村の178,322人、陽性者数(iT)=1,086人
  • この結果には、以下のような問題点がある:
    • 34万人以上を8週間検証して差はわずか20人。
    • マスクでは盲検は不可能なので、当然ながら盲検ではない。
    • 処置群では、マスク促進以外に、社会的距離などの他の措置に関する教育も行われた。
    • 研究者による検査に同意して研究対象となった人の比率は、処置群が95%、対照群が92%。この差だけで観測された差を拭い去ってしまう。
    • 血清反応による陽性は、検証以前に感染していた可能性があるため、コロナの指標としては粗い。
  • 生物統計学では、実際の症例数ではなく、相対リスク減少の指標である有効性を見ることが多いが、それは効果を誇張する。
    • 同指標はRR=(iT/nT)/(iC/nC)として計算されるが、マスク研究ではRR=0.9で、感染のリスクの改善率は1.1xに過ぎない。ちなみにmRNAワクチンのRRは0.05で、改善率は20xとなる。
    • ワクチンの学界では有効性EFF=1−RRという指標も使われる。RR=0.9ならばEFF=10%である。0%から20%の有効性は無きに等しいとされ、20%の有効性のワクチンが承認されることはない。また、有効性は非線形性という点でも難点がある。有効性の10%と20%の差は非常に小さいが、85%と95%ではリスク減少にして7倍と20倍という大きな差がある。
  • 研究ではサージカルマスクと布マスクの違いも見ているが、そこでは有効性の馬鹿馬鹿しさがさらに明らかになる。サージカルマスクのデータは以下のようになっている。
    • 対照群(nC):190村の103,247人、陽性者数(iC)=774人
    • 処置群(nT):190村の113,082人、陽性者数(iT)=756人
      • 差は18人で、有効性は11%と低い。
  • 一方、布マスクのデータは以下のようになっている。
    • 対照群(nC):96村の53,691人、陽性者数(iC)=332人
    • 処置群(nT):96村の57,415人、陽性者数(iT)=330人
      • 10万人超の研究で差は僅か2人なので、差の数字に意味はないが、有効性を計算すると7%になる。
  • この場合、7%も11%も「効果なし」として扱われるべきで、その差に大した意味はない。また、このような結果についてはp値のような統計量を計算することにも意味はない。

実効再生産数に波が生じる理由

Philippe Lemoineというコーネルの博士課程にいる研究者が、自らが所属するThe Center for the Study of Partisanship and Ideology(CSPI)という組織のブログに「Have we been thinking about the pandemic wrong? The effect of population structure on transmission」と題した長文のエントリを上げ、タイラー・コーエンが「Why does R vary so much in pandemics?」というコメントを添えて リンクしている。Lemoineはツイートでその内容を解説しているので、以下にその一部を引用してみる。

However, as I argue in the post, I think it's very difficult to deny that the effective reproduction number can undergo large fluctuations even in the absence of significant behavioral changes, which is hard to understand.
Of course, there are other factors that influence transmission (such as meteorological variables), but I argue in the post that they are not sufficient to explain the large fluctuations of the effective reproduction number we observe in the absence of behavioral changes.
Since SARS-CoV-2 is a respiratory virus that is transmitted by contact, transmission should ultimately depend on people's behavior, this is very puzzling. So how can we explain those fluctuations of the effective reproduction number without denying this basic fact?
What I propose in the post is that we can square this circule by taking into account population structure and how it can affect transmission even in the absence of behavioral changes.
Indeed, standard epidemiological models, of the sort that are used to make projections and study the impact of non-pharmaceutical interventions, assume that the population is homogeneous mixing or something close to it.
What this means is that models assume that someone who is infectious has the same probability of infecting everybody in the population or, since models used in applied work often divide the population into age groups, the same probability of infecting everyone in their age group.
Of course, this is totally unrealistic, since in practice if I'm infectious the probability that I'll infect most people in the population or even in my age group is effectively zero, because I don't even have any interaction with them and therefore couldn't possibly infect them.
In practice, the virus doesn't spread in a homogeneous population, but on a network based on people's patterns of interaction with each other. The topology of that network determines what paths the virus can take to spread on the population and not all paths are equally likely.
Now, suppose that this network can be divided into subnetworks that are internally well-connected, but only loosely connected to each other.
In network science, a network that has this property is said to have "community structure", which many real networks are observed to have. For instance, here is a network based on friendship relationships among a few thousand people on Facebook, which has this kind of structure.
If the population has that kind of structure, when one of the subnetworks is seeded, the virus starts spreading in that subnetworks until herd immunity is reached locally, at which point incidence goes down unless the virus manages to reach another subnetwork from there.
Thus, instead of simulating the spread of the virus on a network of individuals, I simulate the spread on a network of homogeneous mixing populations that has community structure. Here is a graph that shows the network generated by the model for one of my simulations.
At the level of each subpopulation in the network, the model is a standard epidemiological model that assume homogeneous mixing, but people who are infected in one subpopulation can "travel" to another along the edges of the network and infect people over there.
(I put "travel" in scare quotes because people in different subpopulations may nevertheless be neighbors. What matters is who they interact with, not physical proximity, though obviously they are related. I discuss this point in more detail in the post.)
As you can see, the network is divided into subnetworks that are internally well-connected, but loosely connected to each other. Moreover, each edge is associated with a probability of "travel" along that edge, which is much greater for edges that stay within the same subnetwork.
For this simulation, I assumed a probability of "travel" of 5% along the edges that stay within the same subnetwork, but only 1 in 10,000 for edges that lead to a subpopulation in another subnetwork. There are more than 10,000 subpopulations, for a total population of ~5 million.
Here is a chart that shows the result of the simulation when I let the virus spread on that network. As you can see, the effective reproduction number undergoes wild fluctuations and the population experiences several waves at the aggregate level.
However, at the level of each subpopulation, the basic reproduction number was assumed to remain constant! Thus, this shows that, when the population has that kind of structure, the effective reproduction number can undergo large fluctuations even without any behavioral changes.
In order to make the process more intuitive, I created this animation showing how the virus spreads across subpopulations, which are represented by rectangles whose area is proportional to their size inside larger rectangles that represent the subnetworks to which they belong.
Unsurprisingly, if we increase the connectivity between subnetworks enough, the model behaves in a way that is more similar to what happens in a homogeneous mixing population.
For instance, if I use the same method to randomly generate a network but multiply the average number of edges between subnetworks by 10 and the probability of "travel" associated to those edges by 100, I obtain this epidemic.
Simulations on networks with community structure can produce all sort of epidemics, not just epidemics with large, sharply defined waves as above, but also epidemics that exhibit long plateaus with ups and downs. Just as we see in real data.
Thus, by relaxing the assumption of homogeneous population mixing and simulating the spread of the virus on a network with community structure, we can get the sort of behavior that we observe in the real world even with a constant basic reproduction number in each subpopulation.
(拙訳)
しかしながら、エントリで論じたように、行動の顕著な変化が無くても実効再生産数が大きく振れることがあるのを否定するのは非常に難しいと思う。この現象を理解するのは困難である。
もちろん、感染に影響する要因は(気象変数など)他にもあるが、エントリで論じたのは、行動の変化が無い場合に我々が観測する実効再生産数の大きな振れを説明するのにそれらは十分ではない、ということである。
SARS-CoV-2は接触感染する呼吸器系のウイルスであり、感染は結局は人々の行動に依存するはずなので、この現象は非常に不思議である。基本的な事実を否定することなしに実効再生産数のこの振れをどのように説明できるだろうか?
エントリで私が提案したのは、人口構造と、行動の変化が無い場合でもそれがどのように感染に影響するか、を考慮に入れれば、この難題を解決できる、ということである。
実際のところ、予測や非医薬的措置の効果の研究に使われるような標準的な疫学モデルでは、人口は均一な混合物ないしそれに近いものと仮定されている。
そのことが意味するのは、感染した人が人口の誰かに感染させる確率は皆等しい、とモデルが仮定している、ということである。あるいは、応用研究では人口を年齢層に分けることが多いので、その年齢層で誰かに感染させる確率は皆等しい、とモデルが仮定している、ということである。
もちろんこれは完全に非現実的である。実際には、私が感染したら、人口の大半、もしくは同じ年齢層の人の大半でさえ、私が感染させる確率は事実上ゼロである。というのは、彼らとは一切関わりがなく、従って感染させ得ないからである。
実際にはウイルスは均一な人口に広がるのではなく、人々の相互の関わりのパターンに基づくネットワークの上で広がる。そのネットワークのトポロジーが、ウイルスが人口に広まる際に採り得る経路を決定し、すべての経路の確率は同じではない。
このネットワークが、内部での接続は強いが、お互いの接続は弱い副ネットワークに分割することができるとしよう。
ネットワーク科学では、このような特性を持つネットワークは「共同体構造」を持つ、と言われ、実際のネットワークの多くがその特性を持っていることが観測されている。例えば、以下はフェイスブックの数千の人々の友だち関係に基づくネットワークであるが、そうした構造を持っている。
f:id:himaginary:20211127202345j:plain
人口がこのような構造を持っている場合、副ネットワークの一つに種が蒔かれれば、ウイルスはその副ネットワークに広がり始め、それは局所的な集団免疫が達成されるまで続く。ウイルスがそこから他の副ネットワークに到達しない限り、その時点で感染は収束する。
ということで私は、個々人のネットワーク上でウイルス拡散をシミュレートする代わりに、共同体構造を持つ均一混合人口のネットワーク上でシミュレートした。私のシミュレーションの一つでモデルが生成したネットワークを示すグラフは以下の通り。
f:id:himaginary:20211127202407j:plain
ネットワークのそれぞれの副人口のレベルでは、モデルは、均一混合を仮定する標準的な疫学モデルである。しかしある副人口の感染者はネットワークの枝に沿って別の副人口に「旅行」することができ、そこの人々に感染させることができる。
(「旅行」を鍵括弧に入れたのは、異なる副人口の人々が実は近所だということがあり得るからである。重要なのは誰と関わるかであり、物理的な近さではない。とは言え、その2つが関連しているのは明白である。この点はエントリでより詳細に論じた。)
見て分かるように、ネットワークは、内部での接続は強いが、お互いの接続は弱い副ネットワークに分割されている。また、それぞれの枝はその枝に沿って「旅行する」確率と関連しているが、同じ副ネットワーク内の枝ではその確率はかなり高い。
このシミュレーションのため私は、同じ副ネットワーク内の枝に沿って「旅行」する確率を5%としたが、他の副ネットワークの副人口につながる枝については1万分の1とした。副人口は1万以上あり、総人口は約500万である。
このネットワークでウイルスを拡散させたシミュレーション結果のグラフは以下の通り。見て分かる通り、実効再生産数は大きく振れ、人口は全体レベルで幾つかの波を経験する。
f:id:himaginary:20211127202428j:plain
しかしそれぞれの副人口レベルでは、基本再生産数は一定に留まると仮定しているのである! ということで、このことが示しているのは、人口にこうした構造がある場合、行動が何も変化しなくても実効再生産数は大きく振れることがある、ということである。
この過程をより直観的に分かりやすくするため、ウイルスが副人口間でどのように拡散するかを示す以下のアニメーションを作成した。副人口は面積が人口規模に比例する長方形で表されており、所属する副ネットワークを表すより大きな長方形の中にある。
twitter.com


驚くべきことではないが、副ネットワーク間の接続性を十分に高めれば、モデルは均一混合人口での振る舞いに近くなる。
例えば、副ネットワーク間の平均の枝数を10倍、それらの枝における「旅行」確率を100倍にして同じ手法でネットワークをランダムに生成すると、以下の疫病が得られる。
f:id:himaginary:20211127202447j:plain
共同体構造を持つネットワークでのシミュレーションは、あらゆる種類の疫病を生成できる。上のような輪郭のはっきりした大きな波だけでなく、上下を伴う長期の高原状態を示す疫病も、である。それは実際のデータで我々が目にするものと全く同じである。
従って、均一混合人口の仮定を緩め、共同体構造を持つネットワークでの拡散をシミュレートすることにより、各副人口における基本再生産数を一定に保ちつつも、実世界で観測されるような振る舞いを得ることができるのである。

感染の不均一性が現実のコロナ禍の理解において重要、という話は昨年から取り沙汰されてきた話であるが(cf. ここ、およびそのリンク先)、Lemoineはエントリ本文の追記で、今回の話とその話の違いを以下のように解説している。

Based on the response to this post, many people seem to think what I’m saying is the same thing as what people who argued back in 2020 that heterogeneity in social activity might lower the herd immunity threshold, but while this is related to what I’m talking about here it’s actually different so I thought it might be useful to briefly explain why. I’m actually familiar with the debate that took place about that last year, since I even wrote a post about it at the time. In both cases, the point is that heterogeneity affects the dynamic of the epidemic, but it’s not the same kind of heterogeneity. What people were arguing last year is that, if people’s level of social activity varies a lot, herd immunity will be reached sooner because the people who spread the virus the most are also the most likely to be infected early in the pandemic.41 This intuitive argument is supported by models showing that, when you introduce that kind of heterogeneity, herd immunity does in fact occur sooner. If we model the spread of the virus on a network, this debate was mostly about the degree distribution, i. e. the distribution of the number of edges connected to each individual in the network. The point was that, when this distribution is more dispersed than standard epidemiological models implicitly assume, the herd immunity threshold will be lower than predicted by those models.
However, the kind of epidemic behavior I discuss in this post only arises when the network has community structure, which is about a lot more than the variance of the degree distribution.42 In particular, the network must exhibit a specific kind of clustering, but this doesn’t just depend on its degree distribution. In fact, it’s conceivable that at the level of the parts of the network that I idealized as homogeneous mixing population in my simulations, the herd immunity threshold is lower than predicted by standard epidemiological model due to heterogeneity in social activity, even though at the aggregate level it’s higher due to community structure, as I explained above. So while most people have interpreted the fact that many places with a high prevalence of immunity have recently experienced large outbreaks as proof that people who argued that heterogeneity in social activity could lower the herd immunity threshold were wrong, this is not actually the case if the network on which the virus is spreading has the kind of structure assumed in this post. Of course, like the rest of this post, this is very speculative, but it goes to show that the spread of infectious diseases is a lot more complicated than people generally assume.
(拙訳)
このエントリへの反応を見ると、私の言っていることは、社会活動の不均一性が集団免疫の閾値を下げるかもしれないと2020年に人々が論じていたのと同じこと、と多くの人が考えているようである。しかし、その話はここで私の言っていることと関連はしているものの、実際には違う。その理由を簡単に説明するのは有益かと思われる。昨年のその議論については私もよく知っているが、というのは当時それについてエントリを書いてさえいるからだ。いずれのケースでも、不均一性が疫病の動学に影響することがポイントとなっているが、両者の不均一性は同じものではない。昨年人々が論じていたのは、人々の社会活動の水準のばらつきが大きければ、集団免疫は早く達成できる、ということである*1。そうした不均一性を導入すれば実際に集団免疫は早く達成される、ということを示したモデルにより、この直観的な議論は支持された。ウイルスのネットワーク上での拡散をモデル化する場合、この議論は主に次数分布、即ち、ネットワークで個人が互いに接続されている枝の数の分布に関する話となる。そこでのポイントは、この分布が標準的な疫学モデルが暗黙裡に仮定しているよりも分散しているならば、集団免疫の閾値はそれらのモデルが予測するよりも低くなる、ということである。
しかし、私が本エントリで論じている疫学的振る舞いは、ネットワークが共同体構造を持っている場合のみ生じる。それは次数分布の分散よりもかなり広い話である*2。具体的には、ネットワークはある種のクラスタリングを示す必要があるが、これは次数分布だけに依存するわけではない。実際、私がシミュレーションで均一混合人口として理想化したネットワークの部分レベルでは、集団免疫の閾値は社会活動の不均一性によって標準的な疫学モデルが予測するよりも低くなる。上で説明したように、共同体構造のために全体レベルでは閾値は高くなるにもかかわらず、である。免疫が普及した多くの場所で最近大規模なコロナ禍が生じたことを、社会活動の不均一性が集団免疫の閾値を下げると論じた人が間違っていたことを証明した、と多くの人は解釈したが、ウイルスが拡散しているネットワークが本エントリで仮定したような構造を持っていたとしたら、それは必ずしもそうではない。もちろん、エントリの他の部分と同様、これはまったく推測の域を出ない話であるが、感染症の拡大は人々が一般に想定するよりも遥かに複雑であることを示す話ではある。

*1:原注:Actually, some people also talked about other kinds of heterogeneity, such as heterogeneity in susceptibility. If you are modeling the spread of a virus on a network, whose edges have a weight indicating the probability of transmission along that edge, this presumably depends on a combination of the degree distribution and the distribution of the weights. But this is also different from the kind of heterogeneity I’m discussing in this post.
(拙訳)
実際には、感受性における不均一性など、他の種類の不均一性について論じた人もいた。枝に沿った感染確率を示すウエイトを備えたネットワークでウイルス拡散をモデル化する場合、これは次数分布とウエイトの分布との組み合わせに左右されると思われる。しかしそれは本エントリで私が論じている不均一性とはやはり違う。

*2:原注:In general, the topology of a network can’t be reduced to the properties of its degree distribution, because it depends on facts about how the network was generated that go beyond the degree distribution that was used.
(拙訳)
一般にネットワークのトポロジーは次数分布の特性に還元できない。ネットワークがどのように生成されたかという、使われた次数分布を超えた話に依存するからである。

貿易と格差の序説

というNBER論文(原題は「A Primer on Trade and Inequality」)をダニ・ロドリックが上げている(H/T Mostly Economicsungated版)。以下はその要旨。

In the public imagination globalization’s adverse effects have loomed large, contributing significantly to the backlash against the political mainstream and the rise of far-right populism. The literature on trade and inequality is in fact exceptionally rich, with important theoretical insights as well as extensive empirical findings that sheds light on this recent experience. Some of the key results of this literature, discussed here, are as follows: Redistribution is the flip side of the gains from trade, and it becomes larger relative to net gains from trade in the advanced stages of globalization. Compensation is difficult for both economic and political reasons. International trade often differs from other market exchanges, raising fairness concerns in ways that domestic markets do not. The economic benefits of deep integration are generally ambiguous. Dynamic or growth gains from trade are uncertain.
(拙訳)
一般の人々の頭の中では、グローバリゼーションの負の効果は大きなものとして浮かび上がってきており、政治の主流派への反発と極右ポピュリズムの台頭に大いに寄与している。貿易と格差に関する研究は実際のところ大きく積み上がっており、そうした最近の経験の解明に役立つ重要な理論的考察と幅広い実証的発見が存在する。本稿で論じるこれらの研究の主要な結果には、次のようなものがある:再分配は貿易の利得と裏腹の関係にあり、グローバリゼーションが進んだ段階では貿易の純利得と比べて相対的に大きくなる。補償は経済と政治の両方の理由から困難である。国際貿易は他の市場取引と異なることが多く、国内市場では見られないような公平性に関する懸念を惹起する。統合の深化の経済的便益は一般に不明瞭である。貿易の動学的便益や成長の便益は不確実である。

金融危機と政治的過激化:如何に破綻した銀行がヒトラーの権力への道を拓いたか

というBIS論文が上がっている(H/T Mostly Economics)。原題は「Financial crises and political radicalization: How failing banks paved Hitler's path to power」で、著者は Sebastian Doerr(BIS)、Stefan Gissler(FRB)、Jose-Luis Peydro(インペリアル・カレッジ・ロンドン)、Hans-Joachim Voth(チューリッヒ大)。
以下はそのリンクページ上のまとめ。

Focus
Do financial crises fan the flames of fanaticism? Many have argued that the financial crisis of 2007–09 not only wrought havoc on employment and output but that its problematic aftermath of failing financial institutions, public bailouts and austerity may also have paved the way for populists around the world. We examine the canonical case of a radical movement's rise to power: Hitler's Nazi party, which took office in the wake of the severe 1931 banking crisis in Germany – a turning point in modern history.
Contribution
Several cross-country studies have concluded that a link exists between financial crises and right-wing populist movements. What is still missing are studies demonstrating that a financial shock can lead to a broad-based radicalisation of the electorate, with major political consequences. It has also remained unclear how economic and financial shocks interact with cultural identity in the turn toward radicalisation.
Findings
Using newly collected data on the exposure of individual cities to the failure of Danatbank – the bank at the heart of Germany's 1931 financial crisis – we show that a financial shock led to a generalised radicalisation of the electorate. This directly helped the Nazi party to gain power. Importantly, we demonstrate that the financial shock interacted with pre-existing cultural attitudes: the surge in support for the Nazis in response to the shock was greatest in places with a previous history of antisemitism. Voters were radicalised both at the ballot box and in their actions. Once the Nazis were in power, both pogroms and deportations were more likely to occur in places worse affected by the banking crisis.
Abstract
Do financial crises radicalize voters? We study Germany's 1931 banking crisis, collecting new data on bank branches and firm-bank connections. Exploiting cross- sectional variation in pre-crisis exposure to the bank at the center of the crisis, we show that Nazi votes surged in locations more affected by its failure. Radicalization in response to the shock was exacerbated in cities with a history of anti- Semitism. After the Nazis seized power, both pogroms and deportations were more frequent in places affected by the banking crisis. Our results suggest an important synergy between financial distress and cultural predispositions, with far-reaching consequences.
(拙訳)

焦点
金融危機は狂信的行為の炎を煽るのだろうか? 2007-09年の金融危機が雇用と生産に大きな損害をもたらしただけでなく、金融機関の破綻、公的救済、および緊縮財政というその問題含みの余波が、世界のポピュリストの台頭に寄与したと論じる者は多い。我々は過激運動の政権奪取に関する典型的なケースを調べた。即ち、現代史の転換点となった、1931年のドイツの深刻な銀行危機の後に政権の座に就いたヒトラーのナチ党である。
貢献
幾つかの国際比較の研究は、金融危機と右派ポピュリスト運動との関連が存在すると結論付けた。まだ欠けているのは、金融危機が重大な政治的結果を伴う有権者の広範な過激化につながり得ることを示した研究である。過激化の過程で、経済・金融ショックが文化的アイデンティとどのように相互作用するかもまだ不明である。
発見
ダナート銀行――1931年の金融危機の中心にあった銀行――の破綻から個別都市が受けた影響について新たに収集したデータを用いて我々は、金融ショックが有権者の全般的な過激化につながったことを示す。このことは直接的にナチ党の権力の掌握に寄与した。重要なことは、金融ショックが既存の文化的態度と相互作用したことが示されたことである。ショックによるナチス支持の急増は、反ユダヤ主義の過去がある地域で最も大きかった。有権者は投票と行動の両面で過激化した。ナチスが権力を握ると、銀行危機の悪影響が大きかった地域ほどユダヤ人に対する迫害と追放が起きやすかった。
要旨
金融危機有権者を過激化するのだろうか? 我々は1931年のドイツの銀行危機を調べるため、銀行支店ならびに企業と銀行の関係の新たなデータを収集した。危機の中心にあった銀行との危機前の関係の深さの地域ごとの違いを利用し、ナチへの投票がその銀行の破綻に影響された地域ほど大きく急増したことを我々は示す。ショックによる過激化は、反ユダヤ主義の過去がある都市ほど悪化した。ナチスの権力掌握後は、銀行危機の影響を受けた地域ほどユダヤ人への迫害と追放が頻繁に生じた。我々の結果は、重大な帰結をもたらす、金融危機と従来からの文化的傾向との間の重要なシナジー効果を示唆している。

2種類の非凡な経済学者

スキデルスキーのProject Syndicate論説からの引用をもう一丁。ヴェブレン、ケインズ、ハーシュマンの伝記をレビューした論説(H/T タイラー・コーエン)の冒頭でスキデルスキーは、傑出した経済学者を2種類に分類している。

There are two types of extraordinary economist. The first type includes pioneers of the field such as David Ricardo, William Stanley Jevons, and, in our own time, Robert Lucas. They all aimed to economize knowledge in order to explain the largest possible amount of behavior with the smallest possible number of variables.
The second category, which includes Thorstein Veblen, John Maynard Keynes, and Albert O. Hirschman, sought to broaden economic knowledge in order to understand motives and norms of behavior excluded by mainstream analysis but important in real life. The first type of economist is fiercely exclusive; the second has tried, largely in vain, to make economics more inclusive.
The first type of economist rather than the second has come to define the field, owing partly to the successful drive to professionalize the production of knowledge. Economics and other social sciences are heirs of the medieval guilds, each jealously preserving its chosen method of creating intellectual products. It also reflects the increasing difficulty in a secular age of developing moral content for the social sciences in general. We lack an agreed standpoint from outside “the science” by which to judge the value of human activity.
(拙訳)
非凡な経済学者には2つのタイプがいる。最初のタイプは、分野のパイオニアで、デビッド・リカード、ウィリアム・スタンレー・ジェヴォンズ、そして我々の同時代にはロバート・ルーカスがいる。彼らは皆、可能な限り最小限の変数で可能な限り最大限の行動を説明するために、知識を有効利用しようとした。
2番目のカテゴリーにはソースティン ・ヴェブレン、ジョン・メイナード・ケインズ、および、アルバート・O・ハーシュマンが含まれ、主流派の分析では除外されているが実生活では重要な行動の動機と規範を理解するために、経済的知識を広げようとした。第一のタイプの経済学者は極めて排他的である。第二のタイプは、概ね失敗に終わったものの、経済学をもっと包摂的なものにしようとした。第二のタイプよりは第一のタイプが分野を規定するようになったが、その理由の一つは知識の生産をうまく職業化したためである。経済学や他の社会科学は中世のギルドを受け継いでおり、知的生産物を生み出す選ばれた手法をそれぞれ油断なく保持している。別の理由は、世俗の時代において社会科学全般に関する道徳的な内容を構築することがますます困難になっていることにある。人間の活動の価値を判断する拠り所となる皆が合意した「科学」の外側の立場を我々は欠いているのである。

何が殺したマクロ経済学?

というProject Syndicate論説(原題は「What Killed Macroeconomics?」)の結論部でロバート・スキデルスキーが以下のように書いている(H/T Mostly Economics)。

The relationship between theory and practice is thus not as Bernanke saw it. Monetary policy works in theory but not in practice; fiscal policy works in practice but not in theory. Fiscal Keynesianism is still a policy in search of a theory. Acemoglu, Laibson, and List supply a piece of the missing theory when they note that shocks are “hard to predict.” Keynes would have said they are impossible to predict, which is why he rejected the standard view that economies are cyclically stable in the absence of shocks (which is as useless as saying that leaves don’t flutter in the absence of wind).
The supply and demand models that first-year economics students are taught can illuminate the equilibrium path of the hairdressing industry but not of the economy as a whole. Macroeconomics is the child of uncertainty. Unless economists recognize the existence of inescapable uncertainty, there can be no macroeconomic theory, only prudential responses to emergencies.
(拙訳)
理論と実際の関係は、従って、バーナンキの見解のようなものではない*1。金融政策は理論では機能するが実際には機能しない。財政政策は実際には機能するが理論では機能しない。財政ケインズ主義は依然として理論を求めている政策である。アセモグル=レイブソン=リスト*2は、ショックは「予測が困難」と記した時、欠けている理論の一端を提示した。ケインズならば予測は不可能と述べたであろう。ショックが無ければ経済は循環的に安定である、という標準的見解を彼が否定したのはそれが理由である(この言葉は、風が無ければ葉はそよがない、という言葉と同じくらい役に立たない)。
経済学部の1年生で学ぶ需給モデルは、美容業界の均衡経路を明らかにするかもしれないが*3、経済全体についてはそうではない。マクロ経済学は不確実性の所産である。逃れることのできない不確実性の存在を経済学者が認めない限り、マクロ経済学理論というものはあり得ず、緊急事態への慎重な対応があるだけである。

*1:論説の冒頭でスキデルスキーは、「QEの問題点は実際には効果があるのに理論上は効果が無いことだ(The problem with QE is it works in practice but it doesn't work in theory)」というバーナンキの有名なセリフ(cf. ここ)を引いている。

*2:

*3:論説の最初の方でスキデルスキーは、賃金の下方硬直性による失業という理論の説明として、時給14ドルで働きたい美容師が13ドルでは働かない、という例を出している。

イベルメクチン問題が教えてくれること

Scott Alexanderという有名ブロガー(cf. Slate Star Codex - Wikipedia)によるイベルメクチンのCovid-19への効果のメタ分析をタイラー・コーエンが推奨している。日本語記事では既にgigazineがその概要を紹介している
そのブログでアレキサンダーは、イベルメクチンの効果に関する研究をまとめたサイトを次のように賞賛している。

Any deep dive into ivermectin has to start here:
This is from ivmmeta.com, part of a sprawling empire of big professional-looking sites promoting unorthodox coronavirus treatments. I have no idea who runs it - they’ve very reasonably kept their identity secret - but my hat is off to them. Each of these study names links to a discussion page which extracts key outcomes and offers links to html and pdf versions of the full text. These same people have another 35 ivermectin studies with different inclusion criteria, subanalyses by every variable under the sun, responses and counterresponses to everyone who disagrees with them about every study, and they’ve done this for twenty-nine other controversial COVID treatments. Putting aside the question of accuracy and grading only on presentation and scale, this is the most impressive act of science communication I have ever seen. The WHO and CDC get billions of dollars in funding and neither of them has been able to communicate their perspective anywhere near as effectively. Even an atheist can appreciate a cathedral, and even an ivermectin skeptic should be able to appreciate this website.
(拙訳)
イベルメクチンに関する深掘りはすべてここから始める必要がある:
f:id:himaginary:20211122233028p:plain
上表はivmmeta.comのものだが、同サイトは、非正統的なコロナウイルスの治療を推進している、拡大しつつあるプロ仕様サイトの大帝国の一部だ。誰が運営しているかは知らないが――非常に良く分かる話だが、彼らは自分たちの身元を隠している――私は彼らに脱帽する。各研究の名称はディスカッションのページにリンクしており、そこでは主要な結果を抜粋し、全文のhtml版とpdf版へのリンクも張っている。さらに異なる収録基準で他に35のイベルメクチンの研究を提供しており*1、一般的なすべての変数について副分析を提供しており、各研究について彼らと同意しない人すべてに対する反応と反論を示しており、それを最初の29の論争の的となっているCOVID治療についても行っている。正確性の問題と、プレゼンテーションと規模だけで格付けしているという問題を除けば、これは私が目にした中で最も印象的な科学コミュニケーションのやり方だ。WHOとCDCは何十億ドルもの資金を持っているが、いずれもこれに少しでも近いほど効果的に自分たちの見解をコミュニケートすることはできていない。無神論者でも大聖堂を賞賛することができるが、イベルメクチン懐疑論者でもこのサイトを賞賛することができよう。

この後アレキサンダーは、イベルメクチンの早期治療に関する29の研究を一つ一つ検証した上で、次のように述べている。

...the trends really are in ivermectin’s favor, but once you eliminate all the questionable studies there are too few studies left to have enough statistical power to reach significance.
Except that everyone is still focusing on deaths and hospitalizations just because they’re flashy. Mahmud et al, which everyone agrees is a great study, found that ivermectin decreased days until clinical recovery, p = 0.003?
So what do you do?
This is one of the toughest questions in medicine. It comes up again and again. You have some drug. You read some studies. Again and again, more people are surviving (or avoiding complications) when they get the drug. It’s a pattern strong enough to common-sensically notice. But there isn’t an undeniable, unbreachable fortress of evidence. The drug is really safe and doesn’t have a lot of side effects. So do you give it to your patients? Do you take it yourself?
Here this question is especially tough, because, uh, if you say anything in favor of ivermectin you will be cast out of civilization and thrown into the circle of social hell reserved for Klan members and 1/6 insurrectionists. All the health officials in the world will shout “horse dewormer!” at you and compare you to Josef Mengele. But good doctors aren’t supposed to care about such things. Your only goal is to save your patient. Nothing else matters.
I am telling you that Mahmud et al is a good study and it got p = 0.003 in favor of ivermectin. You can take the blue pill, and stay a decent respectable member of society. Or you can take the horse dewormer pill, and see where you end up.
In a second, I’ll tell you my answer. But you won’t always have me to answer questions like this, and it might be morally edifying to observe your thought process in situations like this. So take a second, and meet me on the other side of the next section heading.
(拙訳)
・・・全体的な傾向は確かにイベルメクチンを支持しているが、疑問のある研究を除くと、有意性を得るのに十分な統計検定力を持つだけの研究は残らない。
ただしそれは、人目を引くという理由で死者数と入院数に焦点を当てている限りにおいてである。皆が素晴らしい研究と認めるマハムードらの研究では、イベルメクチンは臨床的な回復までの日数を減らすことを見い出した。p=0.003だよ?
これはどうしたものか?
これは医学において最も難しい問題の一つである。こうしたことは繰り返し起きる。手元にはある薬がある。研究を幾つか目にする。その薬を服用して生存する(もしくは合併症を回避する)人が多く見られる、というケースが何度も発生している。常識的に考えれば認知するほどの強いパターンだ。しかし、否定も破棄もできないほどの証拠の砦は築かれていない。その薬は完全に安全で、副作用も多くない。ということで、患者に投与するか? 自分でも服用するか?
今の場合、この問題は特に難しい。というのは、まあ、イベルメクチンに少しでも好意的なことを言ったら、文明社会から放り出され、KKKのメンバーや1月6日の暴徒と同じ穴の貉と見做されるからだ。世界中の医療関係者に「馬の駆虫剤!」と怒鳴りつけられ、ヨーゼフ・メンゲレと同じ扱いを受ける。しかし良い医者はそうしたことを気にしないものだ。目標は患者を救うことだけであり、それ以外のことは問題にならない。
先に言ったように、マハムードらの研究は良い研究で、p=0.003でイベルメクチンを支持している。ブルーピルを飲めば、社会のきちんとした尊敬される一員に留まることができる。もしくは馬の駆虫剤のピルを飲んで、どうなるかを見届けることもできる。
間もなく私の答えを示す。しかしこうした問題に常に私のような回答者がいるとは限らず、こうした状況での自分の思考過程を観察することは道徳的に啓発される経験となろう。ということで、しばし間をおいて、次節の見出しの向こうで再会しよう。

この後アレキサンダーは、数行を空けて、「The Synthesis」という見出しの下で以下のように書いている。

Hopefully you learned something interesting about yourself there. But my answer is: worms!
As several doctors and researchers have pointed out (h/t especially Avi Bitterman and David Boulware), the most impressive studies come from places that are teeming with worms. Mahmud from Bangladesh, Ravakirti from East India, Lopez-Medina from Colombia, etc.
Here’s the prevalence of roundworm infections by country (source). But alongside roundworms, there are threadworms, hookworms, blood flukes, liver flukes, nematodes, trematodes, all sorts of worms. Add them all up and somewhere between half and a quarter of people in the developing world have at least one parasitic worm in their body.
...
Treatment of worm infections might reduce the negative effect of COVID-19! And ivermectin is a deworming drug! You can see where this is going…
(拙訳)
自分自身について何か興味深いことを学んだことと思う。しかし私の答えは:寄生虫だ!
f:id:himaginary:20211122233403p:plain
何人かの医者や研究者が指摘したように(h/t 特にアヴィ・ビターマンデビッド・ブールウエア)、最も印象深い研究は寄生虫がうようよしている地域からきている。バングラディシュのマハムード、東インドのラバキルティ、コロンビアのロペス=メディナなどだ。
f:id:himaginary:20211122233423p:plain
国ごとの回虫感染状況は上図の通り(ソース)。しかし回虫のほか、線虫、鉤虫、住血吸虫、肝吸虫、線虫類、吸虫類といったあらゆる種類の寄生虫がいる。総計すれば、1/4から1/2の間のどこかの割合で、発展途上国の人々の体内には少なくとも一つの寄生虫がいる。
・・・
寄生虫治療はCOVIDー19の負の影響を減らすだろう! そしてイベルメクチンは駆虫剤なのだ! 話の行方は明らかだろう・・・

この後アレキサンダーは、この一件の科学的、社会学的、政治的な意味合いについて考察した上で、エントリの最後で以下のように話を要約している。

Ivermectin doesn’t reduce mortality in COVID a significant amount (let’s say d > 0.3) in the absence of comorbid parasites: 85-90% confidence
Parasitic worms are a significant confounder in some ivermectin studies, such that they made them get a positive result even when honest and methodologically sound: 50% confidence
Fraud and data processing errors are of similar magnitude to p-hacking and methodological problems in explaining bad studies (95% confidence interval for fraud: between >1% and 5% as important as methodological problems; 95% confidence interval for data processing errors: between 5% and 100% as important)
Probably “Trust Science” is not the right way to reach proponents of pseudoscientific medicine: ???% confidence
(拙訳)

  • 寄生虫の併存症が無ければ、イベルメクチンはCOVIDによる死者数を有意に減らしはしない(例えばd > 0.3):85-90%の信頼性
  • 幾つかのイベルメクチン研究では寄生虫は有意な交絡要因で、そのため、研究が正直で方法が健全な場合でさえプラスの結果を得ることになる:50%の信頼性
  • 悪しき研究を説明する上で、不正とデータ処理の誤りは、pハッキングと手法上の問題と同程度の説明力を持つ(不正についての95%信頼区間:手法上の問題の1%強から5%の間の重要性、データ処理誤りについての95%信頼区間:5%から100%の間の重要性)*2
  • おそらく「真の科学」は疑似科学的な医学の推進者に届くための正しい方法ではない:???%の信頼性

*1:アレキサンダーが画像で示した表には29の早期治療の研究が掲載されているが、元のサイトでは、本エントリ執筆時点で、それ以外に22の後期段階の治療の研究、15の予防研究が掲載されている。

*2:本文の科学的意味合いの考察でアレキサンダーは、これまでの再現性危機で培われてきた検知方法(方法論のチェックや事前登録された分析のチェック)に加えて、生データを見ることの重要性が今年は明らかになった、としている。それによって不正が検知できるほか、誤りも検知できるから、とのことである。その上で、自身も含め人々が犯す誤りの頻度の多さに警鐘を鳴らしている。