加重最小二乗法を理解していなかったマサチューセッツ大学アマースト校経済学部教授

こちらのツイートを目にして、2年前に取り上げたEconbrowserのAngus Deatonのゲストエントリを読み直したところ、コメント欄でMichael Ash自身から反論が寄せられていたことに気付いた。具体的には、以前Ashが批判した自論文にはコーディングエラーは存在しなかった、というゲストエントリでのDeatonの主張に対し、いや、ウエイトを間違えていた、という反論がコメントでリンクしたHTMLないしPDFにおいて展開されている。Deatonは人口の平方根でウエイト付けしたつもりになっているが、実際には4乗根でのウエイト付けになっている、との由。


これに対し、Rick Strykerという別のコメンターが、いや、間違っているのはAshの方で、STATAのマニュアルを誤読している、とDeatonに代わって再反論した。

I’ve never used stata, but it seems to me you are misinterpreting the stata manual. I believe the manual is saying that if you want to weight a regression by n, that that’s mathematically equivalent to running OLS in which you multiply the data by sqrt(n).
Look at this stata reference for example. The technical note below example 7 shows that a regression by weighted by n is equivalent to multiplying the data by the square root of n. Also, look at example 7. The example shows that if you want to weight the regression by population, you run the command
. regress drate medage i.region [w=pop]
where they note that w is equivalent to aweight in this context. Thus, if you want to weight the regression by the square root of the population, it would seem to me that this reference is saying that you would set aweight = sqrt(pop), just as Professor Deaton did.
(拙訳)
私はstataを使ったことはないが、貴兄はstataのマニュアルを誤読しているように私には思われる。マニュアルに書かれているのは、回帰をnで加重したい場合、それはデータにsqrt(n)を乗じて通常の回帰を行うのと数学的に等価だ、ということだと私は思う。
例えばこのstataのリファレンスを見てみよう。例7の後のテクニカルノートでは、nで加重した回帰が、データにnの平方根を乗じた回帰と等価であることが示されている。また、例7も見てみよう。この例では、回帰を人口で加重したい場合、以下のコマンドを走らせることが示されている。
. regress drate medage i.region [w=pop]
ここではwがaweightに等しいことが注記されている。従って、回帰を人口の平方根で加重したい場合、まさにディートン教授が行ったように、aweight = sqrt(pop)と設定すればよい、とこのリファレンスには書かれているように私には思われる。