こちらのツイートを目にして、2年前に取り上げたEconbrowserのAngus Deatonのゲストエントリを読み直したところ、コメント欄でMichael Ash自身から反論が寄せられていたことに気付いた。具体的には、以前Ashが批判した自論文にはコーディングエラーは存在しなかった、というゲストエントリでのDeatonの主張に対し、いや、ウエイトを間違えていた、という反論がコメントでリンクしたHTMLないしPDFにおいて展開されている。Deatonは人口の平方根でウエイト付けしたつもりになっているが、実際には4乗根でのウエイト付けになっている、との由。
これに対し、Rick Strykerという別のコメンターが、いや、間違っているのはAshの方で、STATAのマニュアルを誤読している、とDeatonに代わって再反論した。
I’ve never used stata, but it seems to me you are misinterpreting the stata manual. I believe the manual is saying that if you want to weight a regression by n, that that’s mathematically equivalent to running OLS in which you multiply the data by sqrt(n).
Look at this stata reference for example. The technical note below example 7 shows that a regression by weighted by n is equivalent to multiplying the data by the square root of n. Also, look at example 7. The example shows that if you want to weight the regression by population, you run the command
. regress drate medage i.region [w=pop]
where they note that w is equivalent to aweight in this context. Thus, if you want to weight the regression by the square root of the population, it would seem to me that this reference is saying that you would set aweight = sqrt(pop), just as Professor Deaton did.
ここではwがaweightに等しいことが注記されている。従って、回帰を人口の平方根で加重したい場合、まさにディートン教授が行ったように、aweight = sqrt(pop)と設定すればよい、とこのリファレンスには書かれているように私には思われる。