パネル分析を理解していなかったマサチューセッツ大学アマースト校経済学部教授

昨日取り上げたEconbrowserのDeatonゲストエントリにおけるコメンターRick Strykerは、Angus DeatonとDarren Lubotskyの共著論文に対するMichael Ashの批判は、加重回帰についてのAshの無理解から来たものだ、と断じた。同様に、ラインハート=ロゴフに対するAshの批判は、パネル分析についてのAshの無理解から来たものだ、とStrykerは断じている。
Strykerは2slugbaitsという別のコメンターとその件に関して論争を繰り広げたが、それぞれ自分の主張を以下のように3点にまとめている。

●2slugbaits

(1) If you’re primarily interested in differences in the mean, then you will probably want to use a fixed effect approach. If you are mainly interested figuring out whether or not an observed effect is the result of a random draw from some probability distribution that includes that effect, then use a random effects approach. Obviously, in the R-R case a random effects approach was infeasible because you cannot establish confidence intervals when you have one observation in many of the groupings.
(2) If you are estimating a fixed effect OLS model by adding dummy variables, then you are likely to quickly chew up degrees of freedom. You can get around this problem by subtracting a population mean, but this means you are also subtracting away a lot of information. A random effects model can get around this problem and is one reason why it is oftentimes preferred.
(3) Increasing the size of T does not solve the problem of composite error terms being correlated with the explanatory variables. That’s why every econometric study using random effects will include a Hausman test. You can only use a random effects OLS model if the composite error term is uncorrelated with the explanatory variables.


(拙訳)

  1. 平均の違いに関心があるならば、固定効果の手法を使うことになるだろう。観測された効果が、その効果を含む何らかの確率分布からランダムに引き出された結果であるか否かを突き止めることに主たる関心があるならば、ランダム効果の手法を使うべきである。多くの集団において一つの観測値しかない時には信頼区間を確立できないため、ラインハート=ロゴフの場合はランダム効果の手法は明らかに適用不可能だった。
  2. ダミー変数の追加によって固定効果通常回帰モデルを推計すると、自由度を急速に消費してしまう可能性が高い。サンプル平均を差し引くことによりその問題を回避することができるが、それによって多くの情報をも同時に減じてしまうことになる。ランダム効果モデルはこの問題を回避でき、そのことがランダム効果がしばしば好まれる理由となっている。
  3. Tのサイズを大きくすることは、合成誤差項が説明変数と相関するという問題を解決しない。ランダム効果を用いる計量経済学の分析がすべてハウスマン検定を実施するのはそれが理由である。ランダム効果通常回帰モデルが使えるのは、合成誤差項が説明変数と相関しない場合だけである。

このうちの第一点について2slugbaitsは、その前のコメントで以下のように記述している。

If each of the countries had 19 episodes of debt > 90%, then that would have been one thing. But that’s not what happened. A lot of the countries had only one or two episodes of debt > 90%. Attempting a fixed effect model with only one or two observations is an exercise in self-deception. A mean based on one observation is next to meaningless when you know that other countries with many observations showed a lot of variation around the country mean.
(拙訳)
もし債務が90%を超える期が各国について19あるならば、それはそれである。しかし実際はそうではない。多くの国では債務が90%を超える期は一つか二つしかない。一つか二つしか観測値がないのに固定効果モデルを適用しようとするのは、自己欺瞞的な行為である。観測値が多数存在する他の国で国平均周りの大きな変動が見られることが分かっている場合、一つの観測値に基づく平均はほぼ無意味である。

●Rick Stryker

1) There is nothing “unusual,” “non-standard,” or “uncoventional” about starting with fixed effects as R&R do. In fact, starting with OLS in panel data as HAP do is what’s unconventional. If you think that using fixed effects in panel data is unusual as HAP apparently do, then make an argument.
2) I wrote down the conditions under which the estimator would converge to HAP’s OLS estimator. If you want to defend’s HAP’s use of OLS, you need to show how their nebulous serial correlation argument results in a combination of small T, small variance of the country-specific effects, and large variance of the across country error, such that OLS would be justified.
3) It’s difficult to see how this justification could be done a priori. You would need to do empirical work with the random effects model, which neither you nor HAP have done.


(拙訳)

  1. ラインハート=ロゴフが行ったように固定効果から始めることに「異例」、「非標準的」、ないし「非伝統的」なことは何もない。実際のところ、Herndon=Ash=Pollin(HAP)のようにパネルデータについて通常回帰から始めることこそ非伝統的である。HAPがそう考えていると思われるように、貴兄もパネルデータで固定効果を用いることが異例だと考えるならば、その点を立論すべきである。
  2. 推計値がHAPの通常回帰推計値に収束する条件は上で示した。HAPが通常回帰を使ったことを擁護したいのであれば、彼らの系列相関に関する漠然とした議論が、小さなT、国固有効果の小さな変動、および国を跨る誤差の大きな変動という組み合わせにつながり、それによって通常回帰が正当化されることを示す必要がある。
  3. そうした正当化を先験的に行うことができるとは考えにくい。ランダム効果モデルを用いた実証分析が必要になるが、それは貴兄もHAPも実施していない。

このうちの第二点についてStrykerは、その前のコメントで以下のように記述している。

The issue that HAP didn’t realize they were talking about is a problem in panel data econometrics, in which you have both time series and cross sectional data. The HAP way of weighting is ordinary least squares in which country specific differences are assumed away and only differences across all countries matter. R&R assumed what’s known as “fixed effects” which goes to the other extreme, assuming that country specific differences are fixed constants. As JDH has already pointed out, these are the two extremes of the more general random effects model. A random effects estimate will lie somewhere between R&R and HAP.
How do we know where the random effects estimate will end up? Basically, it depends on this quantity:
Z = v(u(i,t))/(v(u(i,t) + Tv(a(i))
where v(u(i,t)) is the variance of a random error that depends on country i and time t, v(a(i)) is the variance of a random variable that depends only country i, and T is the number of time observations.
If Z = 1, then you get the HAP estimator. If Z = 0, you get R&R. In practice, Z will lie somewhere in the middle. Let’s look at the extremes.
If the number of observations T is small, then Z goes to 1 and you get HAP. That makes sense intuitively since if you don’t have enough data in time, you can’t isolate the country specific differences. On the other hand, if T is large, Z goes to 0 and you get R&R. Intuitively, if T is large, the across country differences wash out.
If V(a(i)) is small, then Z goes to 1 and you get HAP. Makes sense because then there is no country specific variation, just what HAP assumes.
If V(u(i,t)) is small, then Z goes to 0 and you get R&R. Makes sense since R&R are assuming that only country specific differences matter.
So, ultimately where you end up depends on how much data you have relative to the size of the variation of country-specific and across-country differences.
(拙訳)
自らが取り組んでいるとHAPが認識していなかった問題は、時系列とクロスセクションのデータが共に存在するパネルデータにおける計量経済学の問題である。HAPの加重方法は、国固有の違いが無いものと仮定し、すべての国を通じた違いだけが問題となる、通常の最小二乗法である。ラインハート=ロゴフは「固定効果」として知られるものを仮定したが、それはもう一方の極端なケースで、国固有の違いが固定値であると仮定するものである。ジェームズ・ハミルトンが既に指摘したように、その2つは、より一般的なランダム効果モデルの2つの極限である。ランダム効果の推計値は、ラインハート=ロゴフとHAPの間のどこかにあるだろう。
ランダム効果の推計値がどうなるかが分かる方法は何だろうか? 基本的には、それは以下の値に依存する:
 Z = v(u(i,t))/(v(u(i,t) + Tv(a(i))
ここでv(u(i,t))は国iと時間tに依存するランダム項の分散、v(a(i))は国iのみに依存するランダム項の分散、Tは期数である。
もしZ=1ならば、HAPの推計値が得られる。もしZ=0ならば、ラインハート=ロゴフの推計値が得られる。十分な期間のデータが無ければ国固有の違いを取り出すことができないため、このことは直観に合っている。一方、Tが大きければ、Zは0に近付き、ラインハート=ロゴフの結果となる。直観的に言えば、Tが大きければ国を跨った違いは相殺されてしまう。
もしV(a(i))が小さければ、Zは1に近付き、HAPの結果が得られる。その場合は国固有の変動が無いが、それはまさにHAPが仮定したことであり、それと整合的である。
もしV(u(i,t))が小さければ、Zは0に近付き、ラインハート=ロゴフの結果が得られる。ラインハート=ロゴフは国固有の違いのみが問題となると仮定したため、それと整合的である。
従って、最終的にどうなるかは、国固有および国を跨った違いの変動の大きさと比較して、どれだけのデータがあるかによって決まる。

ちなみにここで言及されているブログ主のJ.D.ハミルトンは、以前のエントリで以下のように書いている

Pollin and Ash then repeat the arguments in their paper about the desirability of treating all country-years equally without responding to the particular critique of their argument that I originally provided. The issue I raised has nothing to do with serial correlation. The issue instead is whether the expected GDP growth rate should be regarded as if it is the same number across different countries. A well-known econometric method for dealing with this is referred to as “country fixed effects.” In this method, one uses the average for the Greek observations as an estimate of the Greek growth rate and the average of the U.S. observations as an estimate of the U.S. growth rate. This is a widely used procedure. By contrast, the weighting proposed by Herndon, Ash, and Pollin assumes that the expected growth rate is the same across different countries, an approach that is less widely chosen for panel data sets and in my opinion less to be recommended. Given that the ultimate goal in this case is to infer an average effect across different countries, I personally feel that a random-effects approach would be superior to fixed-effects estimation, particularly given the unbalanced nature of the panel (that is, given the fact that we have many more observations on the 90% debt state for some countries than for others). As I noted in my original piece, this would yield an estimate that would be in between those or RR and HAP. But to suggest that there is some deep flaw in the method used by RR or obvious advantage to the alternative favored by HAP is in my opinion quite unjustified.
(拙訳)
ポーリンとアッシュは、私が最初に提起した彼らの議論へのある批判に応えることなく、すべての国・年を等しく扱うことが望ましい、という彼らの論文での主張を繰り返している。私が提起した問題は、系列相関とは何ら関係無い。その問題は、異なる国同士で予想GDP成長率が同じ値であるかのように考えて良いのか、というものである。この問題を扱う良く知られた計量経済学的手法は、「国固定効果」と呼ばれている。この手法では、ギリシャの観測値の平均をギリシャの成長率の推計値として用い、米国の観測値の平均を米国の成長率の推計値として用いる。これは幅広く用いられている手順である。一方、ハーンドン、アッシュ、ポーリンによって提示された加重法は、異なる国においても予想成長率が同じであると仮定しているが、その手法がパネルデータで選択されることはそれほど多くなく、私に言わせればそれほどお勧めできないやり方である。この場合の最終目的が異なる国を跨る平均的な効果を推計することにあることに鑑みると、個人的には固定効果推計よりもランダム効果法の方が優れていると思う。パネルが不均衡であるという性質を考えると(即ち、ある国における債務90%状態の観測値が他の国よりもかなり多いという事実を考えると)とりわけそうである。最初のエントリに書いたように、それによってラインハート=ロゴフとHAPの中間の推計値が得られるだろう。しかしラインハート=ロゴフの用いた手法に何か深刻な欠陥があるとか、あるいはHAPが選択したもう一つの手法に明確な優位性があると論じることは、私に言わせれば、極めて不当である。