季節調整における異常値処理

こちらのツイートを拝見して、季節調整の異常値処理の意味というのは意外に知られていないんだな、と思い*1、何か良い資料は無いかとぐぐったところニュージーランド統計局のこちらの資料が見つかったので、以下に抜粋してみる。

Within X12-ARIMA, outliers can be dealt with implicitly or explicitly. In Step 1 of the seasonal adjustment process above, X12-ARIMA automatically identifies outliers using predetermined limits. If a value exceeds this limit it is classified as an outlier and the value is down-weighted in the subsequent iterations. This method of dealing with outliers is the implicit method and has the advantage that it is automatic and requires no manual intervention. The downside of this method, however, is that one iteration is completed before the outlier is down-weighted and, hence, the outlier influences the preliminary estimate of the trend and seasonal factor. If the outlier is extreme enough it will affect the final estimates of the trend and seasonal factor. This is illustrated in Figure 2. The outlier still affects the final estimate of the trend, even though it has been zeroweighted (as indicated by a ‘z’).
If subject-matter specialists have good a priori reason to suspect that a data point is an outlier, then another option is to override X12-ARIMA’s implicit outlier treatment. We do this by prior adjusting the series. This is the explicit method of treating outliers. The prior adjustment is done before any preliminary estimates of trend and seasonal factors are made, therefore explicitly treating an outlier will avoid the final estimates being affected by the outlier at all. ...
Prior adjustment is performed using the regression option in X12-ARIMA. Here the structure in the irregular component, due to the additive outlier, is modelled using a regression technique with the additive outlier as the regressor. The calculated parameter provides an estimate of the size of the additive outlier and this is then removed before seasonal adjustment takes place (Findley et al, 1998).
(拙訳)
X12-ARIMAでは、異常値は暗黙裡もしくは明示的に処理できる。上述した季節調整の第一段階では、X12-ARIMAは予め設定した上限を用いて異常値を自動的に識別する。値がその上限を超えると異常値として分類され、その後の反復処理で当該値のウエートは下げられる。このように異常値を処理する方法は暗黙裡の手法であり、自動的で人手の介入が不要という利点がある。しかしこの手法の欠点として、異常値のウエートが下げられる前に反復処理が一回完了するため、異常値がトレンドおよび季節要因の初期推計に影響してしまう。もし異常値が極端な値だと、トレンドおよび季節要因の最終推計にも影響してしまう。このことは図2*2に示されている。異常値のウエートはゼロになっている('z'でそのことが示されている)にも拘らず、トレンドの最終推計にまで影響している。
f:id:himaginary:20191115021431p:plain
あるデータポイントが異常値であると考えるべき事前の十分な理由が専門家にあるならば、もう一つの選択肢は、X12-ARIMAの暗黙裡の異常値処理を上書きすることである。それは系列を事前調整することにより行われる。これが異常値処理の明示的手法である。事前調整はトレンドと季節要因のいかなる初期推計が行われるよりも前に実施されるため、異常値の明示的処理では、最終推計が異常値に全く影響されない。・・・
事前調整はX12-ARIMAの回帰オプションを用いて実施される。ここでは、加法型異常値によりもたらされる不規則変動の構造が、加法型異常値を説明変数とする回帰技法を用いてモデル化される。算出されたパラメータは加法型異常値の大きさの推計値になっており、季節調整が行われる前に除去される(Findley et al, 1998*3)。

*1:ちなみに経済企画庁勤務経験があるという人が書いたこちらの記事でも同様の誤解に基づく記述がある(ただし、後から追加したと思しき米印の注で内容をさりげなく訂正している)。

*2:原注:Data from Purchases of Buses time series, Gross Domestic Expenditure.

*3:cf. ここ