ロバスト制御理論と学習理論

サージェントインタビューロバスト制御理論の研究について語った部分の続き。

Evans and Honkapohja: What are some of the connections to learning theory?
Sargent: There are extensive mathematical connections through the theory of large deviations. Hansen and I exploit these. Some misspecifications are easy to learn about, others are difficult to learn about. By “difficult” I mean “learn at a slow rate.” Large deviation theory tells us which misspecifications can be learned about quickly and which can’t. Hansen and I restricted the amount of misspecification that our agent wants to guard against by requiring that it be a misspecification that is hard to distinguish from his approximating model. This is how we use learning theory to make precise what we mean by the phrase “the decision maker thinks his model is a good approximation.” There is a race between a discount factor and a learning rate. With discounting, it makes sense to try to be robust against plausible alternatives that are difficult to learn about.
Evans and Honkapohja: Can this model of decision making be recast in Bayesian terms?
Sargent: It depends on your perspective. We have shown that ex post, it can, in the sense that you can come up with a prior, a distorted model, that rationalizes the decision maker’s choices. But ex ante you can’t—the set of misspecifications that the agent fears is too big and he will not or cannot tell you a prior over that set.
By the way, Lars and I have constructed equilibria with heterogeneous agents in which the ex post Bayesian analysis implies that agents with different interests will have different “twisted models.” From the point of view of a rational expectations econometrician, these agents look as if they have different beliefs. This is a disciplined way of modelling belief heterogeneity.
Evans and Honkapohja: Is this a type of behavioral economics or bounded rationality?
Sargent: Any decision theory is a type of behavioral economics. It is not a type of bounded rationality. The decision maker is actually smarter than a rational expectations agent because his fear of model misspecification is out in the open.


(拙訳)

Evans and Honkapohja
ロバスト制御理論と)学習理論とはどのように結び付いていますか?
サージェント
大きな乖離に関する理論を通じて数学的な強い結び付きがあります。ハンセンと私はそのことを追究しています。定式化の誤りには学習の簡単なものもあり、難しいものもあります。ここで「難しい」というのは「学習速度が遅い」ということです。大きな乖離の理論は、定式化のどの誤りが学習が容易で、どの誤りが容易でないかを教えてくれます。ハンセンと私は、主体の近似モデルと区別するのが難しいという条件を定式化の誤りに課すことによって、モデルの主体が防ぎたいと考える誤りの量を制限しました。学習理論をそのように用いることで、「意思決定者は自分のモデルが良い近似だと思っている」というフレーズで意味することを正確なものとしているのです。割引率と学習速度は競合します。割引があると、学習するのが難しい他のもっともらしい選択肢に対抗して頑健性を追求することが意味を持ちます。
Evans and Honkapohja
この意思決定モデルはベイジアンの枠組みに落とすことができますか?
サージェント
それは見方によります。意思決定者の選択を合理化するような事前分布ないし変形されたモデルを生成することができる、という意味では、事後的にはベイジアンの枠組みに落とせることを我々は示しました。しかし事前的には無理です。主体が懸念する定式化の誤りの集合はあまりにも大きいので、その集合に関する事前分布を主体は把握しようとはしませんし、また把握するのは不可能でしょう。
ちなみにラースと私は、事後的なベイジアン分析において異なる利害関係を持つ主体が異なる「変形されたモデル」を持つような、不均一な主体における均衡を構築しました。合理的期待の計量経済学者の観点からすれば、それらの主体は異なる信念を持っているように見えるでしょう。これは信念の不均一性をモデル化する一つのきちんとしたやり方です。
Evans and Honkapohja
それは行動経済学の一種ですか、それとも限定合理性の一種ですか?
サージェント
すべての意思決定理論は行動経済学の一種です。限定合理性の一種ではありません。実際のところ、意思決定者は合理的期待の主体よりも賢いのです。というのは、モデル定式化の誤りに対する懸念が顕わになっているからです。