機械学習を用いた中国の金融リスクの測定

というECB論文をMostly Economicsが紹介している。原題は「Using machine learning to measure financial risk in China」で、著者はAlexander Al-Haschimi(ECB)、Apostolos Apostolou(IMF)、Andres Azqueta-Gavaldon(Sensyne Health*1)、Martino Ricci(ECB)。
以下はその要旨。

We develop a measure of overall financial risk in China by applying machine learning techniques to textual data. A pre-defined set of relevant newspaper articles is first selected using a specific constellation of risk-related keywords. Then, we employ topical modelling based on an unsupervised machine learning algorithm to decompose financial risk into its thematic drivers. The resulting aggregated indicator can identify major episodes of overall heightened financial risks in China, which cannot be consistently captured using financial data. Finally, a structural VAR framework is employed to show that shocks to the financial risk measure have a significant impact on macroeconomic and financial variables in China and abroad.
(拙訳)
我々は、文書データに機械学習技法を適用することにより、中国の全体的な金融リスクの指標を開発した。まず、特定のリスク関連のキーワード集合を用いて、事前に定めた一連の関連する新聞記事を選択した。次に我々は、教師なし機械学習アルゴリズムに基づくトピックモデル*2を用いて、金融リスクをテーマごとの要因に分解した*3。結果として求められた総括的な指標は、中国で全体的な金融リスクが高まった主要な事例を識別することができた。それは金融データの使用では体系的に捉えられないものだった。また、構造VARの枠組みを用いて、その金融リスク指標へのショックが中国内外のマクロ経済および金融の変数に有意な影響を与えたことが示された。

*1:cf. 日本語による紹介記事

*2:cf. Topic model - Wikipedia

*3:本文によると、企業の収益性、企業投資、銀行、金融市場、為替、不動産の6つの要因に分解している。