Dual Interpretation of Machine Learning Forecasts

要約

機械学習の予測は通常、予測子の寄与の合計として解釈されます。
ただし、各サンプル外予測は、現在と過去の経済事象間のペアごとの近接スコアに対応する重みを使用して、予測変数のサンプル内値の線形結合として表現することもできます。
この二重ルートは、一部のコンテキスト (大規模な断面データセットなど) ではどこにもつながりませんが、多くの回帰変数とトレーニング データのようなマクロ経済予測がほとんどない設定では、よりまばらな解釈を提供します。
この場合、一連の寄与を時系列として視覚化できるため、アナリストは過去の類似性の定量化可能な組み合わせとして予測を説明できます。
さらに、重み付けはデータ ポートフォリオの重み付けとして見ることができ、予測集中、ショート ポジション、売上高などの新しい診断基準を刺激します。
(カーネル) リッジ回帰、ランダム フォレスト、ブースト ツリー、ニューラル ネットワークの重みをシームレスに取得する方法を示します。
次に、これらのツールを適用して、パンデミック後のインフレ、GDP 成長率、および景気後退の確率の予測を分析します。
いずれの場合も、このアプローチは新しい角度からブラック ボックスを開き、部分的に繰り返される歴史を機械学習モデルがどのように活用するかを実証します。

要約(オリジナル)

Machine learning predictions are typically interpreted as the sum of contributions of predictors. Yet, each out-of-sample prediction can also be expressed as a linear combination of in-sample values of the predicted variable, with weights corresponding to pairwise proximity scores between current and past economic events. While this dual route leads nowhere in some contexts (e.g., large cross-sectional datasets), it provides sparser interpretations in settings with many regressors and little training data-like macroeconomic forecasting. In this case, the sequence of contributions can be visualized as a time series, allowing analysts to explain predictions as quantifiable combinations of historical analogies. Moreover, the weights can be viewed as those of a data portfolio, inspiring new diagnostic measures such as forecast concentration, short position, and turnover. We show how weights can be retrieved seamlessly for (kernel) ridge regression, random forest, boosted trees, and neural networks. Then, we apply these tools to analyze post-pandemic forecasts of inflation, GDP growth, and recession probabilities. In all cases, the approach opens the black box from a new angle and demonstrates how machine learning models leverage history partly repeating itself.

arxiv情報

著者 Philippe Goulet Coulombe,Maximilian Goebel,Karin Klieber
発行日 2024-12-17 16:44:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, econ.EM, stat.ML パーマリンク