Probabilistic Hierarchical Forecasting with Deep Poisson Mixtures

要約

時系列に自然なグループ構造があり、複数レベルの集計とグループ全体の分解での予測が必要な場合、階層的な予測の問題が発生します。
このような問題では、文献では階層的一貫性と呼ばれる、特定の階層内の集約制約を満たすことがしばしば望まれます。
正確な予測を生成しながら一貫性を維持することは、特に確率論的予測の場合、困難な問題になる可能性があります。
信頼できる階層情報が存在する場合、時系列の正確で首尾一貫した確率的予測が可能な新しい方法を提示します。
これをディープ ポアソン混合ネットワーク (DPMN) と呼びます。
これは、階層型多変量時系列構造の同時分布のためのニューラル ネットワークと統計モデルの組み合わせに依存しています。
構築により、モデルは階層的な一貫性を保証し、予測分布の集計と分解のための単純なルールを提供します。
DPMNを、複数の公開データセットで階層的に一貫した確率的予測を生成する他の最先端の方法と比較して、広範な経験的評価を実行します。
既存の首尾一貫した確率モデルと比較して、オーストラリアの国内観光データで 11.8%、Favorita の食料品販売データセットで 8.1% という全体的な連続順位付け確率スコア (CRPS) の相対的な改善が得られました。
意図の階層。
シリーズの階層構造がランダムに割り当てられ、それらの相関関係があまり有益ではないサンフランシスコ ベイ エリアの高速道路交通量の場合、この方法では、統計ベースラインに比べてパフォーマンスに大きな違いは見られません。

要約(オリジナル)

Hierarchical forecasting problems arise when time series have a natural group structure, and predictions at multiple levels of aggregation and disaggregation across the groups are needed. In such problems, it is often desired to satisfy the aggregation constraints in a given hierarchy, referred to as hierarchical coherence in the literature. Maintaining coherence while producing accurate forecasts can be a challenging problem, especially in the case of probabilistic forecasting. We present a novel method capable of accurate and coherent probabilistic forecasts for time series when reliable hierarchical information is present. We call it Deep Poisson Mixture Network (DPMN). It relies on the combination of neural networks and a statistical model for the joint distribution of the hierarchical multivariate time series structure. By construction, the model guarantees hierarchical coherence and provides simple rules for aggregation and disaggregation of the predictive distributions. We perform an extensive empirical evaluation comparing the DPMN to other state-of-the-art methods which produce hierarchically coherent probabilistic forecasts on multiple public datasets. Compared to existing coherent probabilistic models, we obtained a relative improvement in the overall Continuous Ranked Probability Score (CRPS) of 11.8% on Australian domestic tourism data and 8.1% on the Favorita grocery sales dataset, where time series are grouped with geographical hierarchies or travel intent hierarchies. For San Francisco Bay Area highway traffic, where the series’ hierarchical structure is randomly assigned, and their correlations are less informative, our method does not show significant performance differences over statistical baselines.

arxiv情報

著者 Kin G. Olivares,O. Nganba Meetei,Ruijun Ma,Rohan Reddy,Mengfei Cao,Lee Dicker
発行日 2023-02-15 17:52:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク