Probabilistic Hierarchical Forecasting with Deep Poisson Mixtures



– 時系列データには自然なグループ構造が存在し、グループごとの複数の集計、分解に対する予測が必要な場合がある。このような問題では、階層的一貫性という、所望の階層構造を満たすことがしばしば求められる。しかし、確率的予測の場合、階層的一貫性を保ちながら、正確な予測を行うことは困難な問題である。筆者らは、階層的情報が得られる場合に正確かつ一貫性のある確率的予測を実現する新しい方法を提案した。それを「Deep Poisson Mixture Network (DPMN)」と名付けた。
– DPMNは、ニューラルネットワークと統計モデルを組み合わせたものである。階層的多変量時系列構造の関節分布モデルを用い、予測分布の集計や分解の簡単なルールを提供する。本研究では、様々な公開データセットを用いて他の最新手法と比較実験を行った。その結果、地理的、旅行意向などの階層構造がわかっているオーストラリア国内旅行などのデータではDPMNがCRPS(信頼区間の評価指標)の全体的な相対改善率で11.8%、Favorita grocery sales datasetで8.1%の改善を示した。一方、サンフランシスコベイエリアの道路交通などの階層構造がランダムで相関が少ない場合、統計的なベースラインと比較して有意な性能差は見られなかった。


Hierarchical forecasting problems arise when time series have a natural group structure, and predictions at multiple levels of aggregation and disaggregation across the groups are needed. In such problems, it is often desired to satisfy the aggregation constraints in a given hierarchy, referred to as hierarchical coherence in the literature. Maintaining coherence while producing accurate forecasts can be a challenging problem, especially in the case of probabilistic forecasting. We present a novel method capable of accurate and coherent probabilistic forecasts for time series when reliable hierarchical information is present. We call it Deep Poisson Mixture Network (DPMN). It relies on the combination of neural networks and a statistical model for the joint distribution of the hierarchical multivariate time series structure. By construction, the model guarantees hierarchical coherence and provides simple rules for aggregation and disaggregation of the predictive distributions. We perform an extensive empirical evaluation comparing the DPMN to other state-of-the-art methods which produce hierarchically coherent probabilistic forecasts on multiple public datasets. Comparing to existing coherent probabilistic models, we obtain a relative improvement in the overall Continuous Ranked Probability Score (CRPS) of 11.8% on Australian domestic tourism data, and 8.1% on the Favorita grocery sales dataset, where time series are grouped with geographical hierarchies or travel intent hierarchies. For San Francisco Bay Area highway traffic, where the series’ hierarchical structure is randomly assigned, and their correlations are less informative, our method does not show significant performance differences over statistical baselines.


著者 Kin G. Olivares,O. Nganba Meetei,Ruijun Ma,Rohan Reddy,Mengfei Cao,Lee Dicker
発行日 2023-04-11 16:24:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.LG パーマリンク