Scalable Spatiotemporal Prediction with Bayesian Neural Fields

要約

空間参照された時系列で構成される時空間データセットは、大気汚染監視、病気の追跡、クラウド需要予測など、多くの科学アプリケーションやビジネス インテリジェンス アプリケーションで広く普及しています。
最新のデータセットのサイズと複雑さが増大し続けるにつれて、複雑な時空間ダイナミクスを捉えるのに十分な柔軟性と、大規模な予測問題を処理するのに十分なスケーラビリティを備えた新しい統計手法の必要性が高まっています。
この研究では、時空間領域にわたる豊富な確率分布を推論するための領域一般統計モデルであるベイジアン ニューラル フィールド (BayesNF) を紹介します。これは、予測、内挿、バリオグラフィーなどのデータ分析タスクに使用できます。
BayesNF は、大容量関数推定のための新しいディープ ニューラル ネットワーク アーキテクチャと、堅牢な不確実性定量化のための階層ベイズ推論を統合します。
一連の滑らかな微分可能な変換を通じて事前を定義することにより、確率的勾配降下法によって学習された変分的に学習されたサロゲートを使用して、大規模データに対して事後推論が実行されます。
私たちは、著名な統計および機械学習のベースラインに対して BayesNF を評価し、数万から数十万の測定値を含む気候および公衆衛生のデータセットからのさまざまな予測問題について大幅な改善を示しています。
この論文には、使いやすく、JAX 機械学習プラットフォーム上の最新の GPU および TPU アクセラレータと互換性のあるオープンソース ソフトウェア パッケージ (https://github.com/google/bayesnf) が付属しています。

要約(オリジナル)

Spatiotemporal datasets, which consist of spatially-referenced time series, are ubiquitous in many scientific and business-intelligence applications, such as air pollution monitoring, disease tracking, and cloud-demand forecasting. As modern datasets continue to increase in size and complexity, there is a growing need for new statistical methods that are flexible enough to capture complex spatiotemporal dynamics and scalable enough to handle large prediction problems. This work presents the Bayesian Neural Field (BayesNF), a domain-general statistical model for inferring rich probability distributions over a spatiotemporal domain, which can be used for data-analysis tasks including forecasting, interpolation, and variography. BayesNF integrates a novel deep neural network architecture for high-capacity function estimation with hierarchical Bayesian inference for robust uncertainty quantification. By defining the prior through a sequence of smooth differentiable transforms, posterior inference is conducted on large-scale data using variationally learned surrogates trained via stochastic gradient descent. We evaluate BayesNF against prominent statistical and machine-learning baselines, showing considerable improvements on diverse prediction problems from climate and public health datasets that contain tens to hundreds of thousands of measurements. The paper is accompanied with an open-source software package (https://github.com/google/bayesnf) that is easy-to-use and compatible with modern GPU and TPU accelerators on the JAX machine learning platform.

arxiv情報

著者 Feras Saad,Jacob Burnim,Colin Carroll,Brian Patton,Urs Köster,Rif A. Saurous,Matthew Hoffman
発行日 2024-07-18 17:58:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.AP, stat.ME パーマリンク