要約
この論文では、リスクに敏感な政策最適化として定式化する、交換不可能なデータに対するベイジアン実験計画への新しいアプローチを提案します。
私たちは、最適な設計を推論するためのネストされた逐次モンテカルロ手法である Inside-Out SMC$^2$ アルゴリズムを開発し、それを粒子マルコフ連鎖モンテカルロ フレームワークに埋め込んで勾配ベースのポリシー償却を実行します。
私たちのアプローチは、対照的な推定量に依存しないため、他の償却実験計画手法とは異なります。
一連の動的システムの数値検証により、他の最先端の戦略と比較して、私たちの方法の有効性が示されます。
要約(オリジナル)
In this paper, we propose a novel approach to Bayesian experimental design for non-exchangeable data that formulates it as risk-sensitive policy optimization. We develop the Inside-Out SMC$^2$ algorithm, a nested sequential Monte Carlo technique to infer optimal designs, and embed it into a particle Markov chain Monte Carlo framework to perform gradient-based policy amortization. Our approach is distinct from other amortized experimental design techniques, as it does not rely on contrastive estimators. Numerical validation on a set of dynamical systems showcases the efficacy of our method in comparison to other state-of-the-art strategies.
arxiv情報
著者 | Sahel Iqbal,Adrien Corenflos,Simo Särkkä,Hany Abdulsamad |
発行日 | 2024-03-27 16:12:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google