Learning to Forecast Aleatoric and Epistemic Uncertainties over Long Horizon Trajectories


これは、エージェント システムの学習された世界モデルを使用して、長期にわたるエージェントの完全な軌跡を予測することによって実現されます。
2 つの強化学習問題について、不確実性モデルが完全な軌道範囲にわたって較正された結果の不確実性推定値を生成することを示します。


Giving autonomous agents the ability to forecast their own outcomes and uncertainty will allow them to communicate their competencies and be used more safely. We accomplish this by using a learned world model of the agent system to forecast full agent trajectories over long time horizons. Real world systems involve significant sources of both aleatoric and epistemic uncertainty that compound and interact over time in the trajectory forecasts. We develop a deep generative world model that quantifies aleatoric uncertainty while incorporating the effects of epistemic uncertainty during the learning process. We show on two reinforcement learning problems that our uncertainty model produces calibrated outcome uncertainty estimates over the full trajectory horizon.


著者 Aastha Acharya,Rebecca Russell,Nisar R. Ahmed
発行日 2023-02-17 03:24:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク