要約
未知の環境におけるデータ駆動型制御では、安全性と効率的な探査を確保するために、関連する不確実性を明確に理解する必要があります。
測定ノイズから生じる偶発的な不確実性は、パラメトリックな記述が与えられると明示的にモデル化できることがよくありますが、トレーニング データの有無を記述する認識的な不確実性をモデル化するのは難しい場合があります。
後者は、システムのダイナミクスが不明な場合に探索的な制御戦略を実装する場合に特に役立ちます。
深層学習を使用してトレーニング データの欠如を検出するための新しい方法を提案します。この方法では、$0$ (不確実性が低いことを示す) と $1$ (不確実性が高いことを示す) の間の連続値のスカラー出力が得られます。
私たちはこの検出器を認識論的不確実性の代用として利用し、合成データセットと実世界のデータセットに対する既存のアプローチに対するその利点を示します。
私たちのアプローチは、偶然の不確実性推定と直接組み合わせることができ、不確実性モデリングの既存のアプローチとは異なり、推論にはサンプルがないため、リアルタイムでの不確実性推定が可能になります。
さらに、未知の外乱モデルの影響を受けるシミュレートされたクアッドコプターにオンラインでデータ効率の高い制御を展開する際に、この不確実性推定の実用性を実証します。
要約(オリジナル)
Data-driven control in unknown environments requires a clear understanding of the involved uncertainties for ensuring safety and efficient exploration. While aleatoric uncertainty that arises from measurement noise can often be explicitly modeled given a parametric description, it can be harder to model epistemic uncertainty, which describes the presence or absence of training data. The latter can be particularly useful for implementing exploratory control strategies when system dynamics are unknown. We propose a novel method for detecting the absence of training data using deep learning, which gives a continuous valued scalar output between $0$ (indicating low uncertainty) and $1$ (indicating high uncertainty). We utilize this detector as a proxy for epistemic uncertainty and show its advantages over existing approaches on synthetic and real-world datasets. Our approach can be directly combined with aleatoric uncertainty estimates and allows for uncertainty estimation in real-time as the inference is sample-free unlike existing approaches for uncertainty modeling. We further demonstrate the practicality of this uncertainty estimate in deploying online data-efficient control on a simulated quadcopter acted upon by an unknown disturbance model.
arxiv情報
著者 | Neha Das,Jonas Umlauft,Armin Lederer,Thomas Beckers,Sandra Hirche |
発行日 | 2023-07-12 10:00:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google