Confidence-Aware Decision-Making and Control for Tool Selection

要約

タスクを実行する前に自分のパフォーマンス(どのくらい自信があるかなど)について内省することは、最適なツールの選択や最適な運転ルートの選択などの意思決定に不可欠です。
このような認識形式、つまり自分のパフォーマンスやメタ認知パフォーマンスについて考えることは人間ではよく知られていますが、ロボットにはまだこの認知能力が欠けています。
この反射的なモニタリングにより、具体化された決定力、堅牢性、安全性が強化されます。
ここでは、ロボットが制御に対する自信を利用して、より適切な情報に基づいた意思決定を行えるようにする数学的フレームワークを導入することで、この方向への一歩を踏み出します。
動的システムの制御信頼度の閉形式の数学的式 (つまり、制御動作の事後逆共分散) を導出します。
この制御の信頼度は、i) タスク完了のためのパフォーマンス、ii) 制御努力、および iii) 自信のバランスをとる意思決定の目的関数内にシームレスに統合されます。
理論的説明を評価するために、エージェントが特定の制御タスクに最適なロボット アームを選択する必要があるツール選択問題内で意思決定を組み立てました。
ランダム化された 2DOF アームを使用した数値シミュレーションの統計解析では、ツール選択時に制御の信頼性を使用すると、実際のタスクのパフォーマンスと、モデル化されていない摂動 (たとえば、外力) の下でのパフォーマンスに対するツールの信頼性の両方が向上することが示されています。
さらに、我々の結果は、制御の信頼度がパフォーマンスの初期の指標であるため、計算能力が制限されている場合や意思決定が困難な場合に意思決定を行うためのヒューリスティックとして使用できることを示しています。
全体として、動的システムに対して信頼性を意識した意思決定と制御スキームを使用する利点を示します。

要約(オリジナル)

Self-reflecting about our performance (e.g., how confident we are) before doing a task is essential for decision making, such as selecting the most suitable tool or choosing the best route to drive. While this form of awareness — thinking about our performance or metacognitive performance — is well-known in humans, robots still lack this cognitive ability. This reflective monitoring can enhance their embodied decision power, robustness and safety. Here, we take a step in this direction by introducing a mathematical framework that allows robots to use their control self-confidence to make better-informed decisions. We derive a mathematical closed-form expression for control confidence for dynamic systems (i.e., the posterior inverse covariance of the control action). This control confidence seamlessly integrates within an objective function for decision making, that balances the: i) performance for task completion, ii) control effort, and iii) self-confidence. To evaluate our theoretical account, we framed the decision-making within the tool selection problem, where the agent has to select the best robot arm for a particular control task. The statistical analysis of the numerical simulations with randomized 2DOF arms shows that using control confidence during tool selection improves both real task performance, and the reliability of the tool for performance under unmodelled perturbations (e.g., external forces). Furthermore, our results indicate that control confidence is an early indicator of performance and thus, it can be used as a heuristic for making decisions when computation power is restricted or decision-making is intractable. Overall, we show the advantages of using confidence-aware decision-making and control scheme for dynamic systems.

arxiv情報

著者 Ajith Anil Meera,Pablo Lanillos
発行日 2024-03-06 15:59:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク