要約
自信を表現することは、知覚と意思決定プロセスの両方から不確実性が生じる動的なマルチモーダル環境をナビゲートする具体化されたエージェントにとって困難です。
オープンエンドのマルチモーダル環境における具体化された信頼の誘発を調査する最初の作業を提示します。
誘発性、演ductive、および誘ductiveな推論にわたって信頼評価を構成する誘発ポリシーと、シナリオの再解釈、アクションサンプリング、および仮説的な推論を通じて信頼のキャリブレーションを強化する実行ポリシーを導入します。
Minecraft環境内のキャリブレーションおよび故障予測タスクのエージェントを評価すると、考え方などの構造化された推論アプローチが自信のキャリブレーションを改善することを示します。
しかし、我々の調査結果は、特に誘ductiveな設定の下で、不確実性を区別する際の永続的な課題も明らかにし、より洗練された具体化された信頼誘発方法の必要性を強調しています。
要約(オリジナル)
Expressing confidence is challenging for embodied agents navigating dynamic multimodal environments, where uncertainty arises from both perception and decision-making processes. We present the first work investigating embodied confidence elicitation in open-ended multimodal environments. We introduce Elicitation Policies, which structure confidence assessment across inductive, deductive, and abductive reasoning, along with Execution Policies, which enhance confidence calibration through scenario reinterpretation, action sampling, and hypothetical reasoning. Evaluating agents in calibration and failure prediction tasks within the Minecraft environment, we show that structured reasoning approaches, such as Chain-of-Thoughts, improve confidence calibration. However, our findings also reveal persistent challenges in distinguishing uncertainty, particularly under abductive settings, underscoring the need for more sophisticated embodied confidence elicitation methods.
arxiv情報
著者 | Tianjiao Yu,Vedant Shah,Muntasir Wahed,Kiet A. Nguyen,Adheesh Juvekar,Tal August,Ismini Lourentzou |
発行日 | 2025-03-13 17:59:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google