要約
このペーパーでは、挑戦的なインタラクティブなタスク学習シナリオに対処します。私たちは、不明確さの下で再配置と呼びます。エージェントが指示されたタスクを解決する鍵となる概念に気付いていないコンテキストで剛体環境を操作することです。
このような問題を解決するために設計されたインタラクティブなタスク学習フレームワークであるSecureを提案します。
具体化された会話を使用して不十分なドメインモデルを修正します。対話を通じて、エージェントが発見し、予期せぬ可能性を活用することを学びます。
特に、Secureは、間違いを犯したときにユーザーの具体化された是正フィードバックから学習し、指示されたタスクを解決するための新しい概念に関する有用な証拠を明らかにするために戦略的な対話の決定を下します。
一緒に、これらの能力により、エージェントは新しく獲得した知識を使用して後続のタスクに一般化することができます。
不明確さの下で再配置を解決することを学ぶことは、エージェントがセマンティクスを認識している場合、つまり学習と推論の両方で、セマンティック分析に由来する論理的結果との具体化された会話からの証拠を強化することを実現することを実証します。
要約(オリジナル)
This paper addresses a challenging interactive task learning scenario we call rearrangement under unawareness: to manipulate a rigid-body environment in a context where the agent is unaware of a concept that is key to solving the instructed task. We propose SECURE, an interactive task learning framework designed to solve such problems. It uses embodied conversation to fix its deficient domain model — through dialogue, the agent discovers and then learns to exploit unforeseen possibilities. In particular, SECURE learns from the user’s embodied corrective feedback when it makes a mistake, and it makes strategic dialogue decisions to reveal useful evidence about novel concepts for solving the instructed task. Together, these abilities allow the agent to generalise to subsequent tasks using newly acquired knowledge. We demonstrate that learning to solve rearrangement under unawareness is more data efficient when the agent is semantics-aware — that is, during both learning and inference it augments the evidence from the user’s embodied conversation with its logical consequences, stemming from semantic analysis.
arxiv情報
著者 | Rimvydas Rubavicius,Peter David Fagan,Alex Lascarides,Subramanian Ramamoorthy |
発行日 | 2025-02-10 18:39:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google