Overcoming Referential Ambiguity in Language-Guided Goal-Conditioned Reinforcement Learning


私たちは、認知科学から派生した 2 つの概念、つまり教育学 (適切な指示を選択する) とプラグマティズム (帰納的推論を使用して他のエージェントの好みを学習する) がこれらの参照の曖昧さを解決するのにどのように役立つかを研究します。
これらのアイデアを、シミュレートされたロボット タスク (ブロック スタッキング) で 2 人の人工エージェントを使用する教師/学習者のセットアップに適用します。


Teaching an agent to perform new tasks using natural language can easily be hindered by ambiguities in interpretation. When a teacher provides an instruction to a learner about an object by referring to its features, the learner can misunderstand the teacher’s intentions, for instance if the instruction ambiguously refer to features of the object, a phenomenon called referential ambiguity. We study how two concepts derived from cognitive sciences can help resolve those referential ambiguities: pedagogy (selecting the right instructions) and pragmatism (learning the preferences of the other agents using inductive reasoning). We apply those ideas to a teacher/learner setup with two artificial agents on a simulated robotic task (block-stacking). We show that these concepts improve sample efficiency for training the learner.


著者 Hugo Caselles-Dupré,Olivier Sigaud,Mohamed Chetouani
発行日 2023-09-27 07:52:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク