Inferring the Goals of Communicating Agents from Actions and Instructions

要約

人間が協力するときは、言語コミュニケーションと非言語行動の両方を通じて活動を調整することが多く、この情報を使用して共通の目標と計画を推測します。
この推論能力をどのようにモデル化できるでしょうか?
この論文では、あるエージェントであるプリンシパルが、指示発話の尤度関数として GPT-3 を使用して、共有計画に関する自然言語指示を別のエージェントであるアシスタントに伝達する協力チームのモデルを紹介します。
次に、第三者の観察者がアクションと指示からマルチモーダル ベイジアン 逆計画を介してチームの目標を推測し、エージェントが目標を達成するために合理的に行動しコミュニケーションするという仮定の下で目標の事後分布を計算する方法を示します。
このアプローチをマルチエージェント グリッドワールドにおける人間の目標推論と比較することで評価し、モデルの推論が人間の判断と密接に相関していることがわかりました (R = 0.96)。
行動のみからの推論と比較した場合、指示の方がより迅速で不確実性の少ない目標推論につながることもわかり、協力的なエージェントにとって口頭コミュニケーションの重要性が強調されます。

要約(オリジナル)

When humans cooperate, they frequently coordinate their activity through both verbal communication and non-verbal actions, using this information to infer a shared goal and plan. How can we model this inferential ability? In this paper, we introduce a model of a cooperative team where one agent, the principal, may communicate natural language instructions about their shared plan to another agent, the assistant, using GPT-3 as a likelihood function for instruction utterances. We then show how a third person observer can infer the team’s goal via multi-modal Bayesian inverse planning from actions and instructions, computing the posterior distribution over goals under the assumption that agents will act and communicate rationally to achieve them. We evaluate this approach by comparing it with human goal inferences in a multi-agent gridworld, finding that our model’s inferences closely correlate with human judgments (R = 0.96). When compared to inference from actions alone, we also find that instructions lead to more rapid and less uncertain goal inference, highlighting the importance of verbal communication for cooperative agents.

arxiv情報

著者 Lance Ying,Tan Zhi-Xuan,Vikash Mansinghka,Joshua B. Tenenbaum
発行日 2023-06-28 13:43:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.RO パーマリンク