Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge

要約

私たちは、具体化されたエージェントの社会的認識と協力をテストするために設計された包括的な具体化されたソーシャルインテリジェンスチャレンジである制約付きの人間協力(CHAIC)を紹介します。
Chaicでは、目標は、自己中心的観測を装備した具体化されたエージェントであり、たとえば、高い場所に到達できない、または車椅子に閉じ込められていない人間を支援することです。
これを達成するには、成功したヘルパーが次のようにしなければなりません。(1)人間の意図と制約を推測し、人間の行動を観察し(社会的認識)、(2)人間のパートナーに合わせて調整された協力計画を作成して、できるだけ早くタスクを解決し、チームとして協力します(協力計画)。
この課題をベンチマークするために、さまざまな制約、緊急イベント、潜在的なリスクを備えた屋内と屋外の両方のシーンを備えた、実際の物理的制約と8つの長老タスクを備えた4つの新しいエージェントを作成します。
チャレンジに関する計画および学習ベースのベースラインをベンチマークし、大規模な言語モデルと動作モデリングを活用する新しい方法を導入します。
経験的評価は、機械の社会的知能の重要な側面の体系的な評価を可能にする際のベンチマークの有効性を示しています。
当社のベンチマークとコードは、https://github.com/umass-embodied-agi/chaicで公開されています。

要約(オリジナル)

We introduce Constrained Human-AI Cooperation (CHAIC), an inclusive embodied social intelligence challenge designed to test social perception and cooperation in embodied agents. In CHAIC, the goal is for an embodied agent equipped with egocentric observations to assist a human who may be operating under physical constraints — e.g., unable to reach high places or confined to a wheelchair — in performing common household or outdoor tasks as efficiently as possible. To achieve this, a successful helper must: (1) infer the human’s intents and constraints by following the human and observing their behaviors (social perception), and (2) make a cooperative plan tailored to the human partner to solve the task as quickly as possible, working together as a team (cooperative planning). To benchmark this challenge, we create four new agents with real physical constraints and eight long-horizon tasks featuring both indoor and outdoor scenes with various constraints, emergency events, and potential risks. We benchmark planning- and learning-based baselines on the challenge and introduce a new method that leverages large language models and behavior modeling. Empirical evaluations demonstrate the effectiveness of our benchmark in enabling systematic assessment of key aspects of machine social intelligence. Our benchmark and code are publicly available at https://github.com/UMass-Embodied-AGI/CHAIC.

arxiv情報

著者 Weihua Du,Qiushi Lyu,Jiaming Shan,Zhenting Qi,Hongxin Zhang,Sunli Chen,Andi Peng,Tianmin Shu,Kwonjoon Lee,Behzad Dariush,Chuang Gan
発行日 2025-06-11 19:24:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO パーマリンク