Adaptive Coordination in Social Embodied Rearrangement

要約

私たちは、シミュレートされたマルチエージェント環境での夕食のテーブルの準備、家の片付け、食料品の開梱などの協力的な日常タスクからなる「社会的再配置」のタスクを提示します。
「社会的再配置」では、2 台のロボットが協調して長期的なタスクを完了します。搭載されたセンシングと自己中心的な観察を使用し、環境に関する特別な情報は使用しません。
このタスクでは、エージェントが新しいパートナーと協力するゼロショット コーディネーション (ZSC) を研究し、ロボットが新しい人間のパートナーと協力するシナリオをエミュレートします。
以前の ZSC アプローチは、複雑で視覚的に豊かな環境では一般化するのに苦労しており、さらに分析すると、トレーニング時に多様な調整動作を生成できないことがわかりました。
これに対抗するために、私たちは、識別可能性の目標を通じて多様性を促進する新しい ZSC アプローチである行動多様性プレイ (BDP) を提案します。
私たちの結果は、BDP が視覚的な調整に取り組み、目に見えない環境で新しいパートナーにゼロショット一般化できる適応エージェントを学習し、ベースラインと比較して 35% 高い成功と 32% 高い効率を達成することを示しています。

要約(オリジナル)

We present the task of ‘Social Rearrangement’, consisting of cooperative everyday tasks like setting up the dinner table, tidying a house or unpacking groceries in a simulated multi-agent environment. In Social Rearrangement, two robots coordinate to complete a long-horizon task, using onboard sensing and egocentric observations, and no privileged information about the environment. We study zero-shot coordination (ZSC) in this task, where an agent collaborates with a new partner, emulating a scenario where a robot collaborates with a new human partner. Prior ZSC approaches struggle to generalize in our complex and visually rich setting, and on further analysis, we find that they fail to generate diverse coordination behaviors at training time. To counter this, we propose Behavior Diversity Play (BDP), a novel ZSC approach that encourages diversity through a discriminability objective. Our results demonstrate that BDP learns adaptive agents that can tackle visual coordination, and zero-shot generalize to new partners in unseen environments, achieving 35% higher success and 32% higher efficiency compared to baselines.

arxiv情報

著者 Andrew Szot,Unnat Jain,Dhruv Batra,Zsolt Kira,Ruta Desai,Akshara Rai
発行日 2023-05-31 18:05:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO パーマリンク