RoboCAS: A Benchmark for Robotic Manipulation in Complex Object Arrangement Scenarios

要約

基礎モデルは、ロボットが長期にわたる一般的な操作タスクを実行できるようにする大きな可能性を秘めています。
ただし、既存のベンチマークのタスクの単純さと環境の均一性により、複雑なシナリオでの効果的な展開が制限されます。
この制限に対処するために、このペーパーでは \textit{RoboCAS} ベンチマークを紹介します。これは、ロボット操作における複雑なオブジェクト配置シナリオ向けに特別に設計された最初のベンチマークです。
このベンチマークは、柔軟で簡潔なスクリプト化されたポリシーを採用して、さまざまなデモンストレーションを効率的に収集し、非常に現実的な物理シミュレーション環境内で散在し、整然と積み重ねられたオブジェクトの配置を示します。
これには、ターゲットの回収、障害物の除去、ロボットの操作などの複雑なプロセスが含まれ、空間推論のための長期計画を実行するエージェントの能力をテストし、曖昧な指示の下で連鎖反応を予測します。
複数のベースラインモデルに関する広範な実験により、複雑なオブジェクト配置シナリオの管理における限界が明らかになり、実際の展開で長期的な操作を実行できるインテリジェントエージェントの緊急の必要性が強調され、将来の研究の方向性への貴重な洞察が得られます。
プロジェクトの Web サイト: \url{https://github.com/notFoundThisperson/RoboCAS-v0}。

要約(オリジナル)

Foundation models hold significant potential for enabling robots to perform long-horizon general manipulation tasks. However, the simplicity of tasks and the uniformity of environments in existing benchmarks restrict their effective deployment in complex scenarios. To address this limitation, this paper introduces the \textit{RoboCAS} benchmark, the first benchmark specifically designed for complex object arrangement scenarios in robotic manipulation. This benchmark employs flexible and concise scripted policies to efficiently collect a diverse array of demonstrations, showcasing scattered, orderly, and stacked object arrangements within a highly realistic physical simulation environment. It includes complex processes such as target retrieval, obstacle clearance, and robot manipulation, testing agents’ abilities to perform long-horizon planning for spatial reasoning and predicting chain reactions under ambiguous instructions. Extensive experiments on multiple baseline models reveal their limitations in managing complex object arrangement scenarios, underscoring the urgent need for intelligent agents capable of performing long-horizon operations in practical deployments and providing valuable insights for future research directions. Project website: \url{https://github.com/notFoundThisPerson/RoboCAS-v0}.

arxiv情報

著者 Liming Zheng,Feng Yan,Fanfan Liu,Chengjian Feng,Zhuoliang Kang,Lin Ma
発行日 2024-07-09 15:32:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク