要約
科学的具体化されたエージェントは、複雑な実験ワークフローを自動化することにより、現代の研究所で重要な役割を果たします。
典型的な家庭環境と比較して、実験室の設定は、身体化学的変換と長老計画の認識に大幅に高い要求を課し、具体化された知性を進めるための理想的なテストベッドになります。
しかし、その開発は、適切なシミュレーターとベンチマークの欠如によって長い間妨げられてきました。
この論文では、このギャップに対処し、Labutopiaを導入し、包括的なシミュレーションとベンチマークスイートを、実験室の設定で一般化可能な推論可能な具体化されたエージェントの開発を促進するように設計されています。
具体的には、多物理と化学的に意味のある相互作用をサポートする高忠実度シミュレーターであるi)Labsimを統合します。
ii)Labscene、多様な科学シーンのためのスケーラブルな手続き型ジェネレーター。
およびiii)ラブベンチ、原子作用から長距離モバイル操作までの5つのレベルの複雑さに及ぶ階層的なベンチマーク。
Labutopiaは、30の異なるタスクをサポートし、200を超えるシーンおよび楽器資産が含まれており、高級環境での大規模なトレーニングと原則的な評価を可能にします。
Labutopiaは、科学的目的のエージェントにおける知覚、計画、および制御の統合を進めるための強力なプラットフォームを提供し、将来の研究における具体化された知性の実用的な能力と一般化の限界を調査するための厳密なテストベッドを提供することを実証します。
要約(オリジナル)
Scientific embodied agents play a crucial role in modern laboratories by automating complex experimental workflows. Compared to typical household environments, laboratory settings impose significantly higher demands on perception of physical-chemical transformations and long-horizon planning, making them an ideal testbed for advancing embodied intelligence. However, its development has been long hampered by the lack of suitable simulator and benchmarks. In this paper, we address this gap by introducing LabUtopia, a comprehensive simulation and benchmarking suite designed to facilitate the development of generalizable, reasoning-capable embodied agents in laboratory settings. Specifically, it integrates i) LabSim, a high-fidelity simulator supporting multi-physics and chemically meaningful interactions; ii) LabScene, a scalable procedural generator for diverse scientific scenes; and iii) LabBench, a hierarchical benchmark spanning five levels of complexity from atomic actions to long-horizon mobile manipulation. LabUtopia supports 30 distinct tasks and includes more than 200 scene and instrument assets, enabling large-scale training and principled evaluation in high-complexity environments. We demonstrate that LabUtopia offers a powerful platform for advancing the integration of perception, planning, and control in scientific-purpose agents and provides a rigorous testbed for exploring the practical capabilities and generalization limits of embodied intelligence in future research.
arxiv情報
著者 | Rui Li,Zixuan Hu,Wenxi Qu,Jinouwen Zhang,Zhenfei Yin,Sha Zhang,Xuantuo Huang,Hanqing Wang,Tai Wang,Jiangmiao Pang,Wanli Ouyang,Lei Bai,Wangmeng Zuo,Ling-Yu Duan,Dongzhan Zhou,Shixiang Tang |
発行日 | 2025-05-28 17:50:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google