要約
この論文では、動的カメラ視点を備えたモバイル操作プラットフォーム向けの堅牢なオブジェクト認識吸引把握ポリシーである Sim-Suction について紹介します。これは、乱雑な環境から未知のオブジェクトを拾い上げるように設計されています。
吸引把握ポリシーは通常、データ駆動型のアプローチを採用しており、大規模で正確に注釈が付けられた吸引把握データセットが必要です。
しかし、乱雑な環境における吸引把握データセットの生成は依然として研究不足であり、対象物体とその周囲の関係については不確実性が残されています。
これに対処するために、320 万の注釈付き吸引把握ポーズを持つ 500 の雑然とした環境で構成されるベンチマーク合成データセット Sim-Suction-Dataset を提案します。
効率的な Sim-Suction-Dataset 生成プロセスは、分析モデルと動的物理シミュレーションを組み合わせて、高速かつ正確な吸引把握ポーズのアノテーションを作成することで、新しい洞察を提供します。
Sim-Suction-Dataset からポイントごとのアフォーダンスを学習し、ゼロショット テキストからセグメンテーションへの相乗効果を活用することで、堅牢な 6D 吸引把握ポーズを生成する Sim-Suction-Pointnet を導入します。
すべてのオブジェクトをピックアップする実際の実験では、Sim-Suction-Pointnet が乱雑なレベル 1 オブジェクト (角柱形状)、乱雑なレベル 2 オブジェクト (より複雑な形状)、および
それぞれ雑然とした混合オブジェクト。
Sim-Suction ポリシーは、雑然とした混合シーンでテストされた最先端のベンチマークよりも約 21% 優れています。
要約(オリジナル)
This paper presents Sim-Suction, a robust object-aware suction grasp policy for mobile manipulation platforms with dynamic camera viewpoints, designed to pick up unknown objects from cluttered environments. Suction grasp policies typically employ data-driven approaches, necessitating large-scale, accurately-annotated suction grasp datasets. However, the generation of suction grasp datasets in cluttered environments remains underexplored, leaving uncertainties about the relationship between the object of interest and its surroundings. To address this, we propose a benchmark synthetic dataset, Sim-Suction-Dataset, comprising 500 cluttered environments with 3.2 million annotated suction grasp poses. The efficient Sim-Suction-Dataset generation process provides novel insights by combining analytical models with dynamic physical simulations to create fast and accurate suction grasp pose annotations. We introduce Sim-Suction-Pointnet to generate robust 6D suction grasp poses by learning point-wise affordances from the Sim-Suction-Dataset, leveraging the synergy of zero-shot text-to-segmentation. Real-world experiments for picking up all objects demonstrate that Sim-Suction-Pointnet achieves success rates of 96.76%, 94.23%, and 92.39% on cluttered level 1 objects (prismatic shape), cluttered level 2 objects (more complex geometry), and cluttered mixed objects, respectively. The Sim-Suction policies outperform state-of-the-art benchmarks tested by approximately 21% in cluttered mixed scenes.
arxiv情報
著者 | Juncheng Li,David J. Cappelleri |
発行日 | 2023-11-27 20:23:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google