XYZ-IBD: A High-precision Bin-picking Dataset for Object 6D Pose Estimation Capturing Real-world Industrial Complexity

要約

XYZ-IBDを紹介します。これは、挑戦的なオブジェクトのジオメトリ、反射材料、重度の閉塞、密集した混乱など、実世界の産業の複雑さを捉える6Dポーズ推定のビンピッキングデータセットです。
データセットは、ミリメートルのaccurate注釈を備えた本物のロボット操作シナリオを反映しています。
主に飽和に近づく家庭用オブジェクトに焦点を当てる既存のデータセットとは異なり、XYZ-IBDは未解決の現実的な産業条件を表します。
データセットには、さまざまな形状とサイズの15のテクスチャレス、メタリック、および主に対称的なオブジェクトがあります。
これらのオブジェクトは非常に閉塞されており、高密度のビンにランダムに配置されており、実際のビンピッキングの課題を複製します。
XYZ-IBDは、2つの高精度産業カメラと1つの市販のカメラを使用して収集され、RGB、グレースケール、深度画像を提供しました。
シミュレートされたビンピッキング条件の下でレンダリングされた大規模な合成データセットとともに、75のマルチビューリアルワールドシーンが含まれています。
私たちは、反射防止スプレー、マルチビュー深度融合、半自動注釈を含む細心の注釈パイプラインを採用し、産業操作に必要なミリメートルレベルのポーズ標識精度を達成します。
シミュレートされた環境での定量化は、根真実の注釈の信頼性を確認します。
2D検出、6Dポーズ推定、およびデータセットの深さ推定タスクに関する最先端の方法をベンチマークし、現在の学術的な世帯ベンチマークと比較して、セットアップの重要なパフォーマンス分解を明らかにします。
XYZ-IBDは、現実世界のビンピッキングシナリオの複雑さを捉えることで、将来の研究にもっと現実的で挑戦的な問題を導入します。
データセットとベンチマークは、https://xyz-ibd.github.io/xyz-ibd/で公開されています。

要約(オリジナル)

We introduce XYZ-IBD, a bin-picking dataset for 6D pose estimation that captures real-world industrial complexity, including challenging object geometries, reflective materials, severe occlusions, and dense clutter. The dataset reflects authentic robotic manipulation scenarios with millimeter-accurate annotations. Unlike existing datasets that primarily focus on household objects, which approach saturation,XYZ-IBD represents the unsolved realistic industrial conditions. The dataset features 15 texture-less, metallic, and mostly symmetrical objects of varying shapes and sizes. These objects are heavily occluded and randomly arranged in bins with high density, replicating the challenges of real-world bin-picking. XYZ-IBD was collected using two high-precision industrial cameras and one commercially available camera, providing RGB, grayscale, and depth images. It contains 75 multi-view real-world scenes, along with a large-scale synthetic dataset rendered under simulated bin-picking conditions. We employ a meticulous annotation pipeline that includes anti-reflection spray, multi-view depth fusion, and semi-automatic annotation, achieving millimeter-level pose labeling accuracy required for industrial manipulation. Quantification in simulated environments confirms the reliability of the ground-truth annotations. We benchmark state-of-the-art methods on 2D detection, 6D pose estimation, and depth estimation tasks on our dataset, revealing significant performance degradation in our setups compared to current academic household benchmarks. By capturing the complexity of real-world bin-picking scenarios, XYZ-IBD introduces more realistic and challenging problems for future research. The dataset and benchmark are publicly available at https://xyz-ibd.github.io/XYZ-IBD/.

arxiv情報

著者 Junwen Huang,Jizhong Liang,Jiaqi Hu,Martin Sundermeyer,Peter KT Yu,Nassir Navab,Benjamin Busam
発行日 2025-06-16 15:48:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク