A Pipeline for Segmenting and Structuring RGB-D Data for Robotics Applications

要約

色と深度 (RGB-D) データをセグメント化して構造化するための新しいパイプラインを導入します。
RGB-D データの既存の処理パイプラインは、幾何学情報のみを抽出することに重点を置いています。
このアプローチでは、環境の意味論的な理解から恩恵を受ける、より高度なロボットのナビゲーションおよび操作アルゴリズムの開発が妨げられます。
私たちのパイプラインは、RGB-D データを正確なセマンティック マスクにセグメント化できます。
これらのマスクは、キャプチャされた生の点群を意味的に分離された点群に融合するために使用されます。
この情報は、ユニバーサル シーン ディスクリプション (USD) ファイル形式を使用して保存されます。この形式は、下流のロボット アルゴリズム、人に優しい視覚化、およびロボット シミュレーションによる簡単なクエリに適した形式です。

要約(オリジナル)

We introduce a novel pipeline for segmenting and structuring color and depth (RGB-D) data. Existing processing pipelines for RGB-D data have focused on extracting geometric information alone. This approach precludes the development of more advanced robotic navigation and manipulation algorithms, which benefit from a semantic understanding of their environment. Our pipeline can segment RGB-D data into accurate semantic masks. These masks are then used to fuse raw captured point clouds into semantically separated point clouds. We store this information using the Universal Scene Description (USD) file format, a format suitable for easy querying by downstream robotics algorithms, human-friendly visualization, and robotics simulation.

arxiv情報

著者 Zhiwu Zheng,Lauren Mentzer,Berk Iskender,Michael Price,Colm Prendergast,Audren Cloitre
発行日 2024-10-23 16:01:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク