UnScene3D: Unsupervised 3D Instance Segmentation for Indoor Scenes

要約

3D インスタンスのセグメンテーションは、私たちの周囲の世界を幾何学的に理解するための基礎です。
3D シーンのセグメンテーションなどの既存の方法は、高価な手動の 3D アノテーションによる監視に依存しています。
私たちは、屋内スキャンのクラスに依存しない 3D インスタンス セグメンテーションのための初の完全教師なし 3D 学習アプローチである UnScene3D を提案します。
UnScene3D はまず、自己教師型のカラーおよびジオメトリ機能を活用して、潜在的なオブジェクト領域を見つけることによって疑似マスクを生成します。
私たちは幾何学的オーバーセグメンテーションに基づいて動作し、高解像度 3D データの効率的な表現と学習を可能にします。
その後、予測に基づいてモデルを自己トレーニングすることで、大まかな提案が洗練されます。
私たちのアプローチは、最先端の教師なし 3D インスタンス セグメンテーション手法よりも平均精度スコアが 300% 以上向上しており、困難で乱雑な 3D シーンでも効果的なインスタンス セグメンテーションを実証しています。

要約(オリジナル)

3D instance segmentation is fundamental to geometric understanding of the world around us. Existing methods for instance segmentation of 3D scenes rely on supervision from expensive, manual 3D annotations. We propose UnScene3D, the first fully unsupervised 3D learning approach for class-agnostic 3D instance segmentation of indoor scans. UnScene3D first generates pseudo masks by leveraging self-supervised color and geometry features to find potential object regions. We operate on a basis of geometric oversegmentation, enabling efficient representation and learning on high-resolution 3D data. The coarse proposals are then refined through self-training our model on its predictions. Our approach improves over state-of-the-art unsupervised 3D instance segmentation methods by more than 300% Average Precision score, demonstrating effective instance segmentation even in challenging, cluttered 3D scenes.

arxiv情報

著者 David Rozenberszki,Or Litany,Angela Dai
発行日 2024-04-30 17:24:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク