要約
私たちは、トレーニングで人間のラベルを必要とせずに、生のポイント雲の監視されていない3Dセマンティックセグメンテーションの問題を研究しています。
既存の方法は通常、この問題をポイントごとのローカル機能の学習に定式化し、それに続いて単純なグループ化戦略が続き、ローカル機能を超えた追加の、おそらくより豊かなセマンティックプライアーを発見する能力がありません。
このペーパーでは、Logospを紹介して、ローカルポイントとグローバルの両方のポイント機能から3Dセマンティクスを学習します。
私たちのアプローチの鍵は、周波数ドメインのグローバルパターンに従ってスーパーポイントをグループ化することにより、3Dセマンティック情報を発見することであり、セグメンテーションネットワークをトレーニングするために非常に正確なセマンティックな擬似ラベルを生成します。
2つの屋内データセットと屋外データセットでの広範な実験では、LogOSPが既存のすべての監視されていない方法を大きなマージンで上回り、監視されていない3Dセマンティックセグメンテーションの最先端のパフォーマンスを達成しています。
特に、学んだグローバルパターンの調査は、トレーニング中に人間のラベルがない場合に意味のある3Dセマンティクスを本当に表していることを明らかにしています。
要約(オリジナル)
We study the problem of unsupervised 3D semantic segmentation on raw point clouds without needing human labels in training. Existing methods usually formulate this problem into learning per-point local features followed by a simple grouping strategy, lacking the ability to discover additional and possibly richer semantic priors beyond local features. In this paper, we introduce LogoSP to learn 3D semantics from both local and global point features. The key to our approach is to discover 3D semantic information by grouping superpoints according to their global patterns in the frequency domain, thus generating highly accurate semantic pseudo-labels for training a segmentation network. Extensive experiments on two indoor and an outdoor datasets show that our LogoSP surpasses all existing unsupervised methods by large margins, achieving the state-of-the-art performance for unsupervised 3D semantic segmentation. Notably, our investigation into the learned global patterns reveals that they truly represent meaningful 3D semantics in the absence of human labels during training.
arxiv情報
著者 | Zihui Zhang,Weisheng Dai,Hongtao Wen,Bo Yang |
発行日 | 2025-06-09 15:21:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google