Top-Down Beats Bottom-Up in 3D Instance Segmentation


ほとんどの3Dインスタンスセグメンテーション手法は、ボトムアップ戦略を採用しており、通常、リソースを大量に消費する後処理を含んでいます。ボトムアップの手法は、ハイパーパラメータという形でオブジェクトに関する事前の仮定に依存しており、これはドメイン固有であるため、慎重に調整する必要がある。これに対して、我々は、TD3D:トップダウン、完全データ駆動、エンドツーエンドで学習するシンプルなアプローチで、3Dインスタンスセグメンテーションに取り組む。TD3Dは、その単純な完全畳み込みパイプラインにより、標準的なベンチマークにおいて驚くほど高いパフォーマンスを発揮します。ScanNet v2、その拡張版であるScanNet200、S3DISといった標準的なベンチマークにおいて、驚くほど良好な結果を得ることができました。さらに、我々の手法は、現在の最新のグループ化ベースのアプローチよりも推論がはるかに高速である。コードは で公開されています。


Most 3D instance segmentation methods exploit a bottom-up strategy, typically including resource-exhaustive post-processing. For point grouping, bottom-up methods rely on prior assumptions about the objects in the form of hyperparameters, which are domain-specific and need to be carefully tuned. On the contrary, we address 3D instance segmentation with a TD3D: top-down, fully data-driven, simple approach trained in an end-to-end manner. With its straightforward fully-convolutional pipeline, it performs surprisingly well on the standard benchmarks: ScanNet v2, its extension ScanNet200, and S3DIS. Besides, our method is much faster on inference than the current state-of-the-art grouping-based approaches. Code is available at .


著者 Maksim Kolodiazhnyi,Danila Rukhovich,Anna Vorontsova,Anton Konushin
発行日 2023-02-06 15:38:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CV パーマリンク