要約
大規模な 3D シーン内での 3D オブジェクトの検出は、まばらで不規則な 3D ポイント クラウドだけでなく、シーン内の前景と背景の極端な不均衡とクラスの不均衡のためにも困難です。
一般的なアプローチは、他のシーンからグラウンド トゥルース オブジェクトを追加することです。
別の方法として、要素 (ボクセル) を追加するのではなく、要素 (ボクセル) を削除してシーンを変更することを提案します。
私たちのアプローチは、両方のタイプのデータセットの不均衡に対処する方法で、「意味のある」ボクセルを選択します。
このアプローチは一般的で、任意のボクセル ベースの検出器に適用できますが、ボクセルの意味はネットワークに依存します。
私たちのボクセル選択は、いくつかの著名な 3D 検出方法のパフォーマンスを向上させることが示されています。
要約(オリジナル)
3D object detection within large 3D scenes is challenging not only due to the sparse and irregular 3D point clouds, but also due to the extreme foreground-background imbalance in the scene and class imbalance. A common approach is to add ground-truth objects from other scenes. Differently, we propose to modify the scenes by removing elements (voxels), rather than adding ones. Our approach selects the ‘meaningful’ voxels, in a manner that addresses both types dataset imbalance. The approach is general and can be applied to any voxel-based detector, yet the meaningfulness of a voxel is network-dependent. Our voxel selection is shown to improve the performance of several prominent 3D detection methods.
arxiv情報
著者 | Oren Shrout,Yizhak Ben-Shabat,Ayellet Tal |
発行日 | 2022-08-18 11:29:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google