Exploring Active 3D Object Detection from a Generalization Perspective


LiDARベースの3Dオブジェクト検出における高いアノテーションコストを軽減するために、能動学習は、モデル性能を損なうことなく、ラベル付けされていないデータのごく一部のみを選択してアノテーションするよう学習する有望なソリューションである。しかし、我々の実証研究では、主流の不確実性ベースと多様性ベースの能動学習ポリシーは、点群の情報量とボックスレベルのアノテーションコストの間のトレードオフのバランスを取ることができないため、3D検出タスクに適用すると有効ではないことが示唆された。この限界を克服するために、我々は点群取得のためのフレームワークCrbにおいて、ラベルの簡潔さ}、特徴の代表性、幾何学的バランスの3つの新しい基準を共同で調査し、ラベルのないサンプルプールから冗長な3D境界ボックスラベル、潜在的特徴、幾何的特徴(例えば、点群密度)の点群を階層的にフィルターし、注釈するオブジェクトが少ない情報量が多いものを欲張りに選択することを提案する。我々の理論解析により、提案基準は選択された部分集合の周辺分布と未見テスト集合の事前分布を整合させ、汎化誤差の上限を最小化することを実証する。Crbの有効性と適用性を検証するために、KITTIとWaymoの2つのベンチマーク3Dオブジェクト検出データセットで広範囲な実験を行い、1段階(すなわち、Second)と2段階3D検出器(すなわち、Pv-rcnn)の両方を検証しています。実験では、提案アプローチが既存の能動学習戦略を上回り、バウンディングボックスと点群のそれぞれ$1%$と$8%$のアノテーションを必要とする完全教師あり性能を達成することが証明された。ソースコード: https://github.com/Luoyadan/CRB-active-3Ddet.


To alleviate the high annotation cost in LiDAR-based 3D object detection, active learning is a promising solution that learns to select only a small portion of unlabeled data to annotate, without compromising model performance. Our empirical study, however, suggests that mainstream uncertainty-based and diversity-based active learning policies are not effective when applied in the 3D detection task, as they fail to balance the trade-off between point cloud informativeness and box-level annotation costs. To overcome this limitation, we jointly investigate three novel criteria in our framework Crb for point cloud acquisition – label conciseness}, feature representativeness and geometric balance, which hierarchically filters out the point clouds of redundant 3D bounding box labels, latent features and geometric characteristics (e.g., point cloud density) from the unlabeled sample pool and greedily selects informative ones with fewer objects to annotate. Our theoretical analysis demonstrates that the proposed criteria align the marginal distributions of the selected subset and the prior distributions of the unseen test set, and minimizes the upper bound of the generalization error. To validate the effectiveness and applicability of Crb, we conduct extensive experiments on the two benchmark 3D object detection datasets of KITTI and Waymo and examine both one-stage (i.e., Second) and two-stage 3D detectors (i.e., Pv-rcnn). Experiments evidence that the proposed approach outperforms existing active learning strategies and achieves fully supervised performance requiring $1\%$ and $8\%$ annotations of bounding boxes and point clouds, respectively. Source code: https://github.com/Luoyadan/CRB-active-3Ddet.


著者 Yadan Luo,Zhuoxiao Chen,Zijian Wang,Xin Yu,Zi Huang,Mahsa Baktashmotlagh
発行日 2023-02-08 12:14:34+00:00
