Semi-supervised 3D Object Detection via Temporal Graph Neural Networks

要約

3D オブジェクト検出は、自動運転やその他のロボティクス アプリケーションで重要な役割を果たします。
ただし、これらの検出器は通常、収集に費用と時間がかかる大量の注釈付きデータでトレーニングする必要があります。
代わりに、時間グラフ ニューラル ネットワークを介した 3D オブジェクト検出器の半教師付き学習により、大量のラベルのない点群ビデオを活用することを提案します。
私たちの洞察は、一時的な平滑化により、ラベル付けされていないデータに対してより正確な検出結果を作成でき、これらの平滑化された検出を使用して検出器を再トレーニングできることです。
エッジが異なる時間枠での候補検出間の関係を表すグラフニューラルネットワークを使用して、この時間的推論を実行することを学びます。
半教師あり学習の後、私たちの方法は、同じ量のラベル付きデータでトレーニングされたベースラインと比較して、困難な nuScenes および H3D ベンチマークで最先端の検出パフォーマンスを達成します。
プロジェクトとコードは https://www.jianrenw.com/SOD-TGNN/ で公開されています。

要約(オリジナル)

3D object detection plays an important role in autonomous driving and other robotics applications. However, these detectors usually require training on large amounts of annotated data that is expensive and time-consuming to collect. Instead, we propose leveraging large amounts of unlabeled point cloud videos by semi-supervised learning of 3D object detectors via temporal graph neural networks. Our insight is that temporal smoothing can create more accurate detection results on unlabeled data, and these smoothed detections can then be used to retrain the detector. We learn to perform this temporal reasoning with a graph neural network, where edges represent the relationship between candidate detections in different time frames. After semi-supervised learning, our method achieves state-of-the-art detection performance on the challenging nuScenes and H3D benchmarks, compared to baselines trained on the same amount of labeled data. Project and code are released at https://www.jianrenw.com/SOD-TGNN/.

arxiv情報

著者 Jianren Wang,Haiming Gang,Siddarth Ancha,Yi-Ting Chen,David Held
発行日 2023-03-02 18:57:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク