MT-Net Submission to the Waymo 3D Detection Leaderboard

要約

このテクニカルレポートでは、Waymo3D検出リーダーボードへの提出を紹介します。
私たちのネットワークはCenterpointアーキテクチャに基づいていますが、大幅に改善されています。
2Dバックボーンを設計して、さまざまなサイズのオブジェクトをより適切に検出するためのマルチスケール機能と、より豊富な監視信号を検出候補に動的に割り当てる最適なトランスポートベースのターゲット割り当て戦略を利用します。
また、さらなる改善のために、テスト時間の拡張とモデルアンサンブルを適用します。
私たちの提出物は現在、Waymo3D検出リーダーボードで78.45mAPHで4位にランクされています。

要約(オリジナル)

In this technical report, we introduce our submission to the Waymo 3D Detection leaderboard. Our network is based on the Centerpoint architecture, but with significant improvements. We design a 2D backbone to utilize multi-scale features for better detecting objects with various sizes, together with an optimal transport-based target assignment strategy, which dynamically assigns richer supervision signals to the detection candidates. We also apply test-time augmentation and model-ensemble for further improvements. Our submission currently ranks 4th place with 78.45 mAPH on the Waymo 3D Detection leaderboard.

arxiv情報

著者 Shaoxiang Chen,Zequn Jie,Xiaolin Wei,Lin Ma
発行日 2022-07-11 11:32:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク