Multi-Scale Occ: 4th Place Solution for CVPR 2023 3D Occupancy Prediction Challenge

要約

このレポートでは、CVPR 2023 3D 占有予測チャレンジの 4 位のソリューションを紹介します。
我々は、リフト・スプラット・シュートフレームワークに基づいた占有予測のためのマルチスケールOccと呼ばれる単純な方法を提案します。これは、複数の過去のフレームの時間的融合により、より良いマルチスケール3Dボクセル特徴を生成するためのマルチスケール画像特徴を導入します。
最終的なパフォーマンスをさらに向上させるために、モデル アンサンブル、テスト時の拡張、クラスごとのしきい値を含む後処理が採用されています。
リーダーボードに示されているように、私たちが提案した占有予測方法は 49.36 mIoU で 4 位にランクされています。

要約(オリジナル)

In this report, we present the 4th place solution for CVPR 2023 3D occupancy prediction challenge. We propose a simple method called Multi-Scale Occ for occupancy prediction based on lift-splat-shoot framework, which introduces multi-scale image features for generating better multi-scale 3D voxel features with temporal fusion of multiple past frames. Post-processing including model ensemble, test-time augmentation, and class-wise thresh are adopted to further boost the final performance. As shown on the leaderboard, our proposed occupancy prediction method ranks the 4th place with 49.36 mIoU.

arxiv情報

著者 Yangyang Ding,Luying Huang,Jiachen Zhong
発行日 2023-06-20 09:50:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク