要約
このレポートでは、CVPR 2023 3D 占有予測チャレンジの 4 位のソリューションを紹介します。
我々は、リフト・スプラット・シュートフレームワークに基づいた占有予測のためのマルチスケールOccと呼ばれる単純な方法を提案します。これは、複数の過去のフレームの時間的融合により、より良いマルチスケール3Dボクセル特徴を生成するためのマルチスケール画像特徴を導入します。
最終的なパフォーマンスをさらに向上させるために、モデル アンサンブル、テスト時の拡張、クラスごとのしきい値を含む後処理が採用されています。
リーダーボードに示されているように、私たちが提案した占有予測方法は 49.36 mIoU で 4 位にランクされています。
要約(オリジナル)
In this report, we present the 4th place solution for CVPR 2023 3D occupancy prediction challenge. We propose a simple method called Multi-Scale Occ for occupancy prediction based on lift-splat-shoot framework, which introduces multi-scale image features for generating better multi-scale 3D voxel features with temporal fusion of multiple past frames. Post-processing including model ensemble, test-time augmentation, and class-wise thresh are adopted to further boost the final performance. As shown on the leaderboard, our proposed occupancy prediction method ranks the 4th place with 49.36 mIoU.
arxiv情報
著者 | Yangyang Ding,Luying Huang,Jiachen Zhong |
発行日 | 2023-06-20 09:50:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google