Unveiling the Black Box: Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model

要約

エンドツーエンドのモデルが自動運転認識の主流として台頭しつつあります。
しかし、内部メカニズムを注意深く解体できないと、開発効率が低下し、信頼の確立が妨げられます。
この問題の先駆者として、我々は、統合された意味論的表現空間内でグラウンド・トゥルースに対してモジュールの特徴マップを並置し、それらの類似性を定量化する新しいフレームワークである、鳥瞰図知覚モデルのための独立機能モジュール評価(BEV-IFME)を紹介します。
個々の機能モジュールのトレーニングの成熟度を評価します。
フレームワークの中核は、特徴マップのエンコードと表現の位置合わせのプロセスにあり、私たちが提案する 2 段階の Alignment AutoEncoder によって促進され、顕著な情報の保存と特徴構造の一貫性が保証されます。
機能モジュールのトレーニングの成熟度を評価するための指標である類似性スコアは、BEV 指標との強い正の相関関係を示し、平均相関係数は 0.9387 であり、評価目的におけるフレームワークの信頼性を証明しています。

要約(オリジナル)

End-to-end models are emerging as the mainstream in autonomous driving perception. However, the inability to meticulously deconstruct their internal mechanisms results in diminished development efficacy and impedes the establishment of trust. Pioneering in the issue, we present the Independent Functional Module Evaluation for Bird’s-Eye-View Perception Model (BEV-IFME), a novel framework that juxtaposes the module’s feature maps against Ground Truth within a unified semantic Representation Space to quantify their similarity, thereby assessing the training maturity of individual functional modules. The core of the framework lies in the process of feature map encoding and representation aligning, facilitated by our proposed two-stage Alignment AutoEncoder, which ensures the preservation of salient information and the consistency of feature structure. The metric for evaluating the training maturity of functional modules, Similarity Score, demonstrates a robust positive correlation with BEV metrics, with an average correlation coefficient of 0.9387, attesting to the framework’s reliability for assessment purposes.

arxiv情報

著者 Ludan Zhang,Xiaokang Ding,Yuqi Dai,Lei He,Keqiang Li
発行日 2024-09-18 13:20:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク