Booster-SHOT: Boosting Stacked Homography Transformations for Multiview Pedestrian Detection with Attention

要約

マルチビュー アグリゲーションの改善は、マルチビュー歩行者検出に不可欠です。これは、一連のキャリブレーションされたカメラでキャプチャされた画像から鳥瞰図の歩行者占有マップを取得することを目的としています。
ディープ ニューラル ネットワークのアテンション モジュールの成功に触発されて、最初にホモグラフィ アテンション モジュール (HAM) を提案します。これは、新しいチャネル ゲートと空間ゲートを利用することで、既存のエンド ツー エンドのマルチビュー検出アプローチのパフォーマンスを向上させることが示されています。
さらに、Booster-SHOT を提案します。これは、提案された HAM と、ビュー コヒーレント拡張やスタック ホモグラフィ変換などの以前のアプローチの要素を組み込んだマルチビュー歩行者検出へのエンド ツー エンドの畳み込みアプローチです。
Booster-SHOT は、Wildtrack と MultiviewX の MODA でそれぞれ 92.9% と 94.2% を達成し、最新技術を Wildtrack で 1.4%、MultiviewX で 0.5% 上回っており、全体として標準評価の最先端のパフォーマンスを達成しています。
マルチビューの歩行者検出に使用されるメトリック。

要約(オリジナル)

Improving multi-view aggregation is integral for multi-view pedestrian detection, which aims to obtain a bird’s-eye-view pedestrian occupancy map from images captured through a set of calibrated cameras. Inspired by the success of attention modules for deep neural networks, we first propose a Homography Attention Module (HAM) which is shown to boost the performance of existing end-to-end multiview detection approaches by utilizing a novel channel gate and spatial gate. Additionally, we propose Booster-SHOT, an end-to-end convolutional approach to multiview pedestrian detection incorporating our proposed HAM as well as elements from previous approaches such as view-coherent augmentation or stacked homography transformations. Booster-SHOT achieves 92.9% and 94.2% for MODA on Wildtrack and MultiviewX respectively, outperforming the state-of-the-art by 1.4% on Wildtrack and 0.5% on MultiviewX, achieving state-of-the-art performance overall for standard evaluation metrics used in multi-view pedestrian detection.

arxiv情報

著者 Jinwoo Hwang,Philipp Benz,Tae-hoon Kim
発行日 2022-08-19 08:24:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク