要約
検出ベースの手法は、密集した群衆ではパフォーマンスが低いため、群集分析では不利とみなされてきました。
しかし、これらの手法は無視されがちな群衆分析に重要な情報を提供するため、その可能性が過小評価されてきたと私たちは主張します。
具体的には、出力提案と境界ボックスの領域サイズと信頼スコアにより、群衆の規模と密度についての洞察が得られます。
これらの十分に活用されていない機能を活用するために、既存の検出モデルと簡単に統合できるプラグアンドプレイ モジュールである Crowd Hat を提案します。
このモジュールは、2D と 1D の混合圧縮技術を使用して出力特徴を改良し、群集固有の情報の空間的および数値的分布を取得します。
これらの特徴に基づいて、我々はさらに、検出ベースの方法の主な制限に対処する領域適応型 NMS しきい値と分離してから整列するパラダイムを提案します。
群衆カウント、位置特定、検出などのさまざまな群集分析タスクに関する広範な評価により、群衆分析における出力機能の利用の有効性と検出ベースの手法の可能性が実証されています。
要約(オリジナル)
Detection-based methods have been viewed unfavorably in crowd analysis due to their poor performance in dense crowds. However, we argue that the potential of these methods has been underestimated, as they offer crucial information for crowd analysis that is often ignored. Specifically, the area size and confidence score of output proposals and bounding boxes provide insight into the scale and density of the crowd. To leverage these underutilized features, we propose Crowd Hat, a plug-and-play module that can be easily integrated with existing detection models. This module uses a mixed 2D-1D compression technique to refine the output features and obtain the spatial and numerical distribution of crowd-specific information. Based on these features, we further propose region-adaptive NMS thresholds and a decouple-then-align paradigm that address the major limitations of detection-based methods. Our extensive evaluations on various crowd analysis tasks, including crowd counting, localization, and detection, demonstrate the effectiveness of utilizing output features and the potential of detection-based methods in crowd analysis.
arxiv情報
著者 | Shaokai Wu,Fengyu Yang |
発行日 | 2023-08-30 17:59:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google