要約
フェイス検出は、計算リソースが限られているデバイスの展開を容易にするために、軽量モデルをますます要求するコンピュータービジョンアプリケーションです。
ニューラルネットワーク剪定は、パフォーマンスに大きな影響を与えることなく、ネットワークサイズを効果的に削減できる有望な手法です。
この作業では、幾何学的中央値(FPGM)剪定、ソフトフィルター剪定(SFP)、ベイジアン最適化を介してフィルター剪定を活用する新しい顔の顔検出パイプラインを提案し、既存のアプローチと比較してサイズとパフォーマンスの間の優れたトレードオフを達成するために
。
FPGM剪定は、各レイヤーで最も重要なフィルターを剪定できるようにする構造化された剪定技術であり、SFPはフィルターを繰り返し、その後のトレーニングステップで更新できるようにします。
ベイジアンの最適化は、各層の最適な剪定速度を決定するためにエンジニアリングの専門知識に依存するのではなく、各層の剪定速度を最適化するために採用されています。
より広いフェイスデータセットの3つのサブセットすべてにわたる実験では、提案されているアプローチB-FPGMは、モデルのサイズとパフォーマンスのバランスをとる既存のアプローチを常に上回ります。
私たちのすべての実験は、文献の現在最小の(パラメーターの数)適切な顔検出器であるERESFDに適用されました。
2番目の小さな顔検出器であるExtdを使用した小さなアブレーション研究も報告されています。
ソースコードと訓練されたプルーニングフェイス検出モデルは、https://github.com/idtiti/b-fpgmにあります。
要約(オリジナル)
Face detection is a computer vision application that increasingly demands lightweight models to facilitate deployment on devices with limited computational resources. Neural network pruning is a promising technique that can effectively reduce network size without significantly affecting performance. In this work, we propose a novel face detection pruning pipeline that leverages Filter Pruning via Geometric Median (FPGM) pruning, Soft Filter Pruning (SFP) and Bayesian optimization in order to achieve a superior trade-off between size and performance compared to existing approaches. FPGM pruning is a structured pruning technique that allows pruning the least significant filters in each layer, while SFP iteratively prunes the filters and allows them to be updated in any subsequent training step. Bayesian optimization is employed in order to optimize the pruning rates of each layer, rather than relying on engineering expertise to determine the optimal pruning rates for each layer. In our experiments across all three subsets of the WIDER FACE dataset, our proposed approach B-FPGM consistently outperforms existing ones in balancing model size and performance. All our experiments were applied to EResFD, the currently smallest (in number of parameters) well-performing face detector of the literature; a small ablation study with a second small face detector, EXTD, is also reported. The source code and trained pruned face detection models can be found at: https://github.com/IDTITI/B-FPGM.
arxiv情報
著者 | Nikolaos Kaparinos,Vasileios Mezaris |
発行日 | 2025-01-28 13:01:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google