HQOD: Harmonious Quantization for Object Detection

要約

タスクの不調和の問題は、最新の物体検出器でよく発生し、分類タスクと回帰タスク間の品質の不一致につながります。
分類スコアは高いが位置特定が不十分である、または分類スコアは低いが位置特定が正確である予測ボックスは、非最大抑制後の検出器のパフォーマンスを悪化させます。
さらに、オブジェクト検出器が量子化対応トレーニング (QAT) と連携すると、量子化検出器のパフォーマンス低下の主な原因の 1 つと考えられる、タスクの不調和の問題がさらに悪化することが観察されています。
この問題に取り組むために、私たちは 2 つのコンポーネントで構成される Harmonious Quantization for Object Detection (HQOD) フレームワークを提案します。
まず、QAT 中にタスクの調和品質が低いサンプルの改善に検出器が集中できるように、タスク相関損失を提案します。
次に、調和のとれた Intersection over Union (IoU) 損失が組み込まれ、さまざまな IoU レベルにわたる回帰分岐の最適化のバランスがとれます。
提案された HQOD は、さまざまな QAT アルゴリズムおよび検出器に簡単に統合できます。
注目すべきことに、MS COCO データセットでは、ResNet-50 バックボーンを備えた 4 ビット ATSS が 39.6% という最先端の mAP を達成し、完全精度をも上回っています。

要約(オリジナル)

Task inharmony problem commonly occurs in modern object detectors, leading to inconsistent qualities between classification and regression tasks. The predicted boxes with high classification scores but poor localization positions or low classification scores but accurate localization positions will worsen the performance of detectors after Non-Maximum Suppression. Furthermore, when object detectors collaborate with Quantization-Aware Training (QAT), we observe that the task inharmony problem will be further exacerbated, which is considered one of the main causes of the performance degradation of quantized detectors. To tackle this issue, we propose the Harmonious Quantization for Object Detection (HQOD) framework, which consists of two components. Firstly, we propose a task-correlated loss to encourage detectors to focus on improving samples with lower task harmony quality during QAT. Secondly, a harmonious Intersection over Union (IoU) loss is incorporated to balance the optimization of the regression branch across different IoU levels. The proposed HQOD can be easily integrated into different QAT algorithms and detectors. Remarkably, on the MS COCO dataset, our 4-bit ATSS with ResNet-50 backbone achieves a state-of-the-art mAP of 39.6%, even surpassing the full-precision one.

arxiv情報

著者 Long Huang,Zhiwei Dong,Song-Lu Chen,Ruiyao Zhang,Shutong Ti,Feng Chen,Xu-Cheng Yin
発行日 2024-08-05 15:37:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク