Boosting R-CNN: Reweighting R-CNN Samples by RPN’s Error for Underwater Object Detection

要約

複雑な水中環境は、アンバランスな光条件、低コントラスト、オクルージョン、水生生物の模倣など、物体検出に新たな課題をもたらします。
このような状況では、水中カメラによってキャプチャされたオブジェクトはぼやけ、一般的な検出器はこれらのぼんやりしたオブジェクトで失敗することがよくあります。
この作業は、不確実性モデリングとハード サンプル マイニングという 2 つの観点から問題を解決することを目的としています。
3 つの主要コンポーネントで構成される、Boosting R-CNN という名前の 2 段階の水中検出器を提案します。
最初に、RetinaRPN という名前の新しい領域提案ネットワークが提案されます。これは、高品質の提案を提供し、オブジェクトの事前確率をモデル化するために、オブジェクト性と不確実性の IoU 予測を考慮します。
次に、確率的推論パイプラインを導入して、第 1 段階の事前の不確実性と第 2 段階の分類スコアを組み合わせて、最終的な検出スコアをモデル化します。
最後に、boosting reweighting という名前の新しいハード サンプル マイニング手法を提案します。
具体的には、領域提案ネットワークがサンプルのオブジェクト事前確率を誤って計算した場合、再重み付けをブーストすると、トレーニング中の R-CNN ヘッドでのサンプルの分類損失が増加しますが、正確に推定された事前分布を持つ簡単なサンプルの損失が減少します。
このようにして、第2段階のロバストな検出ヘッドが得られる。
推論段階では、R-CNN には、パフォーマンスを向上させるために最初の段階のエラーを修正する機能があります。
2 つの水中データセットと 2 つの一般的なオブジェクト検出データセットに関する包括的な実験は、この方法の有効性と堅牢性を示しています。

要約(オリジナル)

Complicated underwater environments bring new challenges to object detection, such as unbalanced light conditions, low contrast, occlusion, and mimicry of aquatic organisms. Under these circumstances, the objects captured by the underwater camera will become vague, and the generic detectors often fail on these vague objects. This work aims to solve the problem from two perspectives: uncertainty modeling and hard example mining. We propose a two-stage underwater detector named boosting R-CNN, which comprises three key components. First, a new region proposal network named RetinaRPN is proposed, which provides high-quality proposals and considers objectness and IoU prediction for uncertainty to model the object prior probability. Second, the probabilistic inference pipeline is introduced to combine the first-stage prior uncertainty and the second-stage classification score to model the final detection score. Finally, we propose a new hard example mining method named boosting reweighting. Specifically, when the region proposal network miscalculates the object prior probability for a sample, boosting reweighting will increase the classification loss of the sample in the R-CNN head during training, while reducing the loss of easy samples with accurately estimated priors. Thus, a robust detection head in the second stage can be obtained. During the inference stage, the R-CNN has the capability to rectify the error of the first stage to improve the performance. Comprehensive experiments on two underwater datasets and two generic object detection datasets demonstrate the effectiveness and robustness of our method.

arxiv情報

著者 Pinhao Song,Hong Liu,Linhui Dai,Tao Wang,Zhan Chen
発行日 2022-09-16 10:55:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク