Human-in-the-Loop Visual Re-ID for Population Size Estimation

要約

コンピューター ビジョン ベースの再識別 (Re-ID) システムは、大規模な画像コレクションの個体群サイズを推定するために導入されることが増えています。
ただし、タスクが困難な場合や、新しいディストリビューションからのデータにデプロイされている場合、推定サイズは大幅に不正確になる可能性があります。
我々は、既製の Re-ID システムから得られるペアごとの類似性に基づいて集団サイズを推定するための人間参加型アプローチを提案します。
私たちのアプローチは、ネストされた重要度サンプリングに基づいて、ペアごとの類似性に基づいて人間による精査用の画像のペアを選択し、関連する信頼区間を使用して漸近的に不偏な母集団サイズの推定値を生成します。
私たちはさまざまな動物 Re-ID データセットで実験を実行し、私たちの方法が強力なベースラインやアクティブ クラスタリング アプローチよりも優れていることを実証します。
多くの場合、合計ペアの一部 (多くの場合 0.002% 未満) を精査することで、CV のみを使用した場合の推定サイズのエラー率を約 80% から 20% 未満に減らすことができます。
精度の向上により検査コストが削減され、Re-ID システムを導入する際に望ましい許容範囲内で個体群サイズを推定するための実用的なアプローチが提供されます。

要約(オリジナル)

Computer vision-based re-identification (Re-ID) systems are increasingly being deployed for estimating population size in large image collections. However, the estimated size can be significantly inaccurate when the task is challenging or when deployed on data from new distributions. We propose a human-in-the-loop approach for estimating population size driven by a pairwise similarity derived from an off-the-shelf Re-ID system. Our approach, based on nested importance sampling, selects pairs of images for human vetting driven by the pairwise similarity, and produces asymptotically unbiased population size estimates with associated confidence intervals. We perform experiments on various animal Re-ID datasets and demonstrate that our method outperforms strong baselines and active clustering approaches. In many cases, we are able to reduce the error rates of the estimated size from around 80% using CV alone to less than 20% by vetting a fraction (often less than 0.002%) of the total pairs. The cost of vetting reduces with the increase in accuracy and provides a practical approach for population size estimation within a desired tolerance when deploying Re-ID systems.

arxiv情報

著者 Gustavo Perez,Daniel Sheldon,Grant Van Horn,Subhransu Maji
発行日 2024-07-15 17:05:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク