CPR++: Object Localization via Single Coarse Point Supervision

要約

低コストのデータアノテーションの下で高性能の物体センシングを追求するポイントベースの物体位置特定(POL)が注目を集めています。
ただし、ポイント注釈モードでは、注釈付きポイントの不一致により、必然的に意味上の差異が生じます。
既存の POL は、問題を処理するために定義および適用が難しい厳密なアノテーション ルールに大きく依存しています。
この研究では、粗点改良 (CPR) を提案します。これは、私たちの知る限り、アルゴリズムの観点から意味論的な差異を軽減する最初の試みです。
CPR は、最初の注釈付き点を置き換えるために近隣領域内の意味中心点を選択することにより、意味の分散を削減します。
さらに、各オブジェクトのサンプリング領域を動的に計算するサンプリング領域推定モジュールを設計し、カスケード構造を使用してエンドツーエンドの最適化を実現します。
さらに分散正則化を構造に統合して、予測スコアを集中させ、CPR++ を生成します。
CPR++ がスケール情報を取得し、グローバル領域内の意味の分散をさらに削減できるため、高パフォーマンスのオブジェクト位置特定が保証されることがわかります。
4 つの困難なデータセットに対する広範な実験により、CPR と CPR++ の両方の有効性が検証されました。
私たちの研究が、POL における意味上の差異の問題に対処するための、アノテーション ルールではなくアルゴリズムの設計に関するさらなる研究のきっかけになれば幸いです。
データセットとコードは github.com/ucas-vg/PointTinyBenchmark で公開されます。

要約(オリジナル)

Point-based object localization (POL), which pursues high-performance object sensing under low-cost data annotation, has attracted increased attention. However, the point annotation mode inevitably introduces semantic variance due to the inconsistency of annotated points. Existing POL heavily rely on strict annotation rules, which are difficult to define and apply, to handle the problem. In this study, we propose coarse point refinement (CPR), which to our best knowledge is the first attempt to alleviate semantic variance from an algorithmic perspective. CPR reduces the semantic variance by selecting a semantic centre point in a neighbourhood region to replace the initial annotated point. Furthermore, We design a sampling region estimation module to dynamically compute a sampling region for each object and use a cascaded structure to achieve end-to-end optimization. We further integrate a variance regularization into the structure to concentrate the predicted scores, yielding CPR++. We observe that CPR++ can obtain scale information and further reduce the semantic variance in a global region, thus guaranteeing high-performance object localization. Extensive experiments on four challenging datasets validate the effectiveness of both CPR and CPR++. We hope our work can inspire more research on designing algorithms rather than annotation rules to address the semantic variance problem in POL. The dataset and code will be public at github.com/ucas-vg/PointTinyBenchmark.

arxiv情報

著者 Xuehui Yu,Pengfei Chen,Kuiran Wang,Xumeng Han,Guorong Li,Zhenjun Han,Qixiang Ye,Jianbin Jiao
発行日 2024-01-30 17:38:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク