COCONut: Modernizing COCO Segmentation

要約

ここ数十年、視覚コミュニティは、データセット ベンチマークの進歩の一部により、視覚認識における目覚ましい進歩を目の当たりにしてきました。
特に、確立された COCO ベンチマークは、最新の検出およびセグメンテーション システムの開発を推進しました。
ただし、COCO セグメンテーション ベンチマークは、過去 10 年間で比較的ゆっくりとした改善が見られました。
当初はモノのインスタンスに対する粗いポリゴンの注釈が備えられていましたが、スタッフ領域に対する粗いスーパーピクセルの注釈が徐々に組み込まれ、その後ヒューリスティックに統合されてパノプティック セグメンテーションの注釈が生成されました。
これらのアノテーションは、異なる評価者のグループによって実行されるため、粗いセグメンテーション マスクだけでなく、セグメンテーション タイプ間の不一致も生じます。
この研究では、COCO セグメンテーション アノテーションの包括的な再評価を行います。
注釈の品質を強化し、518 万を超えるパノプティック マスクを持つ 383K 画像を含むようにデータセットを拡張することにより、COCO Next Universal segmentation データセットである COCONut を導入します。
COCONut は、セマンティック セグメンテーション、インスタンス セグメンテーション、およびパノプティック セグメンテーションにわたって、細心の注意を払って作成された高品質マスクを使用してセグメンテーション アノテーションを調和させ、すべてのセグメンテーション タスクに対する堅牢なベンチマークを確立します。
私たちの知る限り、COCONut は人間の評価者によって検証された初の大規模ユニバーサル セグメンテーション データセットです。
COCONut のリリースは、新しいニューラル ネットワークの進歩を評価するコミュニティの能力に大きく貢献すると期待しています。

要約(オリジナル)

In recent decades, the vision community has witnessed remarkable progress in visual recognition, partially owing to advancements in dataset benchmarks. Notably, the established COCO benchmark has propelled the development of modern detection and segmentation systems. However, the COCO segmentation benchmark has seen comparatively slow improvement over the last decade. Originally equipped with coarse polygon annotations for thing instances, it gradually incorporated coarse superpixel annotations for stuff regions, which were subsequently heuristically amalgamated to yield panoptic segmentation annotations. These annotations, executed by different groups of raters, have resulted not only in coarse segmentation masks but also in inconsistencies between segmentation types. In this study, we undertake a comprehensive reevaluation of the COCO segmentation annotations. By enhancing the annotation quality and expanding the dataset to encompass 383K images with more than 5.18M panoptic masks, we introduce COCONut, the COCO Next Universal segmenTation dataset. COCONut harmonizes segmentation annotations across semantic, instance, and panoptic segmentation with meticulously crafted high-quality masks, and establishes a robust benchmark for all segmentation tasks. To our knowledge, COCONut stands as the inaugural large-scale universal segmentation dataset, verified by human raters. We anticipate that the release of COCONut will significantly contribute to the community’s ability to assess the progress of novel neural networks.

arxiv情報

著者 Xueqing Deng,Qihang Yu,Peng Wang,Xiaohui Shen,Liang-Chieh Chen
発行日 2024-04-12 17:59:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク