Salient Object Detection for Images Taken by People With Vision Impairments

要約

顕著なオブジェクトの検出は、前景オブジェクトと背景に属するピクセルを解読する画像のバイナリ マスクを生成するタスクです。
VizWiz-SalientObject と呼ばれる、周囲をよりよく理解しようとしている視覚障害者が撮影した画像を使用した、新しい顕著物体検出データセットを紹介します。
7 つの既存のデータセットと比較して、VizWiz-SalientObject は最大 (つまり、32,000 の人間が注釈を付けた画像) であり、顕著なオブジェクト (つまり、画像の 68\%) 内のテキストの普及率が高く、占める顕著なオブジェクトを含む独自の特性が含まれています。
画像のより大きな比率 (つまり、平均で $\sim$50\% のカバレッジ)。
データセットで 7 つの最新の顕著なオブジェクト検出方法のベンチマークを行ったところ、これらのメソッドは、大きく、境界がそれほど複雑ではなく、テキストが不足している顕著なオブジェクトを含む画像や、低品質の画像で最も苦労することがわかりました。
https://vizwiz.org/tasks-and-datasets/salient-object でデータセットを公開して共有することで、より広いコミュニティに新しいデータセットの課題に取り組むよう呼びかけます。

要約(オリジナル)

Salient object detection is the task of producing a binary mask for an image that deciphers which pixels belong to the foreground object versus background. We introduce a new salient object detection dataset using images taken by people who are visually impaired who were seeking to better understand their surroundings, which we call VizWiz-SalientObject. Compared to seven existing datasets, VizWiz-SalientObject is the largest (i.e., 32,000 human-annotated images) and contains unique characteristics including a higher prevalence of text in the salient objects (i.e., in 68\% of images) and salient objects that occupy a larger ratio of the images (i.e., on average, $\sim$50\% coverage). We benchmarked seven modern salient object detection methods on our dataset and found they struggle most with images featuring salient objects that are large, have less complex boundaries, and lack text as well as for lower quality images. We invite the broader community to work on our new dataset challenge by publicly sharing the dataset at https://vizwiz.org/tasks-and-datasets/salient-object .

arxiv情報

著者 Jarek Reynolds,Chandra Kanth Nagesh,Danna Gurari
発行日 2023-01-12 22:33:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク