要約
視覚障害者またはロービジョン (BLV) のある人が、自分が撮った写真を共有する場合、個人情報を共有するリスクが高くなります。
プライバシーの保護に役立つテクノロジーの開発を促進するために、プライベート コンテンツを表示する視覚障害のある人々を起源とする初のローカリゼーション データセットである BIV-Priv-Seg を導入します。
これには、16 のプライベート オブジェクト カテゴリのセグメンテーション注釈が付いた 1,028 枚の画像が含まれています。
まず BIV-Priv-Seg の特徴を評価し、次にデータセット内のプライベート コンテンツを見つけるための最新モデルのパフォーマンスを評価します。
最新のモデルは、目立たず、小さく、テキストのないプライベート オブジェクトの位置を特定したり、画像にプライベート コンテンツが存在しない場合を認識したりすることに最も苦労していることがわかりました。
https://vizwiz.org/tasks-and-datasets/object-localization で新しいデータセットを評価サーバーと共有することで、将来の拡張を容易にします。
要約(オリジナル)
Individuals who are blind or have low vision (BLV) are at a heightened risk of sharing private information if they share photographs they have taken. To facilitate developing technologies that can help preserve privacy, we introduce BIV-Priv-Seg, the first localization dataset originating from people with visual impairments that shows private content. It contains 1,028 images with segmentation annotations for 16 private object categories. We first characterize BIV-Priv-Seg and then evaluate modern models’ performance for locating private content in the dataset. We find modern models struggle most with locating private objects that are not salient, small, and lack text as well as recognizing when private content is absent from an image. We facilitate future extensions by sharing our new dataset with the evaluation server at https://vizwiz.org/tasks-and-datasets/object-localization.
arxiv情報
著者 | Yu-Yun Tseng,Tanusree Sharma,Lotus Zhang,Abigale Stangl,Leah Findlater,Yang Wang,Danna Gurari Yu-Yun Tseng,Tanusree Sharma,Lotus Zhang,Abigale Stangl,Leah Findlater,Yang Wang,Danna Gurari |
発行日 | 2024-07-25 17:57:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google