Towards A Fairer Landmark Recognition Dataset

要約

我々は、世界的に公平な表現に焦点を当てて作成された、新しいランドマーク認識データセットを紹介する。従来の研究では、ウェブリポジトリからできるだけ多くの画像を収集することが提案されているが、我々はそのようなアプローチは偏ったデータにつながる可能性があると主張する。より包括的で公平なデータセットを作成するために、我々はまず、世界人口に対するランドマークの公平な関連性を定義することから始める。これらの関連性は、匿名化されたGoogle Mapsユーザーの投稿統計と投稿者の人口統計情報を組み合わせることで推定されます。我々は、既存のデータセットと比較して、より公平な世界のカバレッジをもたらす層別化のアプローチと分析を提示する。得られたデータセットは、Google Landmark Recognition and RetrievalChallenges 2021の一部として、コンピュータビジョンモデルの評価に使用されている。

要約(オリジナル)

We introduce a new landmark recognition dataset, which is created with a focus on fair worldwide representation. While previous work proposes to collect as many images as possible from web repositories, we instead argue that such approaches can lead to biased data. To create a more comprehensive and equitable dataset, we start by defining the fair relevance of a landmark to the world population. These relevances are estimated by combining anonymized Google Maps user contribution statistics with the contributors’ demographic information. We present a stratification approach and analysis which leads to a much fairer coverage of the world, compared to existing datasets. The resulting datasets are used to evaluate computer vision models as part of the the Google Landmark Recognition and RetrievalChallenges 2021.

arxiv情報

著者 Zu Kim,André Araujo,Bingyi Cao,Cam Askew,Jack Sim,Mike Green,N’Mah Fodiatu Yilla,Tobias Weyand
発行日 2022-06-06 15:36:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク