Fairness in Image Search: A Study of Occupational Stereotyping in Image Retrieval and its Debiasing

要約

マルチモーダル検索エンジンは近年大幅に成長し広く使用されており、インターネットで 2 番目に一般的に使用されています。
検索エンジン システムはさまざまなサービスを提供しますが、「百聞は一見に如かず」という格言があるように、最近では画像検索分野が情報検索コミュニティの焦点となっています。
Google などの人気のある検索エンジンは画像検索の精度と機敏性に優れていますが、その検索結果が性別、言語、人口動態、社会文化的側面、固定観念の観点から偏ることがあるかどうかについては議論が続いています。
このバイアスの可能性は、個人の認識に重大な影響を及ぼし、その視点に影響を与える可能性があります。
この論文では、キーワードベースの画像検索に焦点を当てた、Web 検索におけるバイアスと公平性に関する研究を紹介します。
まず、検索システムに存在する数種類のバイアスと、それらを軽減することがなぜ重要なのかについて説明します。
私たちは研究の対象を、画像検索における一般的な公平性の問題である、画像検索における職業上の固定観念の評価と軽減に絞り込みます。
固定観念の評価では、性別を指標とします。
画像から性別を識別するためのさまざまなオープンソース API や独自の API を調査します。
これらを用いて、いくつかの職業キーワードで得られた画像検索結果の上位にあるジェンダーバイアスの程度を調べます。
バイアスを軽減するために、(a) キーワードと検索結果の関連性、および (b) 識別された性別に関する公平性を最適化する、公平性を意識した再ランキング アルゴリズムを提案します。
10 の職業キーワードに対して取得された上位 100 枚の画像で実験し、ランダムな再ランキングと関連性に基づく再ランキングをベースラインとして考慮します。
私たちの実験結果は、公平性を意識した再ランキング アルゴリズムにより、ベースラインよりも優れた公平性スコアと競合関連性スコアを備えたランキングが生成されることを示しています。

要約(オリジナル)

Multi-modal search engines have experienced significant growth and widespread use in recent years, making them the second most common internet use. While search engine systems offer a range of services, the image search field has recently become a focal point in the information retrieval community, as the adage goes, ‘a picture is worth a thousand words’. Although popular search engines like Google excel at image search accuracy and agility, there is an ongoing debate over whether their search results can be biased in terms of gender, language, demographics, socio-cultural aspects, and stereotypes. This potential for bias can have a significant impact on individuals’ perceptions and influence their perspectives. In this paper, we present our study on bias and fairness in web search, with a focus on keyword-based image search. We first discuss several kinds of biases that exist in search systems and why it is important to mitigate them. We narrow down our study to assessing and mitigating occupational stereotypes in image search, which is a prevalent fairness issue in image retrieval. For the assessment of stereotypes, we take gender as an indicator. We explore various open-source and proprietary APIs for gender identification from images. With these, we examine the extent of gender bias in top-tanked image search results obtained for several occupational keywords. To mitigate the bias, we then propose a fairness-aware re-ranking algorithm that optimizes (a) relevance of the search result with the keyword and (b) fairness w.r.t genders identified. We experiment on 100 top-ranked images obtained for 10 occupational keywords and consider random re-ranking and re-ranking based on relevance as baselines. Our experimental results show that the fairness-aware re-ranking algorithm produces rankings with better fairness scores and competitive relevance scores than the baselines.

arxiv情報

著者 Swagatika Dash
発行日 2023-08-22 16:09:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV, cs.IR パーマリンク