Fairness in Image Search: A Study of Occupational Stereotyping in Image Retrieval and its Debiasing


マルチモーダル検索エンジンは近年大幅に成長し広く使用されており、インターネットで 2 番目に一般的に使用されています。
検索エンジン システムはさまざまなサービスを提供しますが、「百聞は一見に如かず」という格言があるように、最近では画像検索分野が情報検索コミュニティの焦点となっています。
Google などの人気のある検索エンジンは画像検索の精度と機敏性に優れていますが、その検索結果が性別、言語、人口動態、社会文化的側面、固定観念の観点から偏ることがあるかどうかについては議論が続いています。
この論文では、キーワードベースの画像検索に焦点を当てた、Web 検索におけるバイアスと公平性に関する研究を紹介します。
画像から性別を識別するためのさまざまなオープンソース API や独自の API を調査します。
バイアスを軽減するために、(a) キーワードと検索結果の関連性、および (b) 識別された性別に関する公平性を最適化する、公平性を意識した再ランキング アルゴリズムを提案します。
10 の職業キーワードに対して取得された上位 100 枚の画像で実験し、ランダムな再ランキングと関連性に基づく再ランキングをベースラインとして考慮します。
私たちの実験結果は、公平性を意識した再ランキング アルゴリズムにより、ベースラインよりも優れた公平性スコアと競合関連性スコアを備えたランキングが生成されることを示しています。


Multi-modal search engines have experienced significant growth and widespread use in recent years, making them the second most common internet use. While search engine systems offer a range of services, the image search field has recently become a focal point in the information retrieval community, as the adage goes, ‘a picture is worth a thousand words’. Although popular search engines like Google excel at image search accuracy and agility, there is an ongoing debate over whether their search results can be biased in terms of gender, language, demographics, socio-cultural aspects, and stereotypes. This potential for bias can have a significant impact on individuals’ perceptions and influence their perspectives. In this paper, we present our study on bias and fairness in web search, with a focus on keyword-based image search. We first discuss several kinds of biases that exist in search systems and why it is important to mitigate them. We narrow down our study to assessing and mitigating occupational stereotypes in image search, which is a prevalent fairness issue in image retrieval. For the assessment of stereotypes, we take gender as an indicator. We explore various open-source and proprietary APIs for gender identification from images. With these, we examine the extent of gender bias in top-tanked image search results obtained for several occupational keywords. To mitigate the bias, we then propose a fairness-aware re-ranking algorithm that optimizes (a) relevance of the search result with the keyword and (b) fairness w.r.t genders identified. We experiment on 100 top-ranked images obtained for 10 occupational keywords and consider random re-ranking and re-ranking based on relevance as baselines. Our experimental results show that the fairness-aware re-ranking algorithm produces rankings with better fairness scores and competitive relevance scores than the baselines.


著者 Swagatika Dash
発行日 2023-08-22 16:09:59+00:00
