Geospatial Disparities: A Case Study on Real Estate Prices in Paris

要約

トラッカーの普及の増加、IoT センサーの増加、コンピューティング能力のコストの低下により、地理空間情報は現代の予測モデルにおいて極めて重要な役割を果たすようになりました。
地理空間データは、予後予測のパフォーマンスを向上させる一方で、多くの歴史的な社会経済パターンを永続させる可能性もあり、社会に不釣り合いな影響を与える偏見や排他的な慣行の復活に対する懸念を引き起こしています。
これに対処するため、私たちの論文では、特にアルゴリズムがより複雑になり、解釈しにくくなっている中で、予測モデルにおけるそのようなバイアスや校正誤差を特定し、修正することが極めて重要であることを強調しています。
地理空間情報の粒度が高まると、異なる地理的縮尺を選択するとレッドライニングや立ち入り禁止区域設定に似た不均衡が悪化する可能性があるため、倫理的懸念がさらに生じます。
これらの問題に対処するために、地理空間データから生じるバイアスを特定し、軽減するためのツールキットを提案します。
古典的な公平性の定義を拡張して、バイナリ分類の焦点から逸脱して、空間属性を伴う順序回帰ケースを組み込みます。
この拡張機能により、データ集約レベルに起因する差異を測定できるようになり、干渉の少ない修正アプローチが提唱されます。
パリの不動産データセットを使用した方法論を例証し、実用的なアプリケーションを紹介し、公平性と調整手段のために地理的な集約レベルを選択することの意味を精査します。

要約(オリジナル)

Driven by an increasing prevalence of trackers, ever more IoT sensors, and the declining cost of computing power, geospatial information has come to play a pivotal role in contemporary predictive models. While enhancing prognostic performance, geospatial data also has the potential to perpetuate many historical socio-economic patterns, raising concerns about a resurgence of biases and exclusionary practices, with their disproportionate impacts on society. Addressing this, our paper emphasizes the crucial need to identify and rectify such biases and calibration errors in predictive models, particularly as algorithms become more intricate and less interpretable. The increasing granularity of geospatial information further introduces ethical concerns, as choosing different geographical scales may exacerbate disparities akin to redlining and exclusionary zoning. To address these issues, we propose a toolkit for identifying and mitigating biases arising from geospatial data. Extending classical fairness definitions, we incorporate an ordinal regression case with spatial attributes, deviating from the binary classification focus. This extension allows us to gauge disparities stemming from data aggregation levels and advocates for a less interfering correction approach. Illustrating our methodology using a Parisian real estate dataset, we showcase practical applications and scrutinize the implications of choosing geographical aggregation levels for fairness and calibration measures.

arxiv情報

著者 Agathe Fernandes Machado,François Hu,Philipp Ratz,Ewen Gallic,Arthur Charpentier
発行日 2024-01-29 14:53:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG パーマリンク