Quantifying Spatial Under-reporting Disparities in Resident Crowdsourcing

要約

現代の都市ガバナンスは、倒木や送電線などの問題を特定するために、クラウドソーシング (「共同制作」) に大きく依存しています。
主な懸念は、居住者が同じ割合で問題を報告していないことです。報告の不均一性は、インシデントにどれだけ迅速に対処できるかという下流の格差に直接つながります。
このような過小報告を測定することは、統計的に困難な作業です。定義上、報告されていないインシデントや、報告されたインシデントが最初に発生した時期は観察されないためです。
したがって、低い報告率と低いグラウンド トゥルース インシデント率を単純に区別することはできません。
外部のグラウンド トゥルース データを使用せずに、(異種の) レポート レートを特定する方法を開発します。
私たちの洞察では、同じインシデントに関する $\textit{duplicate}$ レポートのレートを利用して、インシデントが発生したかどうかを、発生後のレポート レートで明確にすることができます。
このアイデアを使用して、問題を標準的なポアソン率推定タスクに減らします。ただし、完全なインシデント レポート間隔も観察されていません。
ニューヨーク市公園・レクリエーション局に提出された 100,000 件を超える居住者レポートと、シカゴ運輸局および水管理局に作成された 900,000 件を超えるレポートにこの方法を適用し、その後でもレポート率にかなりの空間的格差があることを発見しました。
インシデントの特性を制御する – 一部の地域では、他の地域の 3 倍の速さで報告しています。
これらの空間的格差は、社会経済的特徴に対応しています。ニューヨーク市では、人口密度が高く、大卒者の割合、収入、白人の割合はすべて、報告率と正の相関があります。

要約(オリジナル)

Modern city governance relies heavily on crowdsourcing (‘co-production’) to identify problems such as downed trees and power lines. A major concern is that residents do not report problems at the same rates, with reporting heterogeneity directly translating to downstream disparities in how quickly incidents can be addressed. Measuring such under-reporting is a difficult statistical task, as, by definition, we do not observe incidents that are not reported or when reported incidents first occurred. Thus, low reporting rates and low ground-truth incident rates cannot be naively distinguished. We develop a method to identify (heterogeneous) reporting rates, without using external ground truth data. Our insight is that rates on $\textit{duplicate}$ reports about the same incident can be leveraged to disambiguate whether an incident has occurred with its reporting rate once it has occurred. Using this idea, we reduce the question to a standard Poisson rate estimation task — even though the full incident reporting interval is also unobserved. We apply our method to over 100,000 resident reports made to the New York City Department of Parks and Recreation and to over 900,000 reports made to the Chicago Department of Transportation and Department of Water Management, finding that there are substantial spatial disparities in reporting rates even after controlling for incident characteristics — some neighborhoods report three times as quickly as do others. These spatial disparities correspond to socio-economic characteristics: in NYC, higher population density, fraction of people with college degrees, income, and fraction of population that is White all positively correlate with reporting rates.

arxiv情報

著者 Zhi Liu,Nikhil Garg
発行日 2023-03-28 17:24:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG, stat.AP パーマリンク