Coverage and Bias of Street View Imagery in Mapping the Urban Environment

要約

ストリートビュー画像(SVI)は、都市研究において貴重なデータ形式として登場し、都市環境をマッピングし、感知する新しい方法を可能にしている。しかし、SVIの代表性、品質、信頼性に関する基本的な懸念は、まだ十分に解明されていない。例えば、このようなデータで都市をどの程度捉えることができるのか、データのギャップはバイアスにつながるのか、などである。本研究は、空間データの品質と都市分析の交差点に位置し、都市環境におけるSVIの要素レベルのカバレッジを推定する斬新で効果的な手法を提案することによって、これらの懸念に対処するものである。この方法は、SVIとターゲット要素間の位置関係、および物理的障害物の影響を統合する。データの質の領域をSVIに拡大し、完全性と頻度の次元に着目して、カバレッジの程度を評価する指標システムを導入する。ロンドンをケーススタディとして、建物のファサードを例に、都市環境要素をカバーし表現するSVIの能力における潜在的な偏りを特定するために3つの実験を行った。その結果、都市の道路網に沿って高い利用可能性があるにもかかわらず、グーグルストリートビューはケーススタディ地域の建物の62.4%しかカバーしていないことがわかった。建物1棟あたりの平均ファサード被覆率は12.4%である。SVIは非住宅建築物を過剰にカバーする傾向があり、その結果、偏った分析が行われる可能性がある。この研究はまた、異なるデータ収集方法におけるSVIのカバー率のばらつきを明らかにし、SVI収集に最適なサンプリング間隔50〜60mを提案している。調査結果は、SVIが貴重な洞察を提供する一方で、万能薬ではないことを示唆している。都市研究におけるSVIの応用には、信頼できる結果を確実にするために、データの網羅率と要素レベルの代表性を慎重に検討する必要がある。

要約(オリジナル)

Street View Imagery (SVI) has emerged as a valuable data form in urban studies, enabling new ways to map and sense urban environments. However, fundamental concerns regarding the representativeness, quality, and reliability of SVI remain underexplored, e.g. to what extent can cities be captured by such data and do data gaps result in bias. This research, positioned at the intersection of spatial data quality and urban analytics, addresses these concerns by proposing a novel and effective method to estimate SVI’s element-level coverage in the urban environment. The method integrates the positional relationships between SVI and target elements, as well as the impact of physical obstructions. Expanding the domain of data quality to SVI, we introduce an indicator system that evaluates the extent of coverage, focusing on the completeness and frequency dimensions. Taking London as a case study, three experiments are conducted to identify potential biases in SVI’s ability to cover and represent urban environmental elements, using building facades as an example. It is found that despite their high availability along urban road networks, Google Street View covers only 62.4% of buildings in the case study area. The average facade coverage per building is 12.4%. SVI tends to over-represent non-residential buildings, thus possibly resulting in biased analyses, and its coverage of environmental elements is position-dependent. The research also highlights the variability of SVI coverage under different data acquisition practices and proposes an optimal sampling interval range of 50-60 m for SVI collection. The findings suggest that while SVI offers valuable insights, it is no panacea – its application in urban research requires careful consideration of data coverage and element-level representativeness to ensure reliable results.

arxiv情報

著者 Zicheng Fan,Chen-Chieh Feng,Filip Biljecki
発行日 2025-01-03 15:18:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG パーマリンク