Self-supervised learning unveils change in urban housing from street-level images


街頭レベルの画像に適用された深層学習ベースのコンピューター ビジョン手法は、社会経済的および環境的不平等の測定には成功していますが、時間とともに変化するラベルが利用できないことが多いため、都市の変化を追跡するために時間画像を完全に活用することはできませんでした。
私たちは、2008 年から 2021 年の間に撮影された 1,500 万枚の街路画像を使用して、ロンドンの変化を測定するために自己監視手法を使用しました。 Barlow Twins を新たに適応させた Street2Vec は、手動による注釈なしで季節や毎日の変化に影響されずに都市構造を埋め込みます。


Cities around the world face a critical shortage of affordable and decent housing. Despite its critical importance for policy, our ability to effectively monitor and track progress in urban housing is limited. Deep learning-based computer vision methods applied to street-level images have been successful in the measurement of socioeconomic and environmental inequalities but did not fully utilize temporal images to track urban change as time-varying labels are often unavailable. We used self-supervised methods to measure change in London using 15 million street images taken between 2008 and 2021. Our novel adaptation of Barlow Twins, Street2Vec, embeds urban structure while being invariant to seasonal and daily changes without manual annotations. It outperformed generic embeddings, successfully identified point-level change in London’s housing supply from street-level images, and distinguished between major and minor change. This capability can provide timely information for urban planning and policy decisions toward more liveable, equitable, and sustainable cities.


著者 Steven Stalder,Michele Volpi,Nicolas Büttner,Stephen Law,Kenneth Harttgen,Esra Suel
発行日 2023-09-21 13:18:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG パーマリンク