Extracting the U.S. building types from OpenStreetMap data

要約

建物の種類の情報は、人口推計、交通計画、都市計画、緊急時対応のアプリケーションにとって非常に重要です。
このようなデータは不可欠ではありますが、多くの場合、すぐには入手できません。
この問題を軽減するために、この作業では、米国全土をカバーする住宅/非住宅の建物分類を提供することで包括的なデータセットを作成しました。
私たちは、建物のフットプリントと利用可能な OpenStreetMap 情報に基づいて建物のタイプを分類する教師なし機械学習手法を提案および利用します。
分類結果は、米国の一部の郡の信頼できるグラウンド トゥルース データを使用して検証されます。この検証では、非住宅用建物の分類では高い精度が示され、住宅用建物では高い再現率が示されています。
データセットから物置やガレージを削除するなど、分類の品質を向上させるためのさまざまなアプローチを特定しました。
さらに、誤分類を分析したところ、主に OSM 内のメタデータの欠落または不足が原因であることが判明しました。
この作業の主な成果は、67,705,475 の建物を分類したデータセットです。
私たちは、このデータが都市計画者や交通計画者を含む科学界にとって価値があることを願っています。

要約(オリジナル)

Building type information is crucial for population estimation, traffic planning, urban planning, and emergency response applications. Although essential, such data is often not readily available. To alleviate this problem, this work creates a comprehensive dataset by providing residential/non-residential building classification covering the entire United States. We propose and utilize an unsupervised machine learning method to classify building types based on building footprints and available OpenStreetMap information. The classification result is validated using authoritative ground truth data for select counties in the U.S. The validation shows a high precision for non-residential building classification and a high recall for residential buildings. We identified various approaches to improving the quality of the classification, such as removing sheds and garages from the dataset. Furthermore, analyzing the misclassifications revealed that they are mainly due to missing and scarce metadata in OSM. A major result of this work is the resulting dataset of classifying 67,705,475 buildings. We hope that this data is of value to the scientific community, including urban and transportation planners.

arxiv情報

著者 Henrique F. de Arruda,Sandro M. Reia,Shiyang Ruan,Kuldip S. Atwal,Hamdi Kavak,Taylor Anderson,Dieter Pfoser
発行日 2024-09-09 15:05:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG, cs.SI パーマリンク