GeoAI Reproducibility and Replicability: a computational and spatial perspective

要約

GeoAI は、空間理論とデータを最先端の AI モデルと組み合わせて、斬新なデータ駆動型の方法で地理空間問題に対処する、エキサイティングな学際的研究領域として浮上しています。
GeoAI 研究は GIScience 文献で盛んに行われてきましたが、研究結果の再利用性、信頼性、科学的厳密性を決定する基本原則である再現性と複製可能性 (R&R) については、ほとんど議論されていません。
このペーパーは、計算と空間の両方の観点からこのトピックを詳細に分析することを目的としています。
まず、GeoAI 研究を再現するための主な目標を分類します。すなわち、検証 (再現性)、類似または新しい問題を解決する方法の学習と適応 (再現性)、研究結果の一般化可能性の検討 (再現性) です。
これらの各目標には、GeoAI に対するさまざまなレベルの理解と、その成功を確実にするためのさまざまな方法が必要です。
次に、GeoAI 研究における R&R の欠如を引き起こす可能性のある要因について、(1) トレーニング データの選択と使用、および (1) トレーニング データの選択と使用に重点を置いて説明します。
(2) GeoAI モデルの設計、トレーニング、展開、推論プロセスに存在する不確実性。
そしてより重要なことは、(3) 地理空間データとプロセスに固有の空間的異質性です。
例として深層学習ベースの画像解析タスクを使用して、さまざまな要因によって引き起こされる結果の不確実性と空間的分散を示します。
この調査結果は、GeoAI 研究の空間的再現性を定量化する際に、知識の共有と、空間的自己相関と空間的異質性を考慮した「再現性マップ」の生成の重要性を改めて示しています。

要約(オリジナル)

GeoAI has emerged as an exciting interdisciplinary research area that combines spatial theories and data with cutting-edge AI models to address geospatial problems in a novel, data-driven manner. While GeoAI research has flourished in the GIScience literature, its reproducibility and replicability (R&R), fundamental principles that determine the reusability, reliability, and scientific rigor of research findings, have rarely been discussed. This paper aims to provide an in-depth analysis of this topic from both computational and spatial perspectives. We first categorize the major goals for reproducing GeoAI research, namely, validation (repeatability), learning and adapting the method for solving a similar or new problem (reproducibility), and examining the generalizability of the research findings (replicability). Each of these goals requires different levels of understanding of GeoAI, as well as different methods to ensure its success. We then discuss the factors that may cause the lack of R&R in GeoAI research, with an emphasis on (1) the selection and use of training data; (2) the uncertainty that resides in the GeoAI model design, training, deployment, and inference processes; and more importantly (3) the inherent spatial heterogeneity of geospatial data and processes. We use a deep learning-based image analysis task as an example to demonstrate the results’ uncertainty and spatial variance caused by different factors. The findings reiterate the importance of knowledge sharing, as well as the generation of a ‘replicability map’ that incorporates spatial autocorrelation and spatial heterogeneity into consideration in quantifying the spatial replicability of GeoAI research.

arxiv情報

著者 Wenwen Li,Chia-Yu Hsu,Sizhe Wang,Peter Kedron
発行日 2024-04-22 17:53:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク