A path in regression Random Forest looking for spatial dependence: a taxonomy and a systematic review

要約

ランダム フォレスト (RF) は、非線形性が強い場合でも、応答変数と予測子の間の関係を柔軟にモデル化できるため、いくつかの分野で適用されるよく知られたデータ駆動型アルゴリズムです。
環境アプリケーションでは、関心のある現象が、標準バージョンの RF によって明示的に考慮されていない空間的および/または時間的依存性を示すことがよくあります。
この作業では、空間情報を回帰 RF に含めようとする時期 (前処理、処理中、および/または後処理) に従って戦略を分類するための分類法を提案します。
さらに、システマティック レビューとメタ分析 (PRISMA) の優先レポート項目によって提供される基準に基づいて、システマティック レビューを提供し、回帰 RF を空間依存データに「調整」するために採用された最新の戦略を分類します。
後者は、特定のトピックに関する既存の文献をさまざまな情報源から収集して処理するための再現可能な方法論で構成されています。
PRISMA はクエリで始まり、レビューする一連の科学文書で終わります。2022 年 10 月 25 日 $^{th}$ にオンライン クエリを実行し、最終的に 32 の文書がレビューのために検討されました。
採用されている方法論的戦略と、32 の科学文書で考慮されている応用分野が説明され、議論されています。

要約(オリジナル)

Random Forest (RF) is a well-known data-driven algorithm applied in several fields thanks to its flexibility in modeling the relationship between the response variable and the predictors, also in case of strong non-linearities. In environmental applications, it often occurs that the phenomenon of interest may present spatial and/or temporal dependence that is not taken explicitly into account by RF in its standard version. In this work, we propose a taxonomy to classify strategies according to when (Pre-, In- and/or Post-processing) they try to include the spatial information into regression RF. Moreover, we provide a systematic review and classify the most recent strategies adopted to ‘adjust’ regression RF to spatially dependent data, based on the criteria provided by the Preferred Reporting Items for Systematic reviews and Meta-Analysis (PRISMA). The latter consists of a reproducible methodology for collecting and processing existing literature on a specified topic from different sources. PRISMA starts with a query and ends with a set of scientific documents to review: we performed an online query on the 25$^{th}$ October 2022 and, in the end, 32 documents were considered for review. The employed methodological strategies and the application fields considered in the 32 scientific documents are described and discussed.

arxiv情報

著者 Luca Patelli,Michela Cameletti,Natalia Golini,Rosaria Ignaccolo
発行日 2023-03-08 16:34:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP, stat.ML パーマリンク