要約
土壌有機炭素(SOC)モニタリングは、環境共変量に基づいて代表的なフィールドサンプリング場所の選択に依存することがよくあります。
SOCサンプリングの代表性を高めるために、条件付けされたラテンハイパーキューブサンプリング(CLHS)を使用した監視されていない機械学習技術であるスペクトルクラスタリングを統合する新しいハイブリッド方法論を提案します。
私たちのアプローチでは、スペクトルクラスタリングは、多変量共変量データを使用して調査エリアを$ K $均質ゾーンに分割し、その後、各ゾーン内にCLHSを適用して、環境条件の完全な多様性を集合的にキャプチャするサンプリング場所を選択します。
このハイブリッドスペクトルCLHSメソッドにより、マイナーだが重要な環境クラスターでさえサンプリングされ、そのような領域を見落とすことができるバニラCLHの重要な制限に対処することが保証されます。
実際のSOCマッピングデータセットで、Spectral-CLHSが標準のCLHよりも共変量特徴空間と空間的不均一性のより均一なカバーを提供することを示します。
この改善されたサンプリング設計は、機械学習モデルのよりバランスの取れたトレーニングデータを提供することにより、より正確なSOC予測をもたらす可能性があります。
要約(オリジナル)
Soil organic carbon (SOC) monitoring often relies on selecting representative field sampling locations based on environmental covariates. We propose a novel hybrid methodology that integrates spectral clustering – an unsupervised machine learning technique with conditioned Latin hypercube sampling (cLHS) to enhance the representativeness of SOC sampling. In our approach, spectral clustering partitions the study area into $K$ homogeneous zones using multivariate covariate data, and cLHS is then applied within each zone to select sampling locations that collectively capture the full diversity of environmental conditions. This hybrid spectral-cLHS method ensures that even minor but important environmental clusters are sampled, addressing a key limitation of vanilla cLHS which can overlook such areas. We demonstrate on a real SOC mapping dataset that spectral-cLHS provides more uniform coverage of covariate feature space and spatial heterogeneity than standard cLHS. This improved sampling design has the potential to yield more accurate SOC predictions by providing better-balanced training data for machine learning models.
arxiv情報
著者 | Weiying Zhao,Aleksei Unagaev,Natalia Efremova |
発行日 | 2025-06-16 16:20:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google