In the Search for Optimal Multi-view Learning Models for Crop Classification with Global Remote Sensing Data

要約

農地の研究と分析は、その動的かつ不均一な成長挙動のため、困難な作業です。
通常、推定のためにさまざまなデータソースを収集できます。
深層学習モデルは作物の分類タスクでは優れていることが証明されていますが、マルチビュー学習 (MVL) と呼ばれる複数の入力を処理する場合には大きな課題に直面しています。
MVL シナリオで使用されるメソッドは、エンコーダー アーキテクチャ、融合戦略、最適化手法に基づいて構築できます。
文献では主にローカル領域に特定のエンコーダ アーキテクチャを使用することに焦点が当てられており、MVL 方法論の他のコンポーネントについての深い検討が欠けています。
対照的に、私たちは融合戦略とエンコーダーアーキテクチャの同時選択を調査し、地球規模の耕作地と作物の種類の分類を評価します。
MVL 手法で可能な構成として、さまざまな 5 つの融合戦略 (入力、特徴、決定、アンサンブル、ハイブリッド) と 5 つの時間エンコーダー (LSTM、GRU、TempCNN、TAE、L-TAE) を使用します。
検証には CropHarvest データセットを使用します。このデータセットは、入力データとして光学情報、レーダー情報、気象時系列情報、地形情報を提供します。
ラベル付きサンプルの数が限られているシナリオでは、すべてのケースに固有の構成では不十分であることがわかりました。
代わりに、エンコーダとフュージョン戦略を含め、特殊な組み合わせを細心の注意を払って探す必要があります。
この検索プロセスを効率化するには、特定の融合戦略に合わせた最適なエンコーダ アーキテクチャを特定し、分類タスクに最適な融合戦略を決定することをお勧めします。
私たちは、MVL 方法論を通じて作物の分類を研究する研究者に方法論的なフレームワークを提供します。

要約(オリジナル)

Studying and analyzing cropland is a difficult task due to its dynamic and heterogeneous growth behavior. Usually, diverse data sources can be collected for its estimation. Although deep learning models have proven to excel in the crop classification task, they face substantial challenges when dealing with multiple inputs, named Multi-View Learning (MVL). The methods used in the MVL scenario can be structured based on the encoder architecture, the fusion strategy, and the optimization technique. The literature has primarily focused on using specific encoder architectures for local regions, lacking a deeper exploration of other components in the MVL methodology. In contrast, we investigate the simultaneous selection of the fusion strategy and encoder architecture, assessing global-scale cropland and crop-type classifications. We use a range of five fusion strategies (Input, Feature, Decision, Ensemble, Hybrid) and five temporal encoders (LSTM, GRU, TempCNN, TAE, L-TAE) as possible configurations in the MVL method. We use the CropHarvest dataset for validation, which provides optical, radar, weather time series, and topographic information as input data. We found that in scenarios with a limited number of labeled samples, a unique configuration is insufficient for all the cases. Instead, a specialized combination should be meticulously sought, including an encoder and fusion strategy. To streamline this search process, we suggest identifying the optimal encoder architecture tailored for a particular fusion strategy, and then determining the most suitable fusion strategy for the classification task. We provide a methodological framework for researchers exploring crop classification through an MVL methodology.

arxiv情報

著者 Francisco Mena,Diego Arenas,Andreas Dengel
発行日 2024-09-04 11:14:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク