Data Augmentation in Earth Observation: A Diffusion Model Approach

要約

高品質の地球観測(EO)画像は、正確な分析とセクター全体で情報に基づいた意思決定に不可欠です。
ただし、大気の状態、季節の変動、および限られた地理的カバレッジによって引き起こされるデータ不足は、EOの人工知能(AI)の効果的な適用を妨げます。
基本的なパラメーター化された画像変換に依存する従来のデータ増強技術は、多くの場合、主要なセマンティック軸に十分な多様性を導入できません。
これらの軸には、雪や洪水などの自然な変化、都市化や道路などの人間の影響、およびEOアプリケーションのAIモデルの精度を制限する山火事や嵐などの災害が含まれます。
これに対処するために、拡散モデルを統合してセマンティックの多様性を高める4段階のデータ増強アプローチを提案します。
私たちの方法では、指導の生成にメタプロムプト、豊富なキャプション、EO固有の拡散モデルの微調整、および反復データ増強のためのビジョン言語モデルを採用しています。
4つの拡張技術を使用した広範な実験は、私たちのアプローチが確立された方法を一貫してパフォーマンスし、意味的に多様なEO画像を生成し、AIモデルのパフォーマンスを改善することを示しています。

要約(オリジナル)

High-quality Earth Observation (EO) imagery is essential for accurate analysis and informed decision making across sectors. However, data scarcity caused by atmospheric conditions, seasonal variations, and limited geographical coverage hinders the effective application of Artificial Intelligence (AI) in EO. Traditional data augmentation techniques, which rely on basic parameterized image transformations, often fail to introduce sufficient diversity across key semantic axes. These axes include natural changes such as snow and floods, human impacts like urbanization and roads, and disasters such as wildfires and storms, which limits the accuracy of AI models in EO applications. To address this, we propose a four-stage data augmentation approach that integrates diffusion models to enhance semantic diversity. Our method employs meta-prompts for instruction generation, vision-language models for rich captioning, EO-specific diffusion model fine-tuning, and iterative data augmentation. Extensive experiments using four augmentation techniques demonstrate that our approach consistently outperforms established methods, generating semantically diverse EO images and improving AI model performance.

arxiv情報

著者 Tiago Sousa,Benoît Ries,Nicolas Guelfi
発行日 2025-03-26 16:23:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.SE, I.2.m パーマリンク