Exploring Text-Guided Single Image Editing for Remote Sensing Images

要約

人工知能生成コンテンツ (AIGC) テクノロジーは、リモート センシング領域、特に画像生成の領域に大きな影響を与えています。
しかし、同様に重要な研究分野であるリモートセンシング画像編集は、十分な注目を集めていません。
意味的な相関関係を得るために広範なテキストと画像のペア データに依存する自然画像のテキストガイド付き編集とは異なり、リモート センシング画像編集のアプリケーション シナリオは森林火災などの極端な場合が多いため、十分なペアのサンプルを取得することが困難です。

同時に、リモート センシングのセマンティクスの欠如とテキストの曖昧さも、リモート センシング分野での画像編集のさらなる応用を制限します。
上記の問題を解決するために、本レターでは、テキストガイダンスによる安定かつ制御可能なリモートセンシング画像編集を実現するための拡散ベースの方法を提案する。
私たちの方法では、多数のペア画像の使用を回避し、単一の画像のみを使用して良好な画像編集結果を得ることができます。
CLIPスコアと主観的評価指標を含む定量的評価システムは、我々の方法が既存の画像編集モデルよりもリモートセンシング画像に対する編集効果が優れていることを示しています。

要約(オリジナル)

Artificial Intelligence Generative Content (AIGC) technologies have significantly influenced the remote sensing domain, particularly in the realm of image generation. However, remote sensing image editing, an equally vital research area, has not garnered sufficient attention. Different from text-guided editing in natural images, which relies on extensive text-image paired data for semantic correlation, the application scenarios of remote sensing image editing are often extreme, such as forest on fire, so it is difficult to obtain sufficient paired samples. At the same time, the lack of remote sensing semantics and the ambiguity of text also restrict the further application of image editing in remote sensing field. To solve above problems, this letter proposes a diffusion based method to fulfill stable and controllable remote sensing image editing with text guidance. Our method avoids the use of a large number of paired image, and can achieve good image editing results using only a single image. The quantitative evaluation system including CLIP score and subjective evaluation metrics shows that our method has better editing effect on remote sensing images than the existing image editing model.

arxiv情報

著者 Fangzhou Han,Lingyu Si,Hongwei Dong,Lamei Zhang,Hao Chen,Bo Du
発行日 2024-05-09 13:45:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク