Semantic Image Completion and Enhancement using GANs

要約

セマンティック修復または画像補完は、画像セマンティクスに基づいて画像内の任意の大きな欠落領域を推測するタスクを指します。
画像ピクセルの予測には高レベルのコンテキストの指示が必要なため、データ破損の修正や入力画像からオブジェクト全体を削除することを重視する画像補完よりもはるかに困難になります。
一方、画像強調では、画像の詳細の大部分を維持しながら、画像から不要なノイズやぼやけを除去しようとします。
効率的な画像の補完および強化モデルでは、画像内の破損した領域やマスクされた領域を回復し、画像をさらに改良して出力画像の品質を向上させることができる必要があります。
Generative Adversarial Networks (GAN) は、画像を完成させるタスクに役立つことが判明しました。
この章では、基盤となる GAN アーキテクチャと、それを画像補完タスクに使用する方法について説明します。

要約(オリジナル)

Semantic inpainting or image completion alludes to the task of inferring arbitrary large missing regions in images based on image semantics. Since the prediction of image pixels requires an indication of high-level context, this makes it significantly tougher than image completion, which is often more concerned with correcting data corruption and removing entire objects from the input image. On the other hand, image enhancement attempts to eliminate unwanted noise and blur from the image, along with sustaining most of the image details. Efficient image completion and enhancement model should be able to recover the corrupted and masked regions in images and then refine the image further to increase the quality of the output image. Generative Adversarial Networks (GAN), have turned out to be helpful in picture completion tasks. In this chapter, we will discuss the underlying GAN architecture and how they can be used used for image completion tasks.

arxiv情報

著者 Priyansh Saxena,Raahat Gupta,Akshat Maheshwari,Saumil Maheshwari
発行日 2023-07-27 10:12:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク