要約
画像処理の分野では、既存の画像内に複雑な意味論的な変更を適用することが、依然として永続的な課題となっています。
この文書では、視点情報を統合して画像編集タスクの制御を強化する先駆的なフレームワークを紹介します。
既存のオブジェクト編集手法を調査することで、画像編集手法として満たすべき 3 つの重要な基準、一貫性、制御性、調和を抽出します。
これまでのアプローチとは対照的に、私たちの方法は、画像合成の課題に対処するための 3 つの要件をすべて満たすことに先駆けて取り組みます。
定量的評価と現代最先端の手法との定性的比較の両方を含む包括的な実験を通じて、当社のフレームワークが多面的に優れたパフォーマンスを発揮するという説得力のある証拠を提示します。
この研究は、画像合成技術を進歩させ、全体の構成の視覚的な一貫性を維持しながら正確なオブジェクトの変更を可能にする有望な道を確立します。
要約(オリジナル)
In the field of image processing, applying intricate semantic modifications within existing images remains an enduring challenge. This paper introduces a pioneering framework that integrates viewpoint information to enhance the control of image editing tasks. By surveying existing object editing methodologies, we distill three essential criteria, consistency, controllability, and harmony, that should be met for an image editing method. In contrast to previous approaches, our method takes the lead in satisfying all three requirements for addressing the challenge of image synthesis. Through comprehensive experiments, encompassing both quantitative assessments and qualitative comparisons with contemporary state-of-the-art methods, we present compelling evidence of our framework’s superior performance across multiple dimensions. This work establishes a promising avenue for advancing image synthesis techniques and empowering precise object modifications while preserving the visual coherence of the entire composition.
arxiv情報
著者 | Jinbin Bai,Zhen Dong,Aosong Feng,Xiao Zhang,Tian Ye,Kaicheng Zhou,Mike Zheng Shou |
発行日 | 2023-10-26 16:30:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google