Control Color: Multimodal Diffusion-based Interactive Image Colorization


これらの問題を解決するために、事前にトレーニングされた安定拡散 (SD) モデルを活用するマルチモーダルな色付け手法であるコントロール カラー (CtrlColor) を導入し、高度に制御可能なインタラクティブな画像の色付けで有望な機能を提供します。
この研究では、無条件および条件付きの画像カラー化 (テキスト プロンプト、ストローク、見本) の両方に取り組み、統一されたフレームワーク内でカラー オーバーフローと不正確なカラーに対処することを目的としています。
条件としてテキスト プロンプトを受け入れることとは別に、これらの設計により、アプローチに多用途性が追加されます。


Despite the existence of numerous colorization methods, several limitations still exist, such as lack of user interaction, inflexibility in local colorization, unnatural color rendering, insufficient color variation, and color overflow. To solve these issues, we introduce Control Color (CtrlColor), a multi-modal colorization method that leverages the pre-trained Stable Diffusion (SD) model, offering promising capabilities in highly controllable interactive image colorization. While several diffusion-based methods have been proposed, supporting colorization in multiple modalities remains non-trivial. In this study, we aim to tackle both unconditional and conditional image colorization (text prompts, strokes, exemplars) and address color overflow and incorrect color within a unified framework. Specifically, we present an effective way to encode user strokes to enable precise local color manipulation and employ a practical way to constrain the color distribution similar to exemplars. Apart from accepting text prompts as conditions, these designs add versatility to our approach. We also introduce a novel module based on self-attention and a content-guided deformable autoencoder to address the long-standing issues of color overflow and inaccurate coloring. Extensive comparisons show that our model outperforms state-of-the-art image colorization methods both qualitatively and quantitatively.


著者 Zhexin Liang,Zhaochen Li,Shangchen Zhou,Chongyi Li,Chen Change Loy
発行日 2024-02-16 17:51:13+00:00
