要約
この論文では、従来の回帰ベースのタスクを生成モデリングの課題として再定義する、画像マット化の革新的なアプローチを紹介します。
私たちの方法は、事前に訓練された広範な知識で強化された潜在拡散モデルの機能を利用して、マットプロセスを規則化します。
私たちは、モデルに優れた解像度とディテールを備えたマットを生成できるようにする、斬新なアーキテクチャ上の革新を提示します。
提案された方法は多用途であり、ガイダンスなしとガイダンスベースの両方の画像マッティングを実行でき、さまざまな追加の手がかりに対応できます。
3 つのベンチマーク データセットにわたる包括的な評価により、定量的および定性的な観点から、当社のアプローチの優れたパフォーマンスが実証されました。
この結果は、私たちの手法の確実な有効性を反映しているだけでなく、フォトリアリスティックな品質に近づく視覚的に魅力的なマットを生成するその能力を強調しています。
この論文のプロジェクト ページは https://lightchaserx.github.io/matting-by-generation/ から入手できます。
要約(オリジナル)
This paper introduces an innovative approach for image matting that redefines the traditional regression-based task as a generative modeling challenge. Our method harnesses the capabilities of latent diffusion models, enriched with extensive pre-trained knowledge, to regularize the matting process. We present novel architectural innovations that empower our model to produce mattes with superior resolution and detail. The proposed method is versatile and can perform both guidance-free and guidance-based image matting, accommodating a variety of additional cues. Our comprehensive evaluation across three benchmark datasets demonstrates the superior performance of our approach, both quantitatively and qualitatively. The results not only reflect our method’s robust effectiveness but also highlight its ability to generate visually compelling mattes that approach photorealistic quality. The project page for this paper is available at https://lightchaserx.github.io/matting-by-generation/
arxiv情報
著者 | Zhixiang Wang,Baiang Li,Jian Wang,Yu-Lun Liu,Jinwei Gu,Yung-Yu Chuang,Shin’ichi Satoh |
発行日 | 2024-07-30 17:58:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google