要約
画像ベクトル化は、ラスター画像をベクターグラフィックスに変換する強力な手法であり、柔軟性とインタラクティブ性の向上を可能にします。
ただし、人気のある画像のベクトル化ツールは、閉塞領域と格闘し、編集可能性を妨げる不完全または断片化された形状を生成します。
最近の進歩により、ルールベースとデータ駆動型のレイヤーごとの画像のベクトル化が検討されていますが、これらの方法は、ベクトル化の品質と柔軟性の制限に直面しています。
このホワイトペーパーでは、進歩的な単純化パラダイムを通じてこれらの課題に対処する新しいレイヤーワイズ画像のベクトル化アプローチであるlayerpeelerを紹介します。
レイヤーピーラーの成功の鍵は、その自己回帰の剥離戦略にあります。基礎となるコンテンツを回復しながら、最上位の非閉鎖層を識別および削除することにより、完全なパスとコヒーレント層構造を持つベクトルグラフィックスを生成します。
私たちの方法は、ビジョン言語モデルを活用して、要素間の閉塞関係をキャプチャするレイヤーグラフを構築し、非閉鎖層の正確な検出と説明を可能にします。
これらの記述キャプションは、識別されたレイヤーを削除するために、微調ューされた画像拡散モデルの編集手順として使用されます。
正確な削除を確保するために、周囲のコンテンツを忠実に保存しながら、ターゲット領域にモデルを正確に導くローカライズされた注意制御を採用しています。
これをサポートするために、レイヤーピーリングタスク用に特別に設計された大規模なデータセットを提供します。
広範な定量的および定性的実験は、層状係が既存の手法を大幅に上回り、優れた経路セマンティクス、幾何学的規則性、視覚的忠実度を備えたベクトル化結果を生成することを示しています。
要約(オリジナル)
Image vectorization is a powerful technique that converts raster images into vector graphics, enabling enhanced flexibility and interactivity. However, popular image vectorization tools struggle with occluded regions, producing incomplete or fragmented shapes that hinder editability. While recent advancements have explored rule-based and data-driven layer-wise image vectorization, these methods face limitations in vectorization quality and flexibility. In this paper, we introduce LayerPeeler, a novel layer-wise image vectorization approach that addresses these challenges through a progressive simplification paradigm. The key to LayerPeeler’s success lies in its autoregressive peeling strategy: by identifying and removing the topmost non-occluded layers while recovering underlying content, we generate vector graphics with complete paths and coherent layer structures. Our method leverages vision-language models to construct a layer graph that captures occlusion relationships among elements, enabling precise detection and description for non-occluded layers. These descriptive captions are used as editing instructions for a finetuned image diffusion model to remove the identified layers. To ensure accurate removal, we employ localized attention control that precisely guides the model to target regions while faithfully preserving the surrounding content. To support this, we contribute a large-scale dataset specifically designed for layer peeling tasks. Extensive quantitative and qualitative experiments demonstrate that LayerPeeler significantly outperforms existing techniques, producing vectorization results with superior path semantics, geometric regularity, and visual fidelity.
arxiv情報
著者 | Ronghuan Wu,Wanchao Su,Jing Liao |
発行日 | 2025-05-29 17:58:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google