要約
ベクター グラフィックスはデザインに不可欠であり、解像度に依存せず、高度に編集可能なビジュアル コンテンツを作成するための多用途のメディアをアーティストに提供します。
視覚言語モデルと拡散モデルの最近の進歩により、テキストからベクター グラフィックスへの生成への関心が高まっています。
しかし、既存のアプローチは、多くの場合、出力のパラメーター化が過剰であるか、ベクター グラフィックスのコア機能である階層構造を二次的な目標として扱っているため、実用性が損なわれています。
階層化された SVG 表現の重要性を認識し、テキスト プロンプトからベクトル グラフィックスを生成するための暗黙的なニューラル表現である NeuralSVG を提案します。
Neural Radiance Fields (NeRF) からインスピレーションを得た NeuralSVG は、シーン全体を小さな MLP ネットワークの重みにエンコードし、Score Distillation Sampling (SDS) を使用して最適化します。
生成された SVG の階層構造を促進するために、各形状の独立した意味を強化するドロップアウト ベースの正則化手法を導入します。
さらに、ニューラル表現を利用すると、推論時間制御の追加の利点が得られ、ユーザーが提供した入力に基づいて生成された SVG を 1 つの学習された表現で動的に適応できることも実証します。
広範な定性的および定量的評価を通じて、構造化された柔軟な SVG の生成において NeuralSVG が既存の方法よりも優れていることを実証します。
要約(オリジナル)
Vector graphics are essential in design, providing artists with a versatile medium for creating resolution-independent and highly editable visual content. Recent advancements in vision-language and diffusion models have fueled interest in text-to-vector graphics generation. However, existing approaches often suffer from over-parameterized outputs or treat the layered structure – a core feature of vector graphics – as a secondary goal, diminishing their practical use. Recognizing the importance of layered SVG representations, we propose NeuralSVG, an implicit neural representation for generating vector graphics from text prompts. Inspired by Neural Radiance Fields (NeRFs), NeuralSVG encodes the entire scene into the weights of a small MLP network, optimized using Score Distillation Sampling (SDS). To encourage a layered structure in the generated SVG, we introduce a dropout-based regularization technique that strengthens the standalone meaning of each shape. We additionally demonstrate that utilizing a neural representation provides an added benefit of inference-time control, enabling users to dynamically adapt the generated SVG based on user-provided inputs, all with a single learned representation. Through extensive qualitative and quantitative evaluations, we demonstrate that NeuralSVG outperforms existing methods in generating structured and flexible SVG.
arxiv情報
著者 | Sagi Polaczek,Yuval Alaluf,Elad Richardson,Yael Vinker,Daniel Cohen-Or |
発行日 | 2025-01-07 18:50:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google