要約
既存の構造と知識を尊重しながら、すでに訓練された生成モデルに新しい概念を注入できますか?
これに対処するために、ドメイン拡張という新しいタスクを提案します。
事前トレーニングされたジェネレーターと新しい (しかし関連する) ドメインが与えられた場合、ジェネレーターを拡張して、新旧のすべてのドメインを調和して共同でモデル化します。
まず、ジェネレーターには意味のある事前トレーニング済みの潜在空間が含まれていることに注意してください。
新しいドメインを最大限に表現しながら、この苦労して獲得した表現を最小限に乱すことは可能ですか?
興味深いことに、潜在空間は出力に影響を与えない未使用の「休眠」方向を提供することがわかりました。
これは機会を提供します: これらの方向を「転用」することにより、元の表現を乱すことなく新しいドメインを表現できます。
実際、事前トレーニング済みのジェネレーターには、数個、場合によっては数百個の新しいドメインを追加する能力があることがわかりました!
拡張方法を使用すると、モデル サイズを拡張することなく、1 つの「拡張された」モデルが多数のドメイン固有のモデルに取って代わることができます。
さらに、拡張された 1 つのジェネレーターが、ドメイン間のスムーズな遷移とドメインの構成をネイティブにサポートします。
コードとプロジェクトのページは、https://yotamnitzan.github.io/domain-expansion/ で入手できます。
要約(オリジナル)
Can one inject new concepts into an already trained generative model, while respecting its existing structure and knowledge? We propose a new task – domain expansion – to address this. Given a pretrained generator and novel (but related) domains, we expand the generator to jointly model all domains, old and new, harmoniously. First, we note the generator contains a meaningful, pretrained latent space. Is it possible to minimally perturb this hard-earned representation, while maximally representing the new domains? Interestingly, we find that the latent space offers unused, ‘dormant’ directions, which do not affect the output. This provides an opportunity: By ‘repurposing’ these directions, we can represent new domains without perturbing the original representation. In fact, we find that pretrained generators have the capacity to add several – even hundreds – of new domains! Using our expansion method, one ‘expanded’ model can supersede numerous domain-specific models, without expanding the model size. Additionally, a single expanded generator natively supports smooth transitions between domains, as well as composition of domains. Code and project page available at https://yotamnitzan.github.io/domain-expansion/.
arxiv情報
著者 | Yotam Nitzan,Michaël Gharbi,Richard Zhang,Taesung Park,Jun-Yan Zhu,Daniel Cohen-Or,Eli Shechtman |
発行日 | 2023-01-12 18:59:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google