Fantastic Copyrighted Beasts and How (Not) to Generate Them

要約

最近の研究では、画像およびビデオ生成モデルがトレーニング データから著作権で保護されたコンテンツを複製するよう促される可能性があることが示されており、著作権侵害に関する重大な法的懸念が生じています。
特に、著作権で保護されたキャラクターは画像生成サービスにとって困難な課題となっており、すでに少なくとも 1 件の訴訟でこれらのキャラクターの生成に基づいて損害賠償が認められています。
しかし、この問題を実証的に検討した研究はほとんどありません。
私たちはこのギャップを埋めるために体系的な評価を実施します。
まず、著作権で保護されたさまざまなキャラクターと新しい評価パイプラインで構成される評価スイートである CopyCat を構築します。
私たちの評価では、著作権で保護されたキャラクターとの類似性の検出と、生成された画像とユーザー入力との一貫性の両方が考慮されます。
私たちの評価では、プロンプトでキャラクターの名前が明示的に言及されていない場合でも、場合によっては 2 つの一般的なキーワードのみを使用しても、画像生成モデルとビデオ生成モデルの両方でキャラクターを生成できることが体系的に示されています (たとえば、「ビデオゲーム、配管工」をプロンプトに入力すると、一貫して任天堂のマリオ キャラクターが生成されます)。

次に、キャラクター生成のきっかけとなるキーワードや説明を半自動的に識別する手法を紹介します。
当社の評価スイートを使用して、既存の方法と当社が提案する新しい戦略の両方を含むランタイム軽減戦略を研究します。
私たちの調査結果は、DALL-E システムでの即時書き換えなどの一般的に採用されている戦略では、スタンドアロンのガードレールとしては十分ではないことを明らかにしています。
これらの戦略は、著作権で保護されたキャラクターの意図しない生成を効果的に減らすために、否定的なプロンプトなどの他のアプローチと組み合わせる必要があります。
私たちの研究は、著作権軽減戦略の議論に経験的な根拠を提供し、それらを積極的に導入するモデル展開者に実用的な洞察を提供します。

要約(オリジナル)

Recent studies show that image and video generation models can be prompted to reproduce copyrighted content from their training data, raising serious legal concerns around copyright infringement. Copyrighted characters, in particular, pose a difficult challenge for image generation services, with at least one lawsuit already awarding damages based on the generation of these characters. Yet, little research has empirically examined this issue. We conduct a systematic evaluation to fill this gap. First, we build CopyCat, an evaluation suite consisting of diverse copyrighted characters and a novel evaluation pipeline. Our evaluation considers both the detection of similarity to copyrighted characters and generated image’s consistency with user input. Our evaluation systematically shows that both image and video generation models can still generate characters even if characters’ names are not explicitly mentioned in the prompt, sometimes with only two generic keywords (e.g., prompting with ‘videogame, plumber’ consistently generates Nintendo’s Mario character). We then introduce techniques to semi-automatically identify such keywords or descriptions that trigger character generation. Using our evaluation suite, we study runtime mitigation strategies, including both existing methods and new strategies we propose. Our findings reveal that commonly employed strategies, such as prompt rewriting in the DALL-E system, are not sufficient as standalone guardrails. These strategies must be coupled with other approaches, like negative prompting, to effectively reduce the unintended generation of copyrighted characters. Our work provides empirical grounding to the discussion of copyright mitigation strategies and offers actionable insights for model deployers actively implementing them.

arxiv情報

著者 Luxi He,Yangsibo Huang,Weijia Shi,Tinghao Xie,Haotian Liu,Yue Wang,Luke Zettlemoyer,Chiyuan Zhang,Danqi Chen,Peter Henderson
発行日 2024-06-20 17:38:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG パーマリンク