Fantastic Copyrighted Beasts and How (Not) to Generate Them

要約

最近の研究では、画像とビデオ生成モデルをトレーニングデータから著作権で保護されたコンテンツを再現し、著作権侵害に関する深刻な法的懸念を提起することができることが示されています。
著作権で保護されたキャラクター(マリオ、バットマンなど)は重要な課題を提示します。少なくとも1つの訴訟は、そのようなキャラクターの生成に基づいてすでに損害を与えています。
その結果、Dall-Eのような商業サービスは介入の展開を開始しました。
ただし、これらの問題を体系的に調査する研究はほとんどありません。(1)ユーザーは、たとえ意図的でなくても、モデルに著作権で保護された文字を生成するように簡単に促すことができますか?
(2)既存の緩和戦略はどの程度効果的ですか?
これらの質問に対処するために、生成された画像の著作権で保護されたキャラクターとの類似性の両方を評価するメトリックと、多様なスタジオや地域の人気のある著作権で保護されたキャラクターのセットに基づいたユーザー意図との一貫性の両方を評価する新しい評価フレームワークを紹介します。
キャラクターの名前が明示的に言及されていない場合でも、最先端の画像およびビデオ生成モデルが依然としてキャラクターを生成できることを示します。たとえば、2つの一般的なキーワードのみ(たとえば、「ビデオゲーム、配管」が一貫して任天堂のマリオキャラクターを生成します)。
また、半自動技術を紹介して、文字生成をトリガーするこのようなキーワードまたは説明を特定します。
このフレームワークを使用して、迅速な書き換えや提案する新しいアプローチなど、緩和戦略を評価します。
私たちの調査結果は、Dall-Eの迅速な書き換えなどの一般的な方法は単独で不十分であり、否定的なプロンプトなどの補足戦略が必要であることを明らかにしています。
私たちの仕事は、著作権緩和戦略に関する議論の実証的な基盤を提供し、これらの保護手段を実装するモデル展開者のための実用的な洞察を提供します。

要約(オリジナル)

Recent studies show that image and video generation models can be prompted to reproduce copyrighted content from their training data, raising serious legal concerns about copyright infringement. Copyrighted characters (e.g., Mario, Batman) present a significant challenge: at least one lawsuit has already awarded damages based on the generation of such characters. Consequently, commercial services like DALL-E have started deploying interventions. However, little research has systematically examined these problems: (1) Can users easily prompt models to generate copyrighted characters, even if it is unintentional?; (2) How effective are the existing mitigation strategies? To address these questions, we introduce a novel evaluation framework with metrics that assess both the generated image’s similarity to copyrighted characters and its consistency with user intent, grounded in a set of popular copyrighted characters from diverse studios and regions. We show that state-of-the-art image and video generation models can still generate characters even if characters’ names are not explicitly mentioned, sometimes with only two generic keywords (e.g., prompting with ‘videogame, plumber’ consistently generates Nintendo’s Mario character). We also introduce semi-automatic techniques to identify such keywords or descriptions that trigger character generation. Using this framework, we evaluate mitigation strategies, including prompt rewriting and new approaches we propose. Our findings reveal that common methods, such as DALL-E’s prompt rewriting, are insufficient alone and require supplementary strategies like negative prompting. Our work provides empirical grounding for discussions on copyright mitigation strategies and offers actionable insights for model deployers implementing these safeguards.

arxiv情報

著者 Luxi He,Yangsibo Huang,Weijia Shi,Tinghao Xie,Haotian Liu,Yue Wang,Luke Zettlemoyer,Chiyuan Zhang,Danqi Chen,Peter Henderson
発行日 2025-03-26 12:21:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG パーマリンク