Not All Similarities Are Created Equal: Leveraging Data-Driven Biases to Inform GenAI Copyright Disputes

要約

GitHub Copilot、OpenAI GPT、Stable Diffusion などの生成人工知能 (GenAI) モデルの出現により、コンテンツ作成に革命が起こり、専門家でなくてもさまざまなドメインにわたって高品質のコンテンツを作成できるようになりました。
この革新的なテクノロジーにより、合成コンテンツが急増し、著作権侵害をめぐる法的紛争が引き起こされました。
これらの課題に対処するために、この論文では、GPT2 および安定拡散モデルで実証された、著作権法分析のための GenAI モデルの学習能力を活用する新しいアプローチを紹介します。
著作権法では、オリジナルの表現と一般的な表現 (Sc\`enes \`a Faire) を区別し、前者を保護し、後者の複製を許可しています。
しかし、この区別を一貫して行うことは歴史的に困難であり、著作権で保護された作品の過剰保護につながってきました。
GenAI は、既存の研究に共通するパターンを明らかにすることで、この法的分析を強化する前例のない機会を提供します。
私たちは、表現力豊かな作品の一般性を評価するために「データ駆動型バイアス」を採用し、GenAI によって作成された作品の一般性を特定するためのデータ駆動型アプローチを提案します。
このアプローチは、表現要素を特定して優先順位を付け、モデルのデータセット内の頻度に応じてランク付けする GenAI の機能を利用することで、著作権範囲の決定を支援します。
表現の一般性を測定することの著作権法への潜在的な影響は深刻です。
このようなスコアリングは、裁判所が訴訟中に著作権範囲を決定するのに役立ち、著作権局の登録実務に情報を提供して、独創性の高い合成作品のみの登録を許可し、著作権所有者が自分の作品の価値を示し、より公正なライセンス取引を促進するのに役立ちます。
より一般的には、このアプローチは、GenAI の時代によってもたらされる課題に著作権法を適応させることに取り組んでいる政策立案者に貴重な洞察を提供します。

要約(オリジナル)

The advent of Generative Artificial Intelligence (GenAI) models, including GitHub Copilot, OpenAI GPT, and Stable Diffusion, has revolutionized content creation, enabling non-professionals to produce high-quality content across various domains. This transformative technology has led to a surge of synthetic content and sparked legal disputes over copyright infringement. To address these challenges, this paper introduces a novel approach that leverages the learning capacity of GenAI models for copyright legal analysis, demonstrated with GPT2 and Stable Diffusion models. Copyright law distinguishes between original expressions and generic ones (Sc\`enes \`a faire), protecting the former and permitting reproduction of the latter. However, this distinction has historically been challenging to make consistently, leading to over-protection of copyrighted works. GenAI offers an unprecedented opportunity to enhance this legal analysis by revealing shared patterns in preexisting works. We propose a data-driven approach to identify the genericity of works created by GenAI, employing ‘data-driven bias’ to assess the genericity of expressive compositions. This approach aids in copyright scope determination by utilizing the capabilities of GenAI to identify and prioritize expressive elements and rank them according to their frequency in the model’s dataset. The potential implications of measuring expressive genericity for copyright law are profound. Such scoring could assist courts in determining copyright scope during litigation, inform the registration practices of Copyright Offices, allowing registration of only highly original synthetic works, and help copyright owners signal the value of their works and facilitate fairer licensing deals. More generally, this approach offers valuable insights to policymakers grappling with adapting copyright law to the challenges posed by the era of GenAI.

arxiv情報

著者 Uri Hacohen,Adi Haviv,Shahar Sarfaty,Bruria Friedman,Niva Elkin-Koren,Roi Livni,Amit H Bermano
発行日 2024-03-26 13:32:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV パーマリンク