要約
生成人工知能 (AI) システムは、大規模なデータ コーパスでトレーニングされ、新しいテキスト、画像、ビデオ、その他のメディアを生成します。
このようなシステムがトレーニング データの投稿者の著作権上の利益を侵害するのではないかという懸念が高まっています。
生成 AI の著作権の課題に対処するために、AI が生成したコンテンツの作成への貢献に比例して著作権所有者に補償するフレームワークを提案します。
貢献度の指標は、最新の生成 AI モデルの確率的性質を利用し、経済学の協力ゲーム理論の手法を使用することによって定量的に決定されます。
このフレームワークにより、AI 開発者が高品質のトレーニング データにアクセスすることで恩恵を受けるプラットフォームが可能になり、モデルのパフォーマンスが向上します。
一方、著作権所有者は公正な報酬を受け取り、生成モデルのトレーニングに関連するデータの継続的な提供を促進します。
実験により、私たちのフレームワークがアートワークの生成に使用される最も関連性の高いデータソースを特定し、著作権所有者間で公平かつ解釈可能な収益分配が保証されることが実証されました。
要約(オリジナル)
Generative artificial intelligence (AI) systems are trained on large data corpora to generate new pieces of text, images, videos, and other media. There is growing concern that such systems may infringe on the copyright interests of training data contributors. To address the copyright challenges of generative AI, we propose a framework that compensates copyright owners proportionally to their contributions to the creation of AI-generated content. The metric for contributions is quantitatively determined by leveraging the probabilistic nature of modern generative AI models and using techniques from cooperative game theory in economics. This framework enables a platform where AI developers benefit from access to high-quality training data, thus improving model performance. Meanwhile, copyright owners receive fair compensation, driving the continued provision of relevant data for generative model training. Experiments demonstrate that our framework successfully identifies the most relevant data sources used in artwork generation, ensuring a fair and interpretable distribution of revenues among copyright owners.
arxiv情報
著者 | Jiachen T. Wang,Zhun Deng,Hiroaki Chiba-Okabe,Boaz Barak,Weijie J. Su |
発行日 | 2024-04-23 16:56:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google