要約
言語モデルがトレーニング データから著作権で保護された素材を再現するリスクにより、さまざまな保護手段の開発が行われてきました。
その中でも、後処理を通じて制約を課す推論時戦略は、著作権規制の複雑さに対処する上で有望であることが示されています。
ただし、多くの場合、法外な計算コストが発生したり、パフォーマンスのトレードオフに悩まされたりします。
これらの制限を克服するために、著作権保護モデル フュージョン (CP-Fuse) を導入します。これは、推論中に著作権で保護されたマテリアルの素のセットでトレーニングされたモデルを組み合わせる新しいアプローチです。
特に、CP-Fuse はモデル出力を適応的に集約して、著作権で保護されたコンテンツの複製を最小限に抑え、記憶されたデータの逆流を防ぐ重要なバランス特性を遵守します。
広範な実験を通じて、CP-Fuse がテキストとコード生成の品質を損なうことなく、保護された素材の複製を大幅に削減することを示しました。
さらに、そのポストホックな性質により、他の保護手段とのシームレスな統合が可能になり、著作権の保護がさらに強化されます。
最後に、CP-Fuse がトレーニング データを抽出するための一般的な手法に対して堅牢であることを示します。
要約(オリジナル)
The risk of language models reproducing copyrighted material from their training data has led to the development of various protective measures. Among these, inference-time strategies that impose constraints via post-processing have shown promise in addressing the complexities of copyright regulation. However, they often incur prohibitive computational costs or suffer from performance trade-offs. To overcome these limitations, we introduce Copyright-Protecting Model Fusion (CP-Fuse), a novel approach that combines models trained on disjoint sets of copyrighted material during inference. In particular, CP-Fuse adaptively aggregates the model outputs to minimize the reproduction of copyrighted content, adhering to a crucial balancing property that prevents the regurgitation of memorized data. Through extensive experiments, we show that CP-Fuse significantly reduces the reproduction of protected material without compromising the quality of text and code generation. Moreover, its post-hoc nature allows seamless integration with other protective measures, further enhancing copyright safeguards. Lastly, we show that CP-Fuse is robust against common techniques for extracting training data.
arxiv情報
著者 | Javier Abad,Konstantin Donhauser,Francesco Pinto,Fanny Yang |
発行日 | 2024-12-09 16:13:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google