Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms

要約

パブリックドメイン 12M (PD12M) は、テキストから画像へのモデルをトレーニングするために設計された、合成キャプション付きの 1,240 万枚の高品質パブリックドメイン画像と CC0 ライセンス画像のデータセットです。
PD12M はこれまでで最大のパブリックドメインの画像テキストデータセットであり、著作権への懸念を最小限に抑えながら基礎モデルをトレーニングするのに十分なサイズを備えています。
また、Source.Plus プラットフォームを通じて、害を軽減し、長期にわたる再現性をサポートする、コミュニティ主導の新しいデータセットガバナンスメカニズムも導入しています。

要約(オリジナル)

We present Public Domain 12M (PD12M), a dataset of 12.4 million high-quality public domain and CC0-licensed images with synthetic captions, designed for training text-to-image models. PD12M is the largest public domain image-text dataset to date, with sufficient size to train foundation models while minimizing copyright concerns. Through the Source.Plus platform, we also introduce novel, community-driven dataset governance mechanisms that reduce harm and support reproducibility over time.

arxiv情報

著者	Jordan Meyer,Nick Padgett,Cullen Miller,Laura Exline
発行日	2024-10-30 15:59:05+00:00
arxivサイト	arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms

要約

要約(オリジナル)

arxiv情報

提供元, 利用サービス

最近の投稿

最近のコメント

アーカイブ

カテゴリー