要約
一連の深い学習モデルを考えると、タスクに適したモデルを見つけること、モデルを理解し、モデルが互いにどのように異なるかを特徴付けるのは難しい場合があります。
現在、開業医は手動で書かれたドキュメントに依存して、モデルを理解して選択しています。
ただし、すべてのモデルに完全で信頼できるドキュメントがあるわけではありません。
モデルの数が増えるにつれて、モデルを見つけ、区別し、理解することの課題がますます重要になります。
データ湖の研究からインスピレーションを得て、モデル湖の概念を紹介します。
モデルの帰属、バージョン化、検索、ベンチマークなどの主要なモデル湖のタスクを正式にし、大規模なモデルの管理における基本的な研究の課題について議論します。
また、大規模なモデル管理の研究に耐えるためにもたらされるデータ管理手法を探求します。
要約(オリジナル)
Given a set of deep learning models, it can be hard to find models appropriate to a task, understand the models, and characterize how models are different one from another. Currently, practitioners rely on manually-written documentation to understand and choose models. However, not all models have complete and reliable documentation. As the number of models increases, the challenges of finding, differentiating, and understanding models become increasingly crucial. Inspired from research on data lakes, we introduce the concept of model lakes. We formalize key model lake tasks, including model attribution, versioning, search, and benchmarking, and discuss fundamental research challenges in the management of large models. We also explore what data management techniques can be brought to bear on the study of large model management.
arxiv情報
著者 | Koyena Pal,David Bau,Renée J. Miller |
発行日 | 2025-02-21 16:46:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google