Charting and Navigating Hugging Face’s Model Atlas

要約

現在、何百万もの公開されているニューラルネットワークがあるため、大規模なモデルリポジトリの検索と分析がますます重要になります。
非常に多くのモデルをナビゲートするにはAtlasが必要ですが、ほとんどのモデルは文書化されていないため、そのようなアトラスは挑戦的です。
モデルリポジトリの隠された可能性を調査するために、抱きしめる顔の記録された割合を表す予備的なアトラスをチャートします。
モデルの風景と進化の見事な視覚化を提供します。
モデル属性の予測(精度など)、コンピュータービジョンモデルの傾向の分析など、このアトラスのいくつかのアプリケーションを実証します。
ただし、現在のATLAが不完全なままであるため、文書化されていない領域をチャート化する方法を提案します。
具体的には、支配的な現実世界のモデルトレーニングの実践に基づいて、自信の高い構造的事前分野を特定します。
これらのプライアーを活用して、私たちのアプローチにより、以前は文書化されていないAtlasの正確なマッピングが可能になります。
データセット、コード、およびインタラクティブなアトラスを公開しています。

要約(オリジナル)

As there are now millions of publicly available neural networks, searching and analyzing large model repositories becomes increasingly important. Navigating so many models requires an atlas, but as most models are poorly documented charting such an atlas is challenging. To explore the hidden potential of model repositories, we chart a preliminary atlas representing the documented fraction of Hugging Face. It provides stunning visualizations of the model landscape and evolution. We demonstrate several applications of this atlas including predicting model attributes (e.g., accuracy), and analyzing trends in computer vision models. However, as the current atlas remains incomplete, we propose a method for charting undocumented regions. Specifically, we identify high-confidence structural priors based on dominant real-world model training practices. Leveraging these priors, our approach enables accurate mapping of previously undocumented areas of the atlas. We publicly release our datasets, code, and interactive atlas.

arxiv情報

著者 Eliahu Horwitz,Nitzan Kurer,Jonathan Kahana,Liel Amar,Yedid Hoshen
発行日 2025-03-13 17:59:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV, cs.LG パーマリンク