要約
人間の言語理解における ChatGPT およびその他の基礎モデルベースの製品の優れたパフォーマンスにより、学術界と産業界の両方が、これらのモデルを特定の業界やアプリケーション シナリオに合わせて調整する方法を検討するようになりました。
ドメイン固有の基盤モデルのカスタマイズとして知られるこのプロセスは、ドメイン固有のデータの固有のパターンや要件を完全には捉えていない可能性がある汎用モデルの制限に対処します。
その重要性にもかかわらず、汎用モデルについては多数のリソースが存在する一方で、ドメイン固有の基礎モデルの構築に関する包括的な概要文書が著しく不足しています。
このギャップを埋めるために、この記事では、ドメイン固有の基盤モデルをカスタマイズする方法論のタイムリーかつ徹底的な概要を提供します。
基本概念を紹介し、一般的なアーキテクチャの概要を説明し、ドメイン固有のモデルを構築するための主要な方法を概説します。
さらに、この記事では、これらの特殊なモデルから恩恵を受けることができるさまざまな領域について説明し、今後の課題に焦点を当てています。
この概要を通じて、さまざまな分野の研究者や実践者が独自にカスタマイズされた基礎モデルを開発するための貴重なガイダンスと参考情報を提供することを目指しています。
要約(オリジナル)
The impressive performance of ChatGPT and other foundation-model-based products in human language understanding has prompted both academia and industry to explore how these models can be tailored for specific industries and application scenarios. This process, known as the customization of domain-specific foundation models, addresses the limitations of general-purpose models, which may not fully capture the unique patterns and requirements of domain-specific data. Despite its importance, there is a notable lack of comprehensive overview papers on building domain-specific foundation models, while numerous resources exist for general-purpose models. To bridge this gap, this article provides a timely and thorough overview of the methodology for customizing domain-specific foundation models. It introduces basic concepts, outlines the general architecture, and surveys key methods for constructing domain-specific models. Furthermore, the article discusses various domains that can benefit from these specialized models and highlights the challenges ahead. Through this overview, we aim to offer valuable guidance and reference for researchers and practitioners from diverse fields to develop their own customized foundation models.
arxiv情報
| 著者 | Haolong Chen,Hanzhi Chen,Zijian Zhao,Kaifeng Han,Guangxu Zhu,Yichen Zhao,Ying Du,Wei Xu,Qingjiang Shi |
| 発行日 | 2024-09-06 13:24:22+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google