Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

要約

タイトル:ChatGPTやそれ以外のLLMsの力を実践的に活用する:調査論文

要約:
– LLMsのDownstream自然言語処理タスクで作業する実務者やエンドユーザーに、包括的かつ実用的なガイドを提供する。
– LLMsのモデル、データ、Downstreamタスクの観点からLLMsの使用に関する議論と洞察を提供する。
– 格納方式に関する現在のGPT-やBERTスタイルのLLMsの概要と簡単なサマリーを提供する。
– プレトレーニングデータ、トレーニングデータ、テストデータの影響について説明する。
– 豊富な自然言語処理タスクに対して、LLMsの使用と非使用のケースについて詳細な議論を提供する。そして、知識集約的なタスク、従来の自然言語理解タスク、自然言語生成タスク、新しい能力、特定のタスクに対する考慮事項など、さまざまな自然言語処理タスクにLLMsがどのように役立つかを示すための使用例と非使用例を提示する。
– LLMsの実世界シナリオでの実用可能性と限界を説明するように、様々な使用例を提示する。
– また、データの重要性と各NLPタスクに関連する特定の課題についての理解を深め、LLMsにおけるスパリティアスバイアスの影響を探求し、効率性、コスト、レイテンシーなどの他の重要な考慮事項にも深入りする。
– この包括的なガイドは、LLMsを使った幅広いNLPタスクでの成功した実装を可能にすることで、研究者や実務者にとって有益な洞察とベストプラクティスを提供することを目的としています。また、定期的に更新されるLLMsの実用的なガイドリソースのキュレーションされたリストは、\url{https://github.com/Mooler0410/LLMsPracticalGuide}から参照できる。

要約(オリジナル)

This paper presents a comprehensive and practical guide for practitioners and end-users working with Large Language Models (LLMs) in their downstream natural language processing (NLP) tasks. We provide discussions and insights into the usage of LLMs from the perspectives of models, data, and downstream tasks. Firstly, we offer an introduction and brief summary of current GPT- and BERT-style LLMs. Then, we discuss the influence of pre-training data, training data, and test data. Most importantly, we provide a detailed discussion about the use and non-use cases of large language models for various natural language processing tasks, such as knowledge-intensive tasks, traditional natural language understanding tasks, natural language generation tasks, emergent abilities, and considerations for specific tasks.We present various use cases and non-use cases to illustrate the practical applications and limitations of LLMs in real-world scenarios. We also try to understand the importance of data and the specific challenges associated with each NLP task. Furthermore, we explore the impact of spurious biases on LLMs and delve into other essential considerations, such as efficiency, cost, and latency, to ensure a comprehensive understanding of deploying LLMs in practice. This comprehensive guide aims to provide researchers and practitioners with valuable insights and best practices for working with LLMs, thereby enabling the successful implementation of these models in a wide range of NLP tasks. A curated list of practical guide resources of LLMs, regularly updated, can be found at \url{https://github.com/Mooler0410/LLMsPracticalGuide}.

arxiv情報

著者 Jingfeng Yang,Hongye Jin,Ruixiang Tang,Xiaotian Han,Qizhang Feng,Haoming Jiang,Bing Yin,Xia Hu
発行日 2023-04-27 17:56:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク