A Comprehensive Overview of Large Language Models

要約

大規模言語モデル (LLM) は、最近、自然言語処理タスクおよびそれ以外の分野で優れた機能を実証しています。
LLM のこの成功により、この方向への研究貢献が大量に流入するようになりました。
これらの取り組みには、アーキテクチャの革新、より良いトレーニング戦略、コンテキストの長さの改善、微調整、マルチモーダル LLM、ロボティクス、データセット、ベンチマーク、効率など、さまざまなトピックが含まれています。
LLM 研究における技術の急速な発展と定期的な進歩により、この方向の進歩の全体像を把握することがかなり困難になってきています。
LLM に関する大量の文献が急速に出現していることを考慮すると、研究コミュニティがこの分野の最近の発展の簡潔かつ包括的な概要から恩恵を受けることが不可欠です。
この記事では、広範な LLM 関連の概念に関する既存の文献の概要を説明します。
LLM の自己完結型の包括的な概要では、LLM 研究の最前線における高度なトピックをカバーするとともに、関連する背景概念について説明します。
この総説記事は、体系的な調査を提供するだけでなく、LLM 研究を前進させるために、研究者や実践者が既存の研究の広範な有益な要約から洞察を引き出すための迅速な包括的な参考資料を提供することを目的としています。

要約(オリジナル)

Large Language Models (LLMs) have recently demonstrated remarkable capabilities in natural language processing tasks and beyond. This success of LLMs has led to a large influx of research contributions in this direction. These works encompass diverse topics such as architectural innovations, better training strategies, context length improvements, fine-tuning, multi-modal LLMs, robotics, datasets, benchmarking, efficiency, and more. With the rapid development of techniques and regular breakthroughs in LLM research, it has become considerably challenging to perceive the bigger picture of the advances in this direction. Considering the rapidly emerging plethora of literature on LLMs, it is imperative that the research community is able to benefit from a concise yet comprehensive overview of the recent developments in this field. This article provides an overview of the existing literature on a broad range of LLM-related concepts. Our self-contained comprehensive overview of LLMs discusses relevant background concepts along with covering the advanced topics at the frontier of research in LLMs. This review article is intended to not only provide a systematic survey but also a quick comprehensive reference for the researchers and practitioners to draw insights from extensive informative summaries of the existing works to advance the LLM research.

arxiv情報

著者 Humza Naveed,Asad Ullah Khan,Shi Qiu,Muhammad Saqib,Saeed Anwar,Muhammad Usman,Naveed Akhtar,Nick Barnes,Ajmal Mian
発行日 2023-11-23 19:23:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク