ChatGPT Alternative Solutions: Large Language Models Survey

要約

最近、大規模言語モデル (LLM) の偉大さは、自然言語処理の領域で輝いているだけでなく、膨大な数のアプリケーションにわたってその輝きを放っています。
LLM の機能がこのように顕著に発揮されたことにより、この分野における研究貢献が急増し、さまざまなテーマにまたがるようになりました。
これらの貢献には、ニューラル ネットワーク アーキテクチャの進歩、コンテキスト長の強化、モデルの調整、トレーニング データセット、ベンチマーク、効率の向上などが含まれます。
近年、学界と産業界の間でダイナミックな相乗効果が見られ、LLM 研究分野は新たな高みに押し上げられています。
この取り組みにおける注目すべきマイルストーンは、LLM に基づいた強力な AI チャットボットである ChatGPT の導入であり、広く社会的な注目を集めています。
LLM の進化するテクノロジーは、AI コミュニティ全体の状況を再構築し始めており、AI アルゴリズムの作成と採用の方法に革命的な変化が起こることを約束しています。
この急速な技術進化を考慮して、私たちの調査は、LLM の世界での最近の進歩を要約する旅に乗り出します。
背景、重要な発見、一般的な方法論の探求を通じて、文献の最新のレビューを提供します。
複数の LLM モデルを調査することにより、私たちの論文は包括的な概要を提示するだけでなく、既存の課題を特定し、潜在的な将来の研究の方向性を示す方向性を示します。
この調査は、生成 AI の現状に関する包括的な視点を提供し、さらなる探索、強化、革新の機会に光を当てます。

要約(オリジナル)

In recent times, the grandeur of Large Language Models (LLMs) has not only shone in the realm of natural language processing but has also cast its brilliance across a vast array of applications. This remarkable display of LLM capabilities has ignited a surge in research contributions within this domain, spanning a diverse spectrum of topics. These contributions encompass advancements in neural network architecture, context length enhancements, model alignment, training datasets, benchmarking, efficiency improvements, and more. Recent years have witnessed a dynamic synergy between academia and industry, propelling the field of LLM research to new heights. A notable milestone in this journey is the introduction of ChatGPT, a powerful AI chatbot grounded in LLMs, which has garnered widespread societal attention. The evolving technology of LLMs has begun to reshape the landscape of the entire AI community, promising a revolutionary shift in the way we create and employ AI algorithms. Given this swift-paced technical evolution, our survey embarks on a journey to encapsulate the recent strides made in the world of LLMs. Through an exploration of the background, key discoveries, and prevailing methodologies, we offer an up-to-the-minute review of the literature. By examining multiple LLM models, our paper not only presents a comprehensive overview but also charts a course that identifies existing challenges and points toward potential future research trajectories. This survey furnishes a well-rounded perspective on the current state of generative AI, shedding light on opportunities for further exploration, enhancement, and innovation.

arxiv情報

著者 Hanieh Alipour,Nick Pendar,Kohinoor Roy
発行日 2024-03-21 15:16:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク