要約
大規模言語モデルのような基盤モデル(FM)は、様々なタスクで顕著な性能を示し、AIの分野に革命をもたらした。しかし、FMには多くの制約があり、信頼性とユーザビリティに高いハードルが要求される多くの実世界システムで広く採用されることを妨げている。FMは、訓練コーパスを自己教師付きで再構成することを目的とした損失関数を用いて学習されるため、モデルの出力が、手元の特定のタスクに対するユーザの嗜好と一致するという保証はない。このサーベイ論文では、エージェントがFMと相互作用し、特に知識の増強と推論を通して、一連のタスクに適したFMを導くための様々なモードをカプセル化した概念的フレームワークを提案する。我々のフレームワークは、基礎となるFMの更新、FMへのプロンプトの支援、FM出力の評価といったエージェントの役割カテゴリを解明する。また、いくつかの最先端のアプローチをエージェント相互作用プロトコルに分類し、様々なエージェントの役割の性質と関与の程度を強調する。提案するフレームワークは、実用的なAIシステムにおいてFMの力をさらに実現するための将来の方向性の指針を提供する。
要約(オリジナル)
Foundation models (FMs) such as large language models have revolutionized the field of AI by showing remarkable performance in various tasks. However, they exhibit numerous limitations that prevent their broader adoption in many real-world systems, which often require a higher bar for trustworthiness and usability. Since FMs are trained using loss functions aimed at reconstructing the training corpus in a self-supervised manner, there is no guarantee that the model’s output aligns with users’ preferences for a specific task at hand. In this survey paper, we propose a conceptual framework that encapsulates different modes by which agents could interact with FMs and guide them suitably for a set of tasks, particularly through knowledge augmentation and reasoning. Our framework elucidates agent role categories such as updating the underlying FM, assisting with prompting the FM, and evaluating the FM output. We also categorize several state-of-the-art approaches into agent interaction protocols, highlighting the nature and extent of involvement of the various agent roles. The proposed framework provides guidance for future directions to further realize the power of FMs in practical AI systems.
arxiv情報
著者 | Debarun Bhattacharjya,Junkyu Lee,Don Joven Agravante,Balaji Ganesan,Radu Marinescu |
発行日 | 2024-02-02 18:00:35+00:00 |
arxivサイト | arxiv_id(pdf) |