A Survey on Multi-Turn Interaction Capabilities of Large Language Models


対話システム研究におけるマルチターン インタラクションとは、複数の対話ターンにわたってコンテキストを維持し、一貫性のあるコンテキストに関連した応答を生成できるシステムの能力を指します。
大規模言語モデル (LLM) の最近の進歩により、マルチターン インタラクションの範囲が大幅に拡大し、チャットボットを超えて、ユーザーまたは環境とのより動的なエージェント インタラクションが可能になりました。
このペーパーでは、会話型検索と推奨、相談サービス、対話型個別指導など、幅広い下流アプリケーションにとって重要な LLM のマルチターン機能に焦点を当ててレビューします。
この調査では、4 つの重要な側面を調査します: (1) 効果的なマルチターン インタラクションに貢献するコア モデル機能、(2) 現在の実務におけるマルチターン インタラクションの評価方法、(3) マルチ ターン インタラクションを強化するために使用される一般的なアルゴリズム
、および (4) この分野の研究の将来の可能性のある方向性。


Multi-turn interaction in the dialogue system research refers to a system’s ability to maintain context across multiple dialogue turns, enabling it to generate coherent and contextually relevant responses. Recent advancements in large language models (LLMs) have significantly expanded the scope of multi-turn interaction, moving beyond chatbots to enable more dynamic agentic interactions with users or environments. In this paper, we provide a focused review of the multi-turn capabilities of LLMs, which are critical for a wide range of downstream applications, including conversational search and recommendation, consultation services, and interactive tutoring. This survey explores four key aspects: (1) the core model capabilities that contribute to effective multi-turn interaction, (2) how multi-turn interaction is evaluated in current practice, (3) the general algorithms used to enhance multi-turn interaction, and (4) potential future directions for research in this field.


著者 Chen Zhang,Xinyi Dai,Yaxiong Wu,Qu Yang,Yasheng Wang,Ruiming Tang,Yong Liu
発行日 2025-01-17 05:21:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク