Hello Again! LLM-powered Personalized Agent for Long-term Dialogue

要約

オープンドメインダイアログシステムでは、大規模な言語モデル(LLMS)の開発により顕著な進歩が見られました。
それにもかかわらず、ほとんどの既存のダイアログシステムは、主に短期間のセッションの相互作用に焦点を当てており、チャットボットとの長期的な交際とパーソナライズされた相互作用に対する現実世界の要求を無視しています。
この現実世界のニーズに対処するために重要なのは、イベントの概要とペルソナ管理です。これにより、適切な長期的な対話応答の推論が可能です。
LLMSの人間のような認知および推論能力の最近の進歩は、LLMベースのエージェントが自動化された認識、意思決定、および問題解決を大幅に強化できることを示唆しています。
この可能性に応じて、モデルと存在するフレームワークである長期ダイアログエージェント(LD-Agent)を紹介します。これには、イベント認識、ペルソナ抽出、および応答生成専用の3つの独立した調整可能なモジュールが組み込まれています。
イベントメモリモジュールでは、長期および短期のメモリバンクが歴史的および継続的なセッションに個別に焦点を当てるために採用されていますが、トピックベースの検索メカニズムが導入され、メモリ検索の精度が向上します。
さらに、ペルソナモジュールは、ユーザーとエージェントの両方に対して動的なペルソナモデリングを実施しています。
取得された記憶と抽出されたペルソナの統合は、その後発電機に供給され、適切な応答を誘導します。
LD-Agentの有効性、一般性、およびクロスドメイン機能は、さまざまな例示的なベンチマーク、モデル、およびタスクにわたって経験的に実証されています。
コードはhttps://github.com/leolee99/ld-agentでリリースされます。

要約(オリジナル)

Open-domain dialogue systems have seen remarkable advancements with the development of large language models (LLMs). Nonetheless, most existing dialogue systems predominantly focus on brief single-session interactions, neglecting the real-world demands for long-term companionship and personalized interactions with chatbots. Crucial to addressing this real-world need are event summary and persona management, which enable reasoning for appropriate long-term dialogue responses. Recent progress in the human-like cognitive and reasoning capabilities of LLMs suggests that LLM-based agents could significantly enhance automated perception, decision-making, and problem-solving. In response to this potential, we introduce a model-agnostic framework, the Long-term Dialogue Agent (LD-Agent), which incorporates three independently tunable modules dedicated to event perception, persona extraction, and response generation. For the event memory module, long and short-term memory banks are employed to separately focus on historical and ongoing sessions, while a topic-based retrieval mechanism is introduced to enhance the accuracy of memory retrieval. Furthermore, the persona module conducts dynamic persona modeling for both users and agents. The integration of retrieved memories and extracted personas is subsequently fed into the generator to induce appropriate responses. The effectiveness, generality, and cross-domain capabilities of LD-Agent are empirically demonstrated across various illustrative benchmarks, models, and tasks. The code is released at https://github.com/leolee99/LD-Agent.

arxiv情報

著者 Hao Li,Chenghao Yang,An Zhang,Yang Deng,Xiang Wang,Tat-Seng Chua
発行日 2025-02-13 18:02:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク