要約
人間の認知の二重プロセス理論に触発され、それぞれ高速思考と低速思考専用の 2 つの生成大規模言語モデル (LLM) の利用を通じてデュアルマインド メカニズムを具体化する新しい会話エージェント フレームワークである DUMA を紹介します。
高速思考モデルは、外部インタラクションと初期応答生成の主要なインターフェイスとして機能し、完全な応答の複雑さに基づいて低速思考モデルを使用する必要性を評価します。
低速思考モデルが呼び出されると、会話を引き継ぎ、綿密な計画、推論、ツールの利用を行って、十分に分析された応答を提供します。
このデュアルマインド構成により、状況に応じた直感的な応答と意図的な問題解決プロセスの間のシームレスな移行が可能になります。
不動産業界のオンライン問い合わせに対応する会話型エージェントを構築しました。
実験では、私たちの方法が有効性と効率のバランスが取れており、ベースラインと比較して大幅な改善があることが証明されました。
要約(オリジナル)
Inspired by the dual-process theory of human cognition, we introduce DUMA, a novel conversational agent framework that embodies a dual-mind mechanism through the utilization of two generative Large Language Models (LLMs) dedicated to fast and slow thinking respectively. The fast thinking model serves as the primary interface for external interactions and initial response generation, evaluating the necessity for engaging the slow thinking model based on the complexity of the complete response. When invoked, the slow thinking model takes over the conversation, engaging in meticulous planning, reasoning, and tool utilization to provide a well-analyzed response. This dual-mind configuration allows for a seamless transition between intuitive responses and deliberate problem-solving processes based on the situation. We have constructed a conversational agent to handle online inquiries in the real estate industry. The experiment proves that our method balances effectiveness and efficiency, and has a significant improvement compared to the baseline.
arxiv情報
著者 | Xiaoyu Tian,Liangyu Chen,Na Liu,Yaxuan Liu,Wei Zou,Kaijiang Chen,Ming Cui |
発行日 | 2023-10-27 11:43:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google