TPE: Towards Better Compositional Reasoning over Conceptual Tools with Multi-persona Collaboration

要約

大規模言語モデル (LLM) は、特に質問応答タスクにおいて、電卓や検索ツールなどのさまざまな関数ツールの使用を計画する際に、優れたパフォーマンスを発揮します。
この論文では、対話システムのコンテキスト内の概念的なツールを中心に、これらのツールの定義を拡張します。
概念的ツールは、体系的または調査的な思考を支援する認知概念を指定します。
これらの概念的なツールは、複数の心理戦略や個別指導戦略を 1 回のターンで動的に適用して役立つ応答を作成するなど、実際には重要な役割を果たします。
これらの概念的ツールを使用して LLM の推論および計画能力をさらに強化するために、マルチペルソナ コラボレーション フレームワークである Think-Plan-Execute (TPE) を導入します。
このフレームワークは、応答生成プロセスを 3 つの異なる役割 (考える人、計画する人、実行する人) に分離します。
具体的には、Thinker は対話の文脈で現れるユーザーの感情や好みなどの内部状態を分析し、グローバルなガイドラインを策定します。
次に、プランナーは、さまざまな概念的ツール (ソースや戦略など) を呼び出すための実行可能なプランを生成し、一方、エグゼキューターはすべての中間結果を一貫した応答にコンパイルします。
この構造化されたアプローチは、応答の説明可能性と制御可能性を強化するだけでなく、トークンの冗長性も削減します。
マルチソース (FoCus) およびマルチ戦略インタラクション (CIMA および PsyQA) を含む、さまざまな対話応答生成タスクにわたる TPE の有効性を実証します。
これは、機能的なツールだけでなく、より複雑なツールの学習を必要とする現実世界の対話対話を処理できる可能性を明らかにしています。
完全なコードとデータは複製用に公開されます。

要約(オリジナル)

Large language models (LLMs) have demonstrated exceptional performance in planning the use of various functional tools, such as calculators and retrievers, particularly in question-answering tasks. In this paper, we expand the definition of these tools, centering on conceptual tools within the context of dialogue systems. A conceptual tool specifies a cognitive concept that aids systematic or investigative thought. These conceptual tools play important roles in practice, such as multiple psychological or tutoring strategies being dynamically applied in a single turn to compose helpful responses. To further enhance the reasoning and planning capability of LLMs with these conceptual tools, we introduce a multi-persona collaboration framework: Think-Plan-Execute (TPE). This framework decouples the response generation process into three distinct roles: Thinker, Planner, and Executor. Specifically, the Thinker analyzes the internal status exhibited in the dialogue context, such as user emotions and preferences, to formulate a global guideline. The Planner then generates executable plans to call different conceptual tools (e.g., sources or strategies), while the Executor compiles all intermediate results into a coherent response. This structured approach not only enhances the explainability and controllability of responses but also reduces token redundancy. We demonstrate the effectiveness of TPE across various dialogue response generation tasks, including multi-source (FoCus) and multi-strategy interactions (CIMA and PsyQA). This reveals its potential to handle real-world dialogue interactions that require more complicated tool learning beyond just functional tools. The full code and data will be released for reproduction.

arxiv情報

著者 Hongru Wang,Huimin Wang,Lingzhi Wang,Minda Hu,Rui Wang,Boyang Xue,Hongyuan Lu,Fei Mi,Kam-Fai Wong
発行日 2023-09-28 01:18:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク