Enhancing Pipeline-Based Conversational Agents with Large Language Models

要約

AI と深層学習の最新の進歩は、GPT-4 などの大規模言語モデル (LLM) ベースのエージェントの画期的な進歩につながりました。
ただし、商用の会話エージェント開発ツールの多くはパイプラインベースであり、人間のような会話を行うには限界があります。
このペーパーでは、1) 設計および開発フェーズ、2) 運用中の 2 つのフェーズで、パイプライン ベースの会話エージェントを強化する LLM の機能を調査します。
1) では、LLM はトレーニング データの生成、エンティティと同義語の抽出、ローカリゼーション、ペルソナの設計を支援できます。
2) では、LLM は、会話の破綻を防ぎ、範囲外の質問を処理するための文脈化、意図の分類、発話の自動修正、応答の言い換え、曖昧さ回避の質問の作成、要約、クローズド質問応答機能の有効化を支援できます。
上記のシナリオを実際の例で実証するために、プライベート バンキング ドメインで GPT-4 を使用した非公式の実験を実施しました。
企業は、プライバシー上の懸念や既存のエコシステム内での緊密な統合の必要性を理由に、パイプラインベースのエージェントを完全に LLM に置き換えることに躊躇する場合があります。
LLM がパイプライン ベースのエージェントに統合されるハイブリッド アプローチにより、既存のシステムの統合とプライバシー保護を維持しながら、LLM の機能を活用することで、エージェントの構築と実行にかかる時間とコストを節約できます。

要約(オリジナル)

The latest advancements in AI and deep learning have led to a breakthrough in large language model (LLM)-based agents such as GPT-4. However, many commercial conversational agent development tools are pipeline-based and have limitations in holding a human-like conversation. This paper investigates the capabilities of LLMs to enhance pipeline-based conversational agents during two phases: 1) in the design and development phase and 2) during operations. In 1) LLMs can aid in generating training data, extracting entities and synonyms, localization, and persona design. In 2) LLMs can assist in contextualization, intent classification to prevent conversational breakdown and handle out-of-scope questions, auto-correcting utterances, rephrasing responses, formulating disambiguation questions, summarization, and enabling closed question-answering capabilities. We conducted informal experiments with GPT-4 in the private banking domain to demonstrate the scenarios above with a practical example. Companies may be hesitant to replace their pipeline-based agents with LLMs entirely due to privacy concerns and the need for deep integration within their existing ecosystems. A hybrid approach in which LLMs’ are integrated into the pipeline-based agents allows them to save time and costs of building and running agents by capitalizing on the capabilities of LLMs while retaining the integration and privacy safeguards of their existing systems.

arxiv情報

著者 Mina Foosherian,Hendrik Purwins,Purna Rathnayake,Touhidul Alam,Rui Teimao,Klaus-Dieter Thoben
発行日 2023-09-07 14:43:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T50, cs.AI, cs.CL, cs.LG, I.2.7, stat.ML パーマリンク