INA: An Integrative Approach for Enhancing Negotiation Strategies with Reward-Based Dialogue System

要約

本稿では、オンライン市場向けに設計された新しい交渉対話エージェントを提案します。
当社のエージェントは本質的に統合的です。つまり、価格だけでなく、取引バンドルからの品目の追加または削除などの他の要素についても交渉する機能を備えており、それにより、より柔軟で包括的な交渉エクスペリエンスを提供します。
この機能を有効にするために、Integrative Negotiation Dataset (IND) と呼ばれる新しいデータセットを作成します。
このデータセットの作成では、新しい半自動データ作成方法を導入します。これは、ネゴシエーションの意図、アクションの定義、およびユーザーとエージェント間の意図とアクションのシミュレーションを組み合わせて、潜在的な対話フローを生成します。
最後に、最先端の言語モデルである GPT-J のプロンプトを実行して、特定の意図に応じた対話を生成します。人間参加型のプロセスにより、ポスト編集や軽微なエラーの修正を行い、
高いデータ品質。
当社では、Integrative Negotiation Agent (INA) と呼ばれる交渉エージェントを訓練するための交渉タスクに特化した一連の新しい報酬を採用しています。
これらの報酬により、チャットボットはさまざまな状況に応じた要件や価格提案に適応できる効果的な交渉戦略を学習するようになります。
IND を活用することで、モデルをトレーニングし、交渉における報酬ベースの対話システムの有効性を評価する実験を実施します。
私たちの結果は、提案されたアプローチと報酬システムがエージェントの交渉能力を大幅に強化することを示しています。
INA は統合的な交渉に成功し、価格を動的に調整し、バンドル取引に商品を含めるか除外するかを交渉する能力を示しています。

要約(オリジナル)

In this paper, we propose a novel negotiation dialogue agent designed for the online marketplace. Our agent is integrative in nature i.e, it possesses the capability to negotiate on price as well as other factors, such as the addition or removal of items from a deal bundle, thereby offering a more flexible and comprehensive negotiation experience. We create a new dataset called Integrative Negotiation Dataset (IND) to enable this functionality. For this dataset creation, we introduce a new semi-automated data creation method, which combines defining negotiation intents, actions, and intent-action simulation between users and the agent to generate potential dialogue flows. Finally, the prompting of GPT-J, a state-of-the-art language model, is done to generate dialogues for a given intent, with a human-in-the-loop process for post-editing and refining minor errors to ensure high data quality. We employ a set of novel rewards, specifically tailored for the negotiation task to train our Negotiation Agent, termed as the Integrative Negotiation Agent (INA). These rewards incentivize the chatbot to learn effective negotiation strategies that can adapt to various contextual requirements and price proposals. By leveraging the IND, we train our model and conduct experiments to evaluate the effectiveness of our reward-based dialogue system for negotiation. Our results demonstrate that the proposed approach and reward system significantly enhance the agent’s negotiation capabilities. The INA successfully engages in integrative negotiations, displaying the ability to dynamically adjust prices and negotiate the inclusion or exclusion of items in a bundle deal

arxiv情報

著者 Zishan Ahmad,Suman Saurabh,Vaishakh Sreekanth Menon,Asif Ekbal,Roshni Ramnani,Anutosh Maitra
発行日 2023-10-27 15:31:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク