Planning with Diffusion Models for Target-Oriented Dialogue Systems

要約

ターゲット指向の対話(TOD)は、LLM時代の重要な課題であり、戦略的対話計画が特定のターゲットに向けて会話を向けるために重要です。
ただし、既存の対話計画方法は、段階的な連続的な方法で対話計画を生成し、複合エラーや近視の行動に悩まされる可能性があります。
これらの制限に対処するために、拡散モデルを活用して非シーケンシャルダイアログ計画を可能にする新しい対話計画フレームワークDifftodを紹介します。
difftodは、条件付きガイダンスを備えた軌跡の生成問題として対話計画を定式化し、拡散言語モデルを活用して、対話の軌跡の可能性を推定します。
Dialogue Action Strategiesを最適化するために、Difftodは、さまざまなターゲットタイプの3つのカスタマイズされたガイダンスメカニズムを導入し、テスト時に多様なTODターゲットに対する柔軟なガイダンスを提供します。
3つの多様なTOD環境にわたる広範な実験は、Difftodが非微細なLookahead Explorationを効果的に実行し、非シーケンシャルな対話計画を通じて長い地平線にわたってアクション戦略を最適化し、複雑で多様な対話シナリオにわたって強い柔軟性を実証できることを示しています。
私たちのコードとデータは、https://anonymous.4open.science/r/difftodからアクセスできます。

要約(オリジナル)

Target-Oriented Dialogue (TOD) remains a significant challenge in the LLM era, where strategic dialogue planning is crucial for directing conversations toward specific targets. However, existing dialogue planning methods generate dialogue plans in a step-by-step sequential manner, and may suffer from compounding errors and myopic actions. To address these limitations, we introduce a novel dialogue planning framework, DiffTOD, which leverages diffusion models to enable non-sequential dialogue planning. DiffTOD formulates dialogue planning as a trajectory generation problem with conditional guidance, and leverages a diffusion language model to estimate the likelihood of the dialogue trajectory. To optimize the dialogue action strategies, DiffTOD introduces three tailored guidance mechanisms for different target types, offering flexible guidance towards diverse TOD targets at test time. Extensive experiments across three diverse TOD settings show that DiffTOD can effectively perform non-myopic lookahead exploration and optimize action strategies over a long horizon through non-sequential dialogue planning, and demonstrates strong flexibility across complex and diverse dialogue scenarios. Our code and data are accessible through https://anonymous.4open.science/r/DiffTOD.

arxiv情報

著者 Hanwen Du,Bo Peng,Xia Ning
発行日 2025-04-23 16:27:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク