End-to-End Autoregressive Retrieval via Bootstrapping for Smart Reply Systems

要約

返信提案システムは、多くのインスタント メッセージング システムや電子メール システムの主要コンポーネントです。
ただし、個々の応答ではなく一連の応答を生成する必要があるため、このタスクは、個々のメッセージと応答の類似性のみを考慮する、すぐに使用できる検索アーキテクチャにはあまり適していません。
その結果、これらのシステムは出力を多様化するために追加の後処理モジュールに依存することがよくあります。
ただし、これらのアプローチは最終的に初期取得者のパフォーマンスによってボトルネックになり、実際には下流の多様化モジュールに十分に多様なオプションを提示するのに苦労し、提案がユーザーにとって関連性が低くなります。
この論文では、ブートストラップによって取得された (メッセージ、応答セット) ペアのデータセットからスマート応答タスクをエンドツーエンドで学習する、自己回帰のテキスト間検索モデルを通じてこのパイプラインを根本的に簡素化する新しいアプローチを検討します。

実証結果では、この方法が 3 つのデータセットにわたって一貫して一連の最先端のベースラインを上回り、最良のベースライン アプローチと比較して関連性が 5.1% ~ 17.9%、多様性が 0.5% ~ 63.1% 向上したことが示されています。

私たちはコードを公開しています。

要約(オリジナル)

Reply suggestion systems represent a staple component of many instant messaging and email systems. However, the requirement to produce sets of replies, rather than individual replies, makes the task poorly suited for out-of-the-box retrieval architectures, which only consider individual message-reply similarity. As a result, these system often rely on additional post-processing modules to diversify the outputs. However, these approaches are ultimately bottlenecked by the performance of the initial retriever, which in practice struggles to present a sufficiently diverse range of options to the downstream diversification module, leading to the suggestions being less relevant to the user. In this paper, we consider a novel approach that radically simplifies this pipeline through an autoregressive text-to-text retrieval model, that learns the smart reply task end-to-end from a dataset of (message, reply set) pairs obtained via bootstrapping. Empirical results show this method consistently outperforms a range of state-of-the-art baselines across three datasets, corresponding to a 5.1%-17.9% improvement in relevance, and a 0.5%-63.1% improvement in diversity compared to the best baseline approach. We make our code publicly available.

arxiv情報

著者 Benjamin Towle,Ke Zhou
発行日 2023-10-29 09:56:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク