Determinantal Beam Search


経験的には、これにより、セットの重複が多くなることが多くなります。たとえば、文字列が 1 つの単語だけ異なる場合があります。
決定的ビーム探索は、決定点プロセス (DPP)、つまりセット内相互作用を本質的にエンコードするセットにわたるモデルと自然な関係を持っています。
ケーススタディでは、文字列サブシーケンス カーネルを使用して、シーケンス モデルから生成されたテキストでの N グラム カバレッジを明示的に促進します。


Beam search is a go-to strategy for decoding neural sequence models. The algorithm can naturally be viewed as a subset optimization problem, albeit one where the corresponding set function does not reflect interactions between candidates. Empirically, this leads to sets often exhibiting high overlap, e.g., strings may differ by only a single word. Yet in use-cases that call for multiple solutions, a diverse or representative set is often desired. To address this issue, we propose a reformulation of beam search, which we call determinantal beam search. Determinantal beam search has a natural relationship to determinantal point processes (DPPs), models over sets that inherently encode intra-set interactions. By posing iterations in beam search as a series of subdeterminant maximization problems, we can turn the algorithm into a diverse subset selection process. In a case study, we use the string subsequence kernel to explicitly encourage n-gram coverage in text generated from a sequence model. We observe that our algorithm offers competitive performance against other diverse set generation strategies in the context of language generation, while providing a more general approach to optimizing for diversity.


著者 Clara Meister,Martina Forster,Ryan Cotterell
発行日 2023-06-23 05:52:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク