Probabilistically-Sound Beam Search with Masked Language Models


マスク言語モデル (MLM) を使用したビーム探索は、自己回帰モデルとは異なり、シーケンス全体の同時確率分布がすぐに利用できないため、部分的には困難です。
ここでは、MLM を使用したビーム探索のための確率的に適切な方法を紹介します。
まず、標準のビーム検索を使用して MLM によるテキスト埋め込みを実行することが理論的に適切である条件を明確にします。
次に、いくつかのドメインにわたる MLM を使用したいくつかの充填アプローチを比較した経験的結果を示します。


Beam search with masked language models (MLMs) is challenging in part because joint probability distributions over sequences are not readily available, unlike for autoregressive models. However, estimating such distributions has important domain-specific applications such as ancient text restoration and protein engineering. Here we present probabilistically-sound methods for beam search with MLMs. First, we clarify the conditions under which it is theoretically sound to perform text infilling with MLMs using standard beam search. When these conditions fail, we provide a probabilistically-sound modification with no additional computational complexity and demonstrate that it is superior to the aforementioned beam search in the expected conditions. We then present empirical results comparing several infilling approaches with MLMs across several domains.


著者 Creston Brooks,Robert Calef,Charlie Cowen-Breen,Anna Sappington
発行日 2024-07-09 09:32:52+00:00
カテゴリー: cs.CL, cs.LG パーマリンク