Uncertainty in Natural Language Generation: From Theory to Applications


強力な言語モデルの最近の進歩により、自然言語生成 (NLG) は、要約や翻訳などの従来のタスクを実行できるだけでなく、さまざまなアプリケーションへの自然言語インターフェイスとしても機能する重要なテクノロジとして浮上しています。
したがって、NLG システムが信頼できるものであることが重要です。たとえば、NLG システムが間違っている可能性が高い時期を示すなどです。
次に、NLG における主な不確実性の原因を言語学的観点から特徴付け、一般的な偶然論的/認識論的二分法よりも有益で忠実な 2 次元の分類法を提案します。


Recent advances of powerful Language Models have allowed Natural Language Generation (NLG) to emerge as an important technology that can not only perform traditional tasks like summarisation or translation, but also serve as a natural language interface to a variety of applications. As such, it is crucial that NLG systems are trustworthy and reliable, for example by indicating when they are likely to be wrong; and supporting multiple views, backgrounds and writing styles — reflecting diverse human sub-populations. In this paper, we argue that a principled treatment of uncertainty can assist in creating systems and evaluation protocols better aligned with these goals. We first present the fundamental theory, frameworks and vocabulary required to represent uncertainty. We then characterise the main sources of uncertainty in NLG from a linguistic perspective, and propose a two-dimensional taxonomy that is more informative and faithful than the popular aleatoric/epistemic dichotomy. Finally, we move from theory to applications and highlight exciting research directions that exploit uncertainty to power decoding, controllable generation, self-assessment, selective answering, active learning and more.


著者 Joris Baan,Nico Daheim,Evgenia Ilia,Dennis Ulmer,Haau-Sing Li,Raquel Fernández,Barbara Plank,Rico Sennrich,Chrysoula Zerva,Wilker Aziz
発行日 2023-07-28 17:51:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク