Automatic Logical Forms improve fidelity in Table-to-Text generation


Table-to-Text システムは、表などの構造化データから自然言語ステートメントを生成します。
エンドツーエンド技術は事実の正確性 (忠実度) が低いという欠点がありますが、以前の研究では、選択されたコンテンツとターゲット テキストのセマンティクスを表す手動論理形式 (LF) を使用すると利点が得られると報告されています。
手動ステップを考慮すると、自動 LF が効果的かどうか、あるいは改善がコンテンツの選択のみによってもたらされるかどうかは明らかではありませんでした。
テーブルとコンテンツの選択が与えられると、最初に LF が生成され、次にテキストのステートメントが生成される TLT を提示します。
自動 LF によって品質が向上し、LF を使用しない同等のシステムと比較して忠実度が 30 ポイント向上することを初めて示しました。


Table-to-text systems generate natural language statements from structured data like tables. While end-to-end techniques suffer from low factual correctness (fidelity), a previous study reported gains when using manual logical forms (LF) that represent the selected content and the semantics of the target text. Given the manual step, it was not clear whether automatic LFs would be effective, or whether the improvement came from content selection alone. We present TlT which, given a table and a selection of the content, first produces LFs and then the textual statement. We show for the first time that automatic LFs improve quality, with an increase in fidelity of 30 points over a comparable system not using LFs. Our experiments allow to quantify the remaining challenges for high factual correctness, with automatic selection of content coming first, followed by better Logic-to-Text generation and, to a lesser extent, better Table-to-Logic parsing.


著者 Iñigo Alonso,Eneko Agirre
発行日 2024-01-09 10:23:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク