Automatic Logical Forms improve fidelity in Table-to-Text generation

要約

Table-to-Text システムは、表などの構造化データから自然言語ステートメントを生成します。
エンドツーエンド技術は事実の正確性 (忠実度) が低いという欠点がありますが、以前の研究では、選択されたコンテンツとターゲット テキストのセマンティクスを表す手動論理形式 (LF) を使用すると利点が得られると報告されています。
手動ステップを考慮すると、自動 LF が効果的かどうか、あるいは改善がコンテンツの選択のみによってもたらされるかどうかは明らかではありませんでした。
テーブルとコンテンツの選択が与えられると、最初に LF が生成され、次にテキストのステートメントが生成される TLT を提示します。
自動 LF によって品質が向上し、LF を使用しない同等のシステムと比較して忠実度が 30 ポイント向上することを初めて示しました。
私たちの実験では、コンテンツの自動選択が最初に行われ、次にロジックからテキストへの生成が改善され、程度は低いですがテーブルからロジックへの解析が改善され、高い事実の正確性に対する残りの課題を定量化することができました。

要約(オリジナル)

Table-to-text systems generate natural language statements from structured data like tables. While end-to-end techniques suffer from low factual correctness (fidelity), a previous study reported gains when using manual logical forms (LF) that represent the selected content and the semantics of the target text. Given the manual step, it was not clear whether automatic LFs would be effective, or whether the improvement came from content selection alone. We present TlT which, given a table and a selection of the content, first produces LFs and then the textual statement. We show for the first time that automatic LFs improve quality, with an increase in fidelity of 30 points over a comparable system not using LFs. Our experiments allow to quantify the remaining challenges for high factual correctness, with automatic selection of content coming first, followed by better Logic-to-Text generation and, to a lesser extent, better Table-to-Logic parsing.

arxiv情報

著者 Iñigo Alonso,Eneko Agirre
発行日 2024-01-09 10:23:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク