Context-Aware Document Simplification



– 従来、テキストの簡略化に関する研究は主に文章単位に注目してきた。
– しかし、文書の簡略化に対しては、これらのアプローチを単に文章ごとに反復適用するだけでは、議論の構造を適切に保存できず、結果として劣悪な出力品質になる。
– 最近、制御可能な簡略化の戦略が、文書単位の計画(文書レベルの簡略化操作のシーケンス)をまず生成し、この計画を使用して下流の文章レベルの簡略化を指導することで、文書の簡略化において最先端の結果を出すために活用されてきた。
– しかし、簡略化モデルには、ローカルな文章間ドキュメントの文脈に直接アクセスできないため、表面的な実現に悪影響を与える可能性があり、まだ限界がある。
– 我々は、より大きなテキスト単位を反復するか、文書コンテキストの高レベル表現に注目することによって、簡略化プロセス自体で文書コンテキストを使用するさまざまなシステムを探索する。
– これにより、文書の簡略化タスクにおいて最先端のパフォーマンスを達成し、計画のガイダンスを依存しなくてもそうなる。
– さらに、システムの変種のパフォーマンスと効率のトレードオフを調査し、いつそれぞれが適したかを提案することで、システムを取り巻く文脈を考慮した簡略化手法を調べた。


To date, most work on text simplification has focused on sentence-level inputs. Early attempts at document simplification merely applied these approaches iteratively over the sentences of a document. However, this fails to coherently preserve the discourse structure, leading to suboptimal output quality. Recently, strategies from controllable simplification have been leveraged to achieve state-of-the-art results on document simplification by first generating a document-level plan (a sequence of sentence-level simplification operations) and using this plan to guide sentence-level simplification downstream. However, this is still limited in that the simplification model has no direct access to the local inter-sentence document context, likely having a negative impact on surface realisation. We explore various systems that use document context within the simplification process itself, either by iterating over larger text units or by extending the system architecture to attend over a high-level representation of document context. In doing so, we achieve state-of-the-art performance on the document simplification task, even when not relying on plan-guidance. Further, we investigate the performance and efficiency tradeoffs of system variants and make suggestions of when each should be preferred.


著者 Liam Cripwell,Joël Legrand,Claire Gardent
発行日 2023-05-10 16:06:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CL パーマリンク