要約
我々は、言語規則と統計的アプローチを組み合わせることによって自動自然言語生成 (NLG) を実行する、英語の文章を生成するための自動テキスト拡張システムを紹介します。
ここでの「自動」とは、システムが最小限の単語セットから一貫性のある正しい文章を生成できることを意味します。
当初から、設計はモジュール式であり、他の言語にも適応できます。
この適応性は、その最大の利点の 1 つです。
英語については、広範囲をカバーする高精度の aLexiE 語彙集を作成しました。これ自体が貢献を示しています。
私たちは、結果として得られた NLG ライブラリを、Augmentative and Alternative Communication (AAC) の概念実証で、直接 (コーパス文の再生成による) と、NLG 分野で人気のあるコーパスを使用した手動 (注釈から) の両方で評価しました。
私たちは、アドホックなスペイン語と英語の対訳コーパスを使用して、英語とスペイン語のテキスト展開の品質を比較することにより 2 番目の分析を実行しました。
このシステムは、レポートやニュース生成などの他の領域にも適用される可能性があります。
要約(オリジナル)
We present an automatic text expansion system to generate English sentences, which performs automatic Natural Language Generation (NLG) by combining linguistic rules with statistical approaches. Here, ‘automatic’ means that the system can generate coherent and correct sentences from a minimum set of words. From its inception, the design is modular and adaptable to other languages. This adaptability is one of its greatest advantages. For English, we have created the highly precise aLexiE lexicon with wide coverage, which represents a contribution on its own. We have evaluated the resulting NLG library in an Augmentative and Alternative Communication (AAC) proof of concept, both directly (by regenerating corpus sentences) and manually (from annotations) using a popular corpus in the NLG field. We performed a second analysis by comparing the quality of text expansion in English to Spanish, using an ad-hoc Spanish-English parallel corpus. The system might also be applied to other domains such as report and news generation.
arxiv情報
著者 | Silvia García Méndez,Milagros Fernández Gavilanes,Enrique Costa Montenegro,Jonathan Juncal Martínez,Francisco Javier González Castaño,Ehud Reiter |
発行日 | 2024-05-28 16:48:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google