A Library for Automatic Natural Language Generation of Spanish Texts

要約

この記事では、意味のある単語 (名詞、動詞、形容詞など) の最小限のセットからスペイン語の文章を自然言語生成 (NLG) するための新しいシステムを紹介します。このシステムは、他の最先端のソリューションとは異なり、NLG を実行します。
知識ベースと統計的アプローチの両方を活用して、完全に自動化された方法でタスクを実行します。
このシステムは、語彙と文法に関する言語知識に基づいて、ユーザーが提示した主要な単語セットから、完全で一貫性があり、正しく綴られた文章を生成できます。
このシステムは、統合可能、移植可能、効率的になるように設計されており、設計により他の言語にも簡単に適応でき、さまざまなデジタル デバイスに統合することが可能です。
開発中に、広範囲をカバーし高精度なスペイン語の補助辞書 aLexiS と、自由に利用できる定節文法からの構文ツリーも作成しました。
結果として得られる NLG ライブラリは、自動と手動 (アノテーション) の両方で評価されています。
このシステムは、コミュニケーションの強化や管理レポートやニュースの自動生成など、さまざまなアプリケーション ドメインで使用できる可能性があります。

要約(オリジナル)

In this article we present a novel system for natural language generation (NLG) of Spanish sentences from a minimum set of meaningful words (such as nouns, verbs and adjectives) which, unlike other state-of-the-art solutions, performs the NLG task in a fully automatic way, exploiting both knowledge-based and statistical approaches. Relying on its linguistic knowledge of vocabulary and grammar, the system is able to generate complete, coherent and correctly spelled sentences from the main word sets presented by the user. The system, which was designed to be integrable, portable and efficient, can be easily adapted to other languages by design and can feasibly be integrated in a wide range of digital devices. During its development we also created a supplementary lexicon for Spanish, aLexiS, with wide coverage and high precision, as well as syntactic trees from a freely available definite-clause grammar. The resulting NLG library has been evaluated both automatically and manually (annotation). The system can potentially be used in different application domains such as augmentative communication and automatic generation of administrative reports or news.

arxiv情報

著者 Silvia García-Méndez,Milagros Fernández-Gavilanes,Enrique Costa-Montenegro,Jonathan Juncal-Martínez,F. Javier González-Castaño
発行日 2024-05-27 15:44:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク