Evaluation of NMT-Assisted Grammar Transfer for a Multi-Language Configurable Data-to-Text System

要約

多言語データからテキストの生成の1つのアプローチは、文法構成をソース言語から各ターゲット言語に前もって変換することです。
これらの構成は、Surface RealizerおよびDocument Planning段階で使用され、出力を生成します。
この論文では、このアプローチのルールベースのNLG実装について説明します。このアプローチでは、1回限りの人間のレビューと組み合わせたニューラルマシン翻訳(NMT)によって構成が翻訳され、言語間文法依存性モデルを導入して多言語NLGを作成します。
ソースデータからテキストを生成するシステム、ループ内の人間なしで生成フェーズをスケーリングします。
さらに、自動翻訳されたテキストに人間の編集後評価の方法を紹介します。
Sportsett:Basketball Datasetでの評価は、NLGシステムがうまく機能し、翻訳タスクにおける文法的正しさを強調していることを示しています。

要約(オリジナル)

One approach for multilingual data-to-text generation is to translate grammatical configurations upfront from the source language into each target language. These configurations are then used by a surface realizer and in document planning stages to generate output. In this paper, we describe a rule-based NLG implementation of this approach where the configuration is translated by Neural Machine Translation (NMT) combined with a one-time human review, and introduce a cross-language grammar dependency model to create a multilingual NLG system that generates text from the source data, scaling the generation phase without a human in the loop. Additionally, we introduce a method for human post-editing evaluation on the automatically translated text. Our evaluation on the SportSett:Basketball dataset shows that our NLG system performs well, underlining its grammatical correctness in translation tasks.

arxiv情報

著者 Andreas Madsack,Johanna Heininger,Adela Schneider,Ching-Yi Chen,Christian Eckard,Robert Weißgraeber
発行日 2025-01-27 15:25:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク