Assisting Language Learners: Automated Trans-Lingual Definition Generation via Contrastive Prompt Learning

要約

標準定義生成タスクでは、単一言語の定義 (英語の単語に対する英語の定義など) を自動的に生成する必要がありますが、生成された定義が言語学習者にとってなじみのない単語で構成されている可能性があることを無視しています。
この研究では、別の言語、つまり母語話者の言語で定義を生成することを目的とした、トランスリンガル定義生成 (TLDG) という新しいタスクを提案します。
最初に、このタスクの教師なしの方法を調査し、多言語機械翻訳モデルを微調整する簡単な実装を構築します。
次に、生成の質をさらに高めるために、プロンプト組み合わせと対照的プロンプト学習という 2 つの新しい方法を開発します。
私たちのメソッドは、リソースが豊富な設定とリソースが少ない設定の両方で、ベースラインのパイプラインメソッドと比較して評価され、より高品質の言語間定義を生成する際のその優位性を経験的に確立しています。

要約(オリジナル)

The standard definition generation task requires to automatically produce mono-lingual definitions (e.g., English definitions for English words), but ignores that the generated definitions may also consist of unfamiliar words for language learners. In this work, we propose a novel task of Trans-Lingual Definition Generation (TLDG), which aims to generate definitions in another language, i.e., the native speaker’s language. Initially, we explore the unsupervised manner of this task and build up a simple implementation of fine-tuning the multi-lingual machine translation model. Then, we develop two novel methods, Prompt Combination and Contrastive Prompt Learning, for further enhancing the quality of the generation. Our methods are evaluated against the baseline Pipeline method in both rich- and low-resource settings, and we empirically establish its superiority in generating higher-quality trans-lingual definitions.

arxiv情報

著者 Hengyuan Zhang,Dawei Li,Yanran Li,Chenming Shang,Chufan Shi,Yong Jiang
発行日 2023-06-09 17:32:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク