Neural Machine Translation for Malayalam Paraphrase Generation

要約

この研究では、英語の言い換えに利用可能なリソースと事前トレーニングされたニューラル機械翻訳 (NMT) モデルを利用して、マラヤーラム語で言い換えを生成する 4 つの方法を検討します。
BLEU、METEOR、コサイン類似度などの自動メトリクスと人間によるアノテーションの両方を使用して、結果の言い換えを評価します。
私たちの調査結果は、自動化された評価手段は人間の判断と一貫して一致していないため、マラヤーラム語にとって完全には適切ではない可能性があることを示唆しています。
この矛盾は、特に膠着性の高い言語では、より微妙な言い換え評価アプローチの必要性を強調しています。

要約(オリジナル)

This study explores four methods of generating paraphrases in Malayalam, utilizing resources available for English paraphrasing and pre-trained Neural Machine Translation (NMT) models. We evaluate the resulting paraphrases using both automated metrics, such as BLEU, METEOR, and cosine similarity, as well as human annotation. Our findings suggest that automated evaluation measures may not be fully appropriate for Malayalam, as they do not consistently align with human judgment. This discrepancy underscores the need for more nuanced paraphrase evaluation approaches especially for highly agglutinative languages.

arxiv情報

著者 Christeena Varghese,Sergey Koshelev,Ivan P. Yamshchikov
発行日 2024-01-31 13:40:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, I.2.7 パーマリンク