A New Method for Cross-Lingual-based Semantic Role Labeling

要約

意味的役割のラベル付けは、自然言語処理において重要なタスクであり、自然言語をより深く理解できるようになります。
しかし、複数の言語で注釈が付けられたデータが不足していることが、研究者にとって課題となっています。
これに対処するために、モデル転送に基づく深層学習アルゴリズムが提案されています。
このアルゴリズムは、CoNLL2009 の英語部分とペルシア語の意味役割のコーパスで構成されるデータセットを利用します。
トレーニングの効率を最適化するために、各言語の教育データの 10% のみが使用されます。
提案されたモデルの結果は、Niksirt らのモデルと比較して大幅な改善を示しています。
単一言語モードでは、提案されたモデルは F1 スコアで 2.05 パーセントの改善を達成しましたが、クロスリンガル モードでは改善はさらに大きく、6.23 パーセントに達しました。
注目に値するのは、比較したモデルはセマンティック役割ラベル付けの 4 段階のうち 2 段階のみをトレーニングし、残りの 2 段階ではゴールデン データを使用したことです。
これは、提案されたモデルの実際の優位性が報告された数値を大幅に上回っていることを示唆しています。
意味的役割のラベル付けのための言語を越えた方法の開発は、特にさまざまな言語の注釈付きデータの不足に対処する上で有望です。
これらの進歩により、さまざまな言語コンテキストにわたる自然言語の理解と処理に関するさらなる研究への道が開かれます。

要約(オリジナル)

Semantic role labeling is a crucial task in natural language processing, enabling better comprehension of natural language. However, the lack of annotated data in multiple languages has posed a challenge for researchers. To address this, a deep learning algorithm based on model transfer has been proposed. The algorithm utilizes a dataset consisting of the English portion of CoNLL2009 and a corpus of semantic roles in Persian. To optimize the efficiency of training, only ten percent of the educational data from each language is used. The results of the proposed model demonstrate significant improvements compared to Niksirt et al.’s model. In monolingual mode, the proposed model achieved a 2.05 percent improvement on F1-score, while in cross-lingual mode, the improvement was even more substantial, reaching 6.23 percent. Worth noting is that the compared model only trained two of the four stages of semantic role labeling and employed golden data for the remaining two stages. This suggests that the actual superiority of the proposed model surpasses the reported numbers by a significant margin. The development of cross-lingual methods for semantic role labeling holds promise, particularly in addressing the scarcity of annotated data for various languages. These advancements pave the way for further research in understanding and processing natural language across different linguistic contexts.

arxiv情報

著者 Mohammad Ebrahimi,Behrouz Minaei Bidgoli,Nasim Khozouei
発行日 2024-08-28 16:06:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク