Romanian Multiword Expression Detection Using Multilingual Adversarial Training and Lateral Inhibition

要約

タイトル:
– マルチリンガルな敵対的トレーニングと横抑制を用いたルーマニア語の多語表現検出

要約:
– 多語表現は、大規模で言語学的に妥当な自然言語処理技術を開発するための重要な要素です。
– この論文では、PARSEME v1.2共有タスク用にリリースされたコーパス上でのルーマニア語の多語表現を自動的に識別する改善点について説明しています。
– 我々のアプローチは、最近導入された横抑制層と敵対的トレーニングに基づく多言語の観点を前提としており、使用された多言語言語モデルの性能を向上させることを目的としています。
– これらの2つの方法の助けを借りて、PARSEME 1.2エディションの主要なタスクである見えない多語表現のF1スコアを、XLM-RoBERTaにおいて約2.7%向上させました。
– さらに、我々の結果は、この競技に参加した過去の結果を上回るものとして、SOTAのパフォーマンスと見なすことができます。

要約(オリジナル)

Multiword expressions are a key ingredient for developing large-scale and linguistically sound natural language processing technology. This paper describes our improvements in automatically identifying Romanian multiword expressions on the corpus released for the PARSEME v1.2 shared task. Our approach assumes a multilingual perspective based on the recently introduced lateral inhibition layer and adversarial training to boost the performance of the employed multilingual language models. With the help of these two methods, we improve the F1-score of XLM-RoBERTa by approximately 2.7% on unseen multiword expressions, the main task of the PARSEME 1.2 edition. In addition, our results can be considered SOTA performance, as they outperform the previous results on Romanian obtained by the participants in this competition.

arxiv情報

著者 Andrei-Marius Avram,Verginica Barbu Mititelu,Dumitru-Clementin Cercel
発行日 2023-04-22 09:10:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク