Unsupervised Paraphrasing of Multiword Expressions

要約

本論文では、文脈における多言語表現(MWE)の言い換えのための教師なしアプローチを提案する。我々のモデルは、単言語コーパスデータと事前に学習された言語モデル(微調整なし)のみを用い、辞書などの外部リソースを一切利用することはない。本手法をSemEval 2022 idiomatic semantic text similarity taskで評価し、すべての教師なしシステムおよびライバルとなる教師ありシステムを凌駕することを示す。

要約(オリジナル)

We propose an unsupervised approach to paraphrasing multiword expressions (MWEs) in context. Our model employs only monolingual corpus data and pre-trained language models (without fine-tuning), and does not make use of any external resources such as dictionaries. We evaluate our method on the SemEval 2022 idiomatic semantic text similarity task, and show that it outperforms all unsupervised systems and rivals supervised systems.

arxiv情報

著者 Takashi Wada,Yuji Matsumoto,Timothy Baldwin,Jey Han Lau
発行日 2023-06-02 11:06:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク