要約
我々は、談話関係のマルチラベル表現と単一ラベル表現の両方を学習できる新しいマルチタスク分類モデルを導入することにより、暗黙的談話関係認識(IDRR)に固有のあいまいさに対処します。
私たちのモデルは DiscoGeM コーパスのみでトレーニングされ、DiscoGeM と PDTB 3.0 コーパスの両方で評価されます。
我々は、DiscoGeM コーパスを使用して、マルチラベル IDRR 分類に関する最初のベンチマークを確立し、単一ラベル IDRR 分類に関する SOTA 結果を達成します。
最後に、単一ラベル IDRR 分類に関する DiscoGeM と PDTB 3.0 コーパス間の転移学習の可能性に関する最初の評価を示します。
要約(オリジナル)
We address the inherent ambiguity in Implicit Discourse Relation Recognition (IDRR) by introducing a novel multi-task classification model capable of learning both multi-label and single-label representations of discourse relations. Our model is trained exclusively on the DiscoGeM corpus and evaluated both on the DiscoGeM and the PDTB 3.0 corpus. We establish the first benchmark on multi-label IDRR classification and achieve SOTA results on single-label IDRR classification using the DiscoGeM corpus. Finally, we present the first evaluation on the potential of transfer learning between the DiscoGeM and the PDTB 3.0 corpus on single-label IDRR classification.
arxiv情報
著者 | Nelson Filipe Costa,Leila Kosseim |
発行日 | 2024-10-28 14:24:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google