要約
この研究では、非構造化テキスト データ内の法律違反を検出し、これらの違反を影響を受ける可能性のある個人に関連付けるための、固有表現解決 (NER) と自然言語推論 (NLI) という 2 つのシステムをそれぞれ紹介します。
これらのシステムは両方とも、LLM ベースラインを上回る軽量の DeBERTa ベースのエンコーダです。
提案された NER システムは、違反の特定に焦点を当てた LegalLens チャレンジのサブタスク A で 60.01\% の F1 スコアを達成しました。
提案された NLI システムは、LegalLens チャレンジのサブタスク B で 84.73\% の F1 スコアを達成しました。このタスクでは、これらの違反を集団訴訟の既存の法的申し立てと照合して解決することに焦点を当てています。
LegalLens リーダーボードでは、当社の NER システムが 6 位、NLI システムが 5 位にランクされました。
トレーニング済みモデルと推論スクリプトを公開します。
要約(オリジナル)
In this work, we present two systems — Named Entity Resolution (NER) and Natural Language Inference (NLI) — for detecting legal violations within unstructured textual data and for associating these violations with potentially affected individuals, respectively. Both these systems are lightweight DeBERTa based encoders that outperform the LLM baselines. The proposed NER system achieved an F1 score of 60.01\% on Subtask A of the LegalLens challenge, which focuses on identifying violations. The proposed NLI system achieved an F1 score of 84.73\% on Subtask B of the LegalLens challenge, which focuses on resolving these violations by matching them with pre-existing legal complaints of class action cases. Our NER system ranked sixth and NLI system ranked fifth on the LegalLens leaderboard. We release the trained models and inference scripts.
arxiv情報
著者 | Shikha Bordia |
発行日 | 2024-10-30 12:42:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google