U-CREAT: Unsupervised Case Retrieval using Events extrAcTion

要約

法律分野における過去の判例検索 (PCR) のタスクは、特定のクエリ事件で関連する (事実と判例に基づいて) 過去の訴訟を自動的に引用することです。
PCR の研究をさらに促進するために、この論文では、PCR タスクの新しい大規模なベンチマーク (英語)、IL-PCR (Indian Legal Prior Case Retrieval) コーパスを提案します。
事件の関連性の複雑な性質と法的文書の長いサイズを考慮すると、BM25 は引用された先行文書をランク付けするための強力なベースラインであり続けます。
この研究では、法的事件の検索におけるイベントの役割を調査し、教師なし検索手法ベースのパイプライン U-CREAT (イベント抽出を使用した教師なし事件検索) を提案します。
提案された教師なし検索方法は、BM25 と比較してパフォーマンスが大幅に向上し、検索が大幅に高速化され、リアルタイム症例検索システムに適用できることがわかりました。
私たちが提案したシステムは汎用的であり、2 つの異なる法制度 (インドとカナダ) にわたって一般化されていることを示し、両方の法制度 (IL-PCR および COLIEE コーパス) のベンチマークで最先端のパフォーマンスを示します。

要約(オリジナル)

The task of Prior Case Retrieval (PCR) in the legal domain is about automatically citing relevant (based on facts and precedence) prior legal cases in a given query case. To further promote research in PCR, in this paper, we propose a new large benchmark (in English) for the PCR task: IL-PCR (Indian Legal Prior Case Retrieval) corpus. Given the complex nature of case relevance and the long size of legal documents, BM25 remains a strong baseline for ranking the cited prior documents. In this work, we explore the role of events in legal case retrieval and propose an unsupervised retrieval method-based pipeline U-CREAT (Unsupervised Case Retrieval using Events Extraction). We find that the proposed unsupervised retrieval method significantly increases performance compared to BM25 and makes retrieval faster by a considerable margin, making it applicable to real-time case retrieval systems. Our proposed system is generic, we show that it generalizes across two different legal systems (Indian and Canadian), and it shows state-of-the-art performance on the benchmarks for both the legal systems (IL-PCR and COLIEE corpora).

arxiv情報

著者 Abhinav Joshi,Akshat Sharma,Sai Kiran Tanikella,Ashutosh Modi
発行日 2023-07-11 13:51:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG パーマリンク