要約
法文検索データセット LePaRD を紹介します。
LePaRD は、米国連邦司法の判例を文脈に沿って引用した膨大なコレクションです。
このデータセットは、法的成立の予測、つまり実務志向の困難な法的検索と推論タスクの作業を促進することを目的としています。
法的成立予測では、法的議論の文脈を考慮して、先例の裁判所判決から関連する判決を予測しようとします。
私たちは LePaRD に関するさまざまな検索アプローチを広範囲に評価し、分類が最も効果的であることがわかりました。
ただし、判例の予測は困難な作業であり、改善の余地が大きく残されていることに注意してください。
私たちは、LePaRD を出版することで、法調査に伴う負担を軽減することで司法へのアクセスを拡大することを約束する法的 NLP タスクに他の人が取り組むことを奨励することを願っています。
LePaRD データセットのサブセットは無料で利用でき、データセット全体は出版時に公開されます。
要約(オリジナル)
We present the Legal Passage Retrieval Dataset LePaRD. LePaRD is a massive collection of U.S. federal judicial citations to precedent in context. The dataset aims to facilitate work on legal passage prediction, a challenging practice-oriented legal retrieval and reasoning task. Legal passage prediction seeks to predict relevant passages from precedential court decisions given the context of a legal argument. We extensively evaluate various retrieval approaches on LePaRD, and find that classification appears to work best. However, we note that legal precedent prediction is a difficult task, and there remains significant room for improvement. We hope that by publishing LePaRD, we will encourage others to engage with a legal NLP task that promises to help expand access to justice by reducing the burden associated with legal research. A subset of the LePaRD dataset is freely available and the whole dataset will be released upon publication.
arxiv情報
著者 | Robert Mahari,Dominik Stammbach,Elliott Ash,Alex `Sandy’ Pentland |
発行日 | 2024-10-01 14:09:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google