Judgement Citation Retrieval using Contextual Similarity

要約

従来、法律研究の分野では、複雑な事件の説明から関連する引用を検索するには、手作業とキーワードベースの検索アプリケーションが必要であり、法律専門用語を理解する専門知識が必要でした。
訴訟事件の説明には法律専門家や研究者にとって極めて重要な情報が含まれており、より効率的で自動化されたアプローチが必要です。
私たちは、自然言語処理 (NLP) と機械学習技術を組み合わせて、訴訟事件の説明の整理と利用を強化する方法論を提案します。
このアプローチは、最先端の埋め込みモデルを利用したテキスト埋め込みの作成を中心に展開します。
私たちの方法論は、教師なしクラスタリングと教師あり引用検索という 2 つの主な目的に取り組み、どちらも引用抽出プロセスを自動化するように設計されています。
提案された方法論はあらゆるデータセットに使用できますが、米国最高裁判所 (SCOTUS) データセットを採用し、顕著な結果をもたらしました。
私たちの方法論は 90.9% という驚異的な精度を達成しました。
労働集約的なプロセスを自動化することで、法律研究においてより効率的で時間を節約し、アクセスしやすい環境への道を切り開き、法律専門家、学者、研究者に利益をもたらします。

要約(オリジナル)

Traditionally in the domain of legal research, the retrieval of pertinent citations from intricate case descriptions has demanded manual effort and keyword-based search applications that mandate expertise in understanding legal jargon. Legal case descriptions hold pivotal information for legal professionals and researchers, necessitating more efficient and automated approaches. We propose a methodology that combines natural language processing (NLP) and machine learning techniques to enhance the organization and utilization of legal case descriptions. This approach revolves around the creation of textual embeddings with the help of state-of-art embedding models. Our methodology addresses two primary objectives: unsupervised clustering and supervised citation retrieval, both designed to automate the citation extraction process. Although the proposed methodology can be used for any dataset, we employed the Supreme Court of The United States (SCOTUS) dataset, yielding remarkable results. Our methodology achieved an impressive accuracy rate of 90.9%. By automating labor-intensive processes, we pave the way for a more efficient, time-saving, and accessible landscape in legal research, benefiting legal professionals, academics, and researchers.

arxiv情報

著者 Akshat Mohan Dasula,Hrushitha Tigulla,Preethika Bhukya
発行日 2024-08-15 06:11:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG パーマリンク