LegalDuet: Learning Fine-grained Representations for Legal Judgment Prediction via a Dual-View Contrastive Learning

要約

法的判断予測(LJP)は、法的事件の判決の結果を自動的に予測することを目的とした法的人工知能の基本的なタスクです。
既存のLJPモデルは、主に言語モデルを対比トレーニングすることにより、犯罪事実の説明内で法的トリガーを特定することに焦点を当てています。
ただし、これらのLJPモデルは、より正確な予測を生み出すために重要な判断間の微妙な違いを効果的に区別することを学ぶことの重要性を見落としています。
この論文では、LegalDuetを提案します。LegalDuetは、言語モデルを継続的に前提としており、法的ケースを表現するためのよりカスタマイズされた埋め込みスペースを学習します。
具体的には、Legalduetは、言語モデルを継続的に将来的に植え付けるためのデュアルビューメカニズムを設計します。1)Law Case Clustering同様のケースをハードネガティブと同様のケースを取得し、混乱するケースを区別するための対照的なトレーニングを使用します。
2)法的決定マッチングは、犯罪事実の説明内の法的手がかりを特定することを目的としており、それらを正しい法的決定を含む推論の連鎖と一致させることを目的としています。
CAIL2018データセットに関する実験は、Legalduetの有効性を示しています。
さらなる分析により、Legalduetは、予測の不確実性を低減し、刑事告発の分離性を高めることにより、混乱する刑事告発を区別する前提条件の言語モデルの能力を改善することが明らかになりました。
この実験は、Legalduetがより集中した識別可能な埋め込みスペースを生成し、犯罪事実を対応する法的決定と効果的に整合することを示しています。
このコードは、https://github.com/neuir/legalduetで入手できます。

要約(オリジナル)

Legal Judgment Prediction (LJP) is a fundamental task of legal artificial intelligence, aiming to automatically predict the judgment outcomes of legal cases. Existing LJP models primarily focus on identifying legal triggers within criminal fact descriptions by contrastively training language models. However, these LJP models overlook the importance of learning to effectively distinguish subtle differences among judgments, which is crucial for producing more accurate predictions. In this paper, we propose LegalDuet, which continuously pretrains language models to learn a more tailored embedding space for representing legal cases. Specifically, LegalDuet designs a dual-view mechanism to continuously pretrain language models: 1) Law Case Clustering retrieves similar cases as hard negatives and employs contrastive training to differentiate among confusing cases; 2) Legal Decision Matching aims to identify legal clues within criminal fact descriptions to align them with the chain of reasoning that contains the correct legal decision. Our experiments on the CAIL2018 dataset demonstrate the effectiveness of LegalDuet. Further analysis reveals that LegalDuet improves the ability of pretrained language models to distinguish confusing criminal charges by reducing prediction uncertainty and enhancing the separability of criminal charges. The experiments demonstrate that LegalDuet produces a more concentrated and distinguishable embedding space, effectively aligning criminal facts with corresponding legal decisions. The code is available at https://github.com/NEUIR/LegalDuet.

arxiv情報

著者 Buqiang Xu,Xin Dai,Zhenghao Liu,Huiyuan Xie,Xiaoyuan Yi,Shuo Wang,Yukun Yan,Liner Yang,Yu Gu,Ge Yu
発行日 2025-05-01 10:32:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク