HiCuLR: Hierarchical Curriculum Learning for Rhetorical Role Labeling of Legal Documents

要約

法的文書の修辞的役割ラベル付け (RRL) は、要約、意味論的事例検索、議論マイニングなどのさまざまな下流タスクにとって極めて重要です。
既存のアプローチは、法的文書の議論スタイルや修辞的役割に固有のさまざまな難易度を見落とすことがよくあります。
この研究では、RRL の階層型カリキュラム学習フレームワークである HiCuLR を提案します。
これは 2 つのカリキュラムを入れ子にしています。外側の層は修辞的役割レベルのカリキュラム (RC)、内側の層は文書レベルのカリキュラム (DC) です。
DC は、標準的な談話構造からの逸脱などの指標を利用して、文書の難易度に基づいて文書を分類し、簡単なものから難しいものまでモデルを文書に公開します。
RC は、レトリックの役割間の大まかな区別と細かい区別を識別するためにモデルを徐々に強化します。
4 つの RRL データセットに対する私たちの実験は HiCuLR の有効性を実証し、DC と RC の相補的な性質を強調しています。

要約(オリジナル)

Rhetorical Role Labeling (RRL) of legal documents is pivotal for various downstream tasks such as summarization, semantic case search and argument mining. Existing approaches often overlook the varying difficulty levels inherent in legal document discourse styles and rhetorical roles. In this work, we propose HiCuLR, a hierarchical curriculum learning framework for RRL. It nests two curricula: Rhetorical Role-level Curriculum (RC) on the outer layer and Document-level Curriculum (DC) on the inner layer. DC categorizes documents based on their difficulty, utilizing metrics like deviation from a standard discourse structure and exposes the model to them in an easy-to-difficult fashion. RC progressively strengthens the model to discern coarse-to-fine-grained distinctions between rhetorical roles. Our experiments on four RRL datasets demonstrate the efficacy of HiCuLR, highlighting the complementary nature of DC and RC.

arxiv情報

著者 T. Y. S. S. Santosh,Apolline Isaia,Shiyu Hong,Matthias Grabmair
発行日 2024-09-27 11:28:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク