Discovering Significant Topics from Legal Decisions with Selective Inference

要約

私たちは、ペナルティ付き回帰と選択後の重要性テストを通じてトピックモデルで合成された特徴を渡すことにより、法的判決文から重要なトピックを発見するための自動パイプラインを提案および評価します。
この方法では、結果と有意に相関する事件のトピック、重要なトピックについての洞察を得るために手動で解釈できるトピックと単語の分布、各トピックの代表的なケースを特定するために使用できる事件とトピックの重みを特定します。
ドメイン名紛争の新しいデータセットと欧州人権裁判所の違反事件の正規データセットを使用してこの方法を実証します。
潜在意味分析に基づくトピック モデルと言語モデルの埋め込みが評価されます。
パイプラインによって得られたトピックが両方の分野の法理論と一致しており、他の関連する法的分析タスクに役立つ可能性があることを示します。

要約(オリジナル)

We propose and evaluate an automated pipeline for discovering significant topics from legal decision texts by passing features synthesized with topic models through penalised regressions and post-selection significance tests. The method identifies case topics significantly correlated with outcomes, topic-word distributions which can be manually-interpreted to gain insights about significant topics, and case-topic weights which can be used to identify representative cases for each topic. We demonstrate the method on a new dataset of domain name disputes and a canonical dataset of European Court of Human Rights violation cases. Topic models based on latent semantic analysis as well as language model embeddings are evaluated. We show that topics derived by the pipeline are consistent with legal doctrines in both areas and can be useful in other related legal analysis tasks.

arxiv情報

著者 Jerrold Soh
発行日 2024-01-02 07:00:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク