Encoded Summarization: Summarizing Documents into Continuous Vector Space for Legal Case Retrieval

要約

ディープ ニューラル ネットワークを利用したフレーズ スコアリング フレームワークを介して文書を連続ベクトル空間に要約することで文書をエンコードする方法を導入することにより、法的事件の検索タスクに取り組む方法を示します。
一方で、ニューラル ネットワークで生成された語彙特徴と潜在特徴を組み合わせることによる利点を調査します。
私たちの実験は、ニューラルネットワークで生成された語彙特徴と潜在特徴が相互に補完し、検索システムのパフォーマンスを向上させることを示しています。
さらに、私たちの実験結果は、提供された要約の使用とエンコードされた要約の実行など、さまざまな側面における症例要約の重要性を示唆しています。
私たちのアプローチは、訴訟検索タスクの実験データセットで 65.6% と 57.6% の F1 を達成しました。

要約(オリジナル)

We present our method for tackling a legal case retrieval task by introducing our method of encoding documents by summarizing them into continuous vector space via our phrase scoring framework utilizing deep neural networks. On the other hand, we explore the benefits from combining lexical features and latent features generated with neural networks. Our experiments show that lexical features and latent features generated with neural networks complement each other to improve the retrieval system performance. Furthermore, our experimental results suggest the importance of case summarization in different aspects: using provided summaries and performing encoded summarization. Our approach achieved F1 of 65.6% and 57.6% on the experimental datasets of legal case retrieval tasks.

arxiv情報

著者 Vu Tran,Minh Le Nguyen,Satoshi Tojo,Ken Satoh
発行日 2023-09-15 06:33:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク