NeCo@ALQAC 2023: Legal Domain Knowledge Acquisition for Low-Resource Languages through Data Enrichment

要約

近年、自然言語処理は法律分野を含むさまざまな分野で非常に人気が高まっています。
この論文では、データ強化による低リソース言語の法的領域知識の獲得に焦点を当て、2023 年自動法律質問応答コンテスト (ALQAC 2023) で提供されたベトナム語テキスト処理タスクに対する NeCo チームのソリューションを紹介します。
法的文書検索タスクの手法では、類似性ランキングと深層学習モデルの組み合わせを採用していますが、質問に応じて関連する法的記事から回答を抽出する必要がある 2 番目のタスクでは、さまざまな適応手法を提案しています。
さまざまな質問タイプ。
私たちのアプローチは、コンテストの両方のタスクで優れた結果を達成し、法律分野、特にリソースの少ない言語における質問応答システムの潜在的な利点と有効性を実証しています。

要約(オリジナル)

In recent years, natural language processing has gained significant popularity in various sectors, including the legal domain. This paper presents NeCo Team’s solutions to the Vietnamese text processing tasks provided in the Automated Legal Question Answering Competition 2023 (ALQAC 2023), focusing on legal domain knowledge acquisition for low-resource languages through data enrichment. Our methods for the legal document retrieval task employ a combination of similarity ranking and deep learning models, while for the second task, which requires extracting an answer from a relevant legal article in response to a question, we propose a range of adaptive techniques to handle different question types. Our approaches achieve outstanding results on both tasks of the competition, demonstrating the potential benefits and effectiveness of question answering systems in the legal field, particularly for low-resource languages.

arxiv情報

著者 Hai-Long Nguyen,Dieu-Quynh Nguyen,Hoang-Trung Nguyen,Thu-Trang Pham,Huu-Dong Nguyen,Thach-Anh Nguyen,Thi-Hai-Yen Vuong,Ha-Thanh Nguyen
発行日 2023-09-11 14:43:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク