R2GQA: Retriever-Reader-Generator Question Answering System to Support Students Understanding Legal Regulations in Higher Education


この記事では、ドキュメント レトリバー、マシン リーダー、および回答ジェネレーターの 3 つの主要コンポーネントで構成される、レトリーバー、リーダー、ジェネレーターの質問応答システムである R2GQA システムを提案します。
Retriever モジュールは、高度な情報検索技術を使用して、法的規制文書のデータセットから記事のコンテキストを抽出します。
Machine Reader モジュールは、最先端の自然言語理解アルゴリズムを利用して、取得した文書を理解して回答を抽出します。
最後に、ジェネレーター モジュールは、抽出された回答を合成して、法的規制に関する生徒の質問に対する簡潔で有益な回答を作成します。
さらに、大学の研修規制の領域で、厳格な構築プロセスを使用して 9,758 の質問と回答のペアで構成される ViRHE4QA データセットを構築しました。
さらに、R2GQA システムは、ベトナム語で抽象的な回答を提供する最初のシステムです。
このペーパーでは、ViRHE4QA データセット上の R2GQA システム内の各モジュールの設計と実装について説明し、それらの機能と相互作用に焦点を当てます。
一般に、R2GQA システムと ViRHE4QA データセットは、関連研究に大きく貢献し、学生が複雑な法的文書や規制に対処できるように支援し、情報に基づいた意思決定を行い、教育機関のポリシーを効果的に遵守できるようにすることを約束します。


In this article, we propose the R2GQA system, a Retriever-Reader-Generator Question Answering system, consisting of three main components: Document Retriever, Machine Reader, and Answer Generator. The Retriever module employs advanced information retrieval techniques to extract the context of articles from a dataset of legal regulation documents. The Machine Reader module utilizes state-of-the-art natural language understanding algorithms to comprehend the retrieved documents and extract answers. Finally, the Generator module synthesizes the extracted answers into concise and informative responses to questions of students regarding legal regulations. Furthermore, we built the ViRHE4QA dataset in the domain of university training regulations, comprising 9,758 question-answer pairs with a rigorous construction process. This is the first Vietnamese dataset in the higher regulations domain with various types of answers, both extractive and abstractive. In addition, the R2GQA system is the first system to offer abstractive answers in Vietnamese. This paper discusses the design and implementation of each module within the R2GQA system on the ViRHE4QA dataset, highlighting their functionalities and interactions. Furthermore, we present experimental results demonstrating the effectiveness and utility of the proposed system in supporting the comprehension of students of legal regulations in higher education settings. In general, the R2GQA system and the ViRHE4QA dataset promise to contribute significantly to related research and help students navigate complex legal documents and regulations, empowering them to make informed decisions and adhere to institutional policies effectively. Our dataset is available for research purposes.


著者 Phuc-Tinh Pham Do,Duy-Ngoc Dinh Cao,Khanh Quoc Tran,Kiet Van Nguyen
発行日 2024-09-04 16:12:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク