RIRAG: Regulatory Information Retrieval and Answer Generation

要約

政府の規制機関が発行する規制文書は、組織が法を遵守するために遵守しなければならないルール、ガイドライン、基準を定めています。
これらの文書は、その長さ、複雑さ、頻繁な更新を特徴としており、解釈が難しく、継続的なコンプライアンスを確保するには組織側に多大な時間と専門知識の割り当てが必要です。
Regulatory Natural Language Processing (RegNLP) は、規制規則と義務へのアクセスとその解釈を簡素化することを目的とした学際的な分野です。
質問と文章のペアを生成するタスクを導入します。このタスクでは、質問が自動的に作成され、関連する規制文章とペアになり、規制質問応答システムの開発が容易になります。
私たちは、アブダビ・グローバル・マーケット(ADGM)の金融規制文書のコレクションから派生した27,869の質問を含むObliQAデータセットを作成し、ベースラインの規制情報検索および回答生成(RIRAG)システムを設計し、それをテストする新しい評価指標であるRePASで評価します。
生成された回答が矛盾を回避しながら、関連するすべての義務を正確に把握しているかどうか。

要約(オリジナル)

Regulatory documents, issued by governmental regulatory bodies, establish rules, guidelines, and standards that organizations must adhere to for legal compliance. These documents, characterized by their length, complexity and frequent updates, are challenging to interpret, requiring significant allocation of time and expertise on the part of organizations to ensure ongoing compliance. Regulatory Natural Language Processing (RegNLP) is a multidisciplinary field aimed at simplifying access to and interpretation of regulatory rules and obligations. We introduce a task of generating question-passages pairs, where questions are automatically created and paired with relevant regulatory passages, facilitating the development of regulatory question-answering systems. We create the ObliQA dataset, containing 27,869 questions derived from the collection of Abu Dhabi Global Markets (ADGM) financial regulation documents, design a baseline Regulatory Information Retrieval and Answer Generation (RIRAG) system and evaluate it with RePASs, a novel evaluation metric that tests whether generated answers accurately capture all relevant obligations while avoiding contradictions.

arxiv情報

著者 Tuba Gokhan,Kexin Wang,Iryna Gurevych,Ted Briscoe
発行日 2024-12-02 18:13:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.CL, cs.ET, cs.IR パーマリンク