A RAG-based Question Answering System Proposal for Understanding Islam: MufassirQAS LLM

要約

宗教の教義や教えの複雑さや深さなど、宗教を学び、理解することには課題が存在します。
質問をするシステムとしてのチャットボットは、これらの課題を解決するのに役立ちます。
LLMチャットボットは、NLPテクニックを使用してトピック間のつながりを確立し、複雑な質問に正確に応答します。
これらの能力により、宗教への啓発には、質問をするチャットボットとしての啓発に最適です。
ただし、LLMSは幻覚として知られる誤った情報を生成する傾向もあります。
また、チャットボットの回答には、個人的な宗教的信念、異教徒間の対立、物議を醸すまたは繊細なトピックをs辱するコンテンツが含まれます。
それは、ヘイトスピーチを促進せず、または特定の人々のグループやその信念を怒らせることなく、そのようなケースを避けなければなりません。
この研究では、ベクターデータベースベースの検索拡張生成(RAG)アプローチを使用して、LLMの精度と透明性を高めます。
私たちの質問回答システムは「Mufassirqas」と呼ばれます。
トルコの文脈を含むいくつかのオープンアクセス本で構成されるデータベースを作成しました。
これらの本には、トルコの翻訳とイスラム教の解釈が含まれています。
このデータベースは、宗教関連の質問に答え、答えが信頼できることを確認するために利用されています。
LLMが使用するデータセットの関連部分は、答えとともに提示されます。
私たちは、人々の価値を尊重し、信頼できる結果を提供するために、有害、攻撃的、または無礼な反応を防ぐための指示を与えるシステムプロンプトを作成するために慎重に努力しました。
システムは、それぞれの本のページ番号や情報を入手するために参照される記事など、追加情報に答えて共有しています。
MufassirqasとChatGptも、デリケートな質問でテストされています。
システムでパフォーマンスが向上しました。
研究と強化はまだ進行中です。
結果と将来の作品が与えられます。

要約(オリジナル)

Challenges exist in learning and understanding religions, such as the complexity and depth of religious doctrines and teachings. Chatbots as question-answering systems can help in solving these challenges. LLM chatbots use NLP techniques to establish connections between topics and accurately respond to complex questions. These capabilities make it perfect for enlightenment on religion as a question-answering chatbot. However, LLMs also tend to generate false information, known as hallucination. Also, the chatbots’ responses can include content that insults personal religious beliefs, interfaith conflicts, and controversial or sensitive topics. It must avoid such cases without promoting hate speech or offending certain groups of people or their beliefs. This study uses a vector database-based Retrieval Augmented Generation (RAG) approach to enhance the accuracy and transparency of LLMs. Our question-answering system is called ‘MufassirQAS’. We created a database consisting of several open-access books that include Turkish context. These books contain Turkish translations and interpretations of Islam. This database is utilized to answer religion-related questions and ensure our answers are trustworthy. The relevant part of the dataset, which LLM also uses, is presented along with the answer. We have put careful effort into creating system prompts that give instructions to prevent harmful, offensive, or disrespectful responses to respect people’s values and provide reliable results. The system answers and shares additional information, such as the page number from the respective book and the articles referenced for obtaining the information. MufassirQAS and ChatGPT are also tested with sensitive questions. We got better performance with our system. Study and enhancements are still in progress. Results and future works are given.

arxiv情報

著者 Ahmet Yusuf Alan,Enis Karaarslan,Ömer Aydin
発行日 2025-03-18 17:14:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク