Building Domain-Specific LLMs Faithful To The Islamic Worldview: Mirage or Technical Possibility?

要約

大規模言語モデル (LLM) は、多数の自然言語理解のユースケースにわたって顕著なパフォーマンスを実証してきました。
ただし、この印象的なパフォーマンスには、固定観念を永続させたり、存在しない事実を捏造したりする傾向など、固有の制限が伴います。
イスラム教とその表現の文脈では、コーランとスンナに根ざしたその信念と教えを正確かつ事実に基づいて表現することが重要です。
この研究では、イスラム世界観に忠実なドメイン固有の LLM を構築するという課題に焦点を当て、そのようなシステムを構築および評価する方法を提案します。
まず、このオープンエンドの目標を技術的問題として定義し、さまざまな解決策を提案します。
続いて、各アプローチに固有の既知の課題を批判的に検討し、そのようなシステムを評価するために使用できる評価方法論に焦点を当てます。
この研究は、高品質のデータセット、評価、機械学習とイスラムの学問を融合した学際的な研究の必要性を浮き彫りにしています。

要約(オリジナル)

Large Language Models (LLMs) have demonstrated remarkable performance across numerous natural language understanding use cases. However, this impressive performance comes with inherent limitations, such as the tendency to perpetuate stereotypical biases or fabricate non-existent facts. In the context of Islam and its representation, accurate and factual representation of its beliefs and teachings rooted in the Quran and Sunnah is key. This work focuses on the challenge of building domain-specific LLMs faithful to the Islamic worldview and proposes ways to build and evaluate such systems. Firstly, we define this open-ended goal as a technical problem and propose various solutions. Subsequently, we critically examine known challenges inherent to each approach and highlight evaluation methodologies that can be used to assess such systems. This work highlights the need for high-quality datasets, evaluations, and interdisciplinary work blending machine learning with Islamic scholarship.

arxiv情報

著者 Shabaz Patel,Hassan Kane,Rayhan Patel
発行日 2023-12-11 18:59:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク