A Critical Review of Large Language Models: Sensitivity, Bias, and the Path Toward Specialized AI


この論文では、テキスト データ内の SDG を検出する際の、特殊なコンパイル言語モデルと OpenAI の GPT-3.5 のような汎用モデルの有効性を比較検証します。
大規模言語モデル (LLM) の批判的なレビューを示し、偏見と敏感さに関連する課題に対処します。
企業説明データセットを使用したケーススタディでは、GPT-3.5 と特殊な SDG 検出モデルの違いについての洞察が得られます。
GPT-3.5 はより広い範囲をカバーしていますが、企業の活動との関連性が限定的な SDG を特定する可能性があります。
対照的に、特化したモデルは関連性の高い SDG に重点を置いています。
LLM の多用途性にもかかわらず、精度と精度が要求されるタスクには特殊なモデルの使用をお勧めします。
この研究は、LLM の機能と、ドメイン固有の専門知識と解釈可能性の必要性との間のバランスを見つけるためのさらなる研究を奨励することで締めくくられています。


This paper examines the comparative effectiveness of a specialized compiled language model and a general-purpose model like OpenAI’s GPT-3.5 in detecting SDGs within text data. It presents a critical review of Large Language Models (LLMs), addressing challenges related to bias and sensitivity. The necessity of specialized training for precise, unbiased analysis is underlined. A case study using a company descriptions dataset offers insight into the differences between the GPT-3.5 and the specialized SDG detection model. While GPT-3.5 boasts broader coverage, it may identify SDGs with limited relevance to the companies’ activities. In contrast, the specialized model zeroes in on highly pertinent SDGs. The importance of thoughtful model selection is emphasized, taking into account task requirements, cost, complexity, and transparency. Despite the versatility of LLMs, the use of specialized models is suggested for tasks demanding precision and accuracy. The study concludes by encouraging further research to find a balance between the capabilities of LLMs and the need for domain-specific expertise and interpretability.


著者 Arash Hajikhani,Carolyn Cole
発行日 2023-07-28 09:20:22+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.AI, cs.CL パーマリンク