Shared Imagination: LLMs Hallucinate Alike


最近の大規模言語モデル (LLM) の急増にもかかわらず、そのトレーニング レシピ (モデル アーキテクチャ、事前トレーニング データ、最適化アルゴリズム) は非常に似ていることがよくあります。
この論文では、モデルの類似性をよりよく理解するために、新しい設定である架空の質問応答 (IQA) を提案します。
IQA では、あるモデルに純粋に想像上の質問 (物理学における完全にでっち上げられた概念など) を生成するように依頼し、別のモデルに回答を促します。


Despite the recent proliferation of large language models (LLMs), their training recipes — model architecture, pre-training data and optimization algorithm — are often very similar. This naturally raises the question of the similarity among the resulting models. In this paper, we propose a novel setting, imaginary question answering (IQA), to better understand model similarity. In IQA, we ask one model to generate purely imaginary questions (e.g., on completely made-up concepts in physics) and prompt another model to answer. Surprisingly, despite the total fictionality of these questions, all models can answer each other’s questions with remarkable success, suggesting a ‘shared imagination space’ in which these models operate during such hallucinations. We conduct a series of investigations into this phenomenon and discuss implications on model homogeneity, hallucination, and computational creativity.


著者 Yilun Zhou,Caiming Xiong,Silvio Savarese,Chien-Sheng Wu
発行日 2024-07-23 16:06:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク