Human Emotion Knowledge Representation Emerges in Large Language Model and Supports Discrete Emotion Inference

要約

人間が個別の感情をどのように推測するかは、心理学の分野における基本的な研究課題です。
感情に関する概念的な知識 (感情の知識) は、感情の推論に不可欠であることが示唆されていますが、これまでの証拠はほとんどが間接的で決定的ではありません。
大規模言語モデル (LLM) はさまざまな人間の概念的知識の効果的な表現をサポートすることが示されているため、本研究ではさらに LLM に人工ニューロンを採用して、人間の感情推論のメカニズムを調査しました。
プロンプトによって活性化された人工ニューロンを使用して、LLM (RoBERTa) は、人間の行動と同様の 27 の個別の感情の概念構造を示しました。
さらに、LLM ベースの概念構造は、感情推論のための感情の 14 の根底にある概念属性への人間のような依存を明らかにしました。
最も重要なことは、属性固有のニューロンを操作することにより、対応する LLM の感情推論のパフォーマンスが低下し、パフォーマンスの低下が人間側の概念属性の表現の有効性と相関していることがわかりました。
私たちの調査結果は、大規模な言語モデルにおける感情知識表現の出現の直接的な証拠を提供し、個別の感情推論に対するカジュアルなサポートを示唆しています。

要約(オリジナル)

How humans infer discrete emotions is a fundamental research question in the field of psychology. While conceptual knowledge about emotions (emotion knowledge) has been suggested to be essential for emotion inference, evidence to date is mostly indirect and inconclusive. As the large language models (LLMs) have been shown to support effective representations of various human conceptual knowledge, the present study further employed artificial neurons in LLMs to investigate the mechanism of human emotion inference. With artificial neurons activated by prompts, the LLM (RoBERTa) demonstrated a similar conceptual structure of 27 discrete emotions as that of human behaviors. Furthermore, the LLM-based conceptual structure revealed a human-like reliance on 14 underlying conceptual attributes of emotions for emotion inference. Most importantly, by manipulating attribute-specific neurons, we found that the corresponding LLM’s emotion inference performance deteriorated, and the performance deterioration was correlated to the effectiveness of representations of the conceptual attributes on the human side. Our findings provide direct evidence for the emergence of emotion knowledge representation in large language models and suggest its casual support for discrete emotion inference.

arxiv情報

著者 Ming Li,Yusheng Su,Hsiu-Yuan Huang,Jiali Cheng,Xin Hu,Xinmiao Zhang,Huadong Wang,Yujia Qin,Xiaozhi Wang,Zhiyuan Liu,Dan Zhang
発行日 2023-02-21 07:28:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク