LLMvsSmall Model? Large Language Model Based Text Augmentation Enhanced Personality Detection Model


性格検出は、ソーシャル メディア投稿の根底にある個人の性格特性を検出することを目的としています。
この課題の 1 つの課題は、自己申告アンケートから収集される、真実の性格特性が不足していることです。
この論文では、大規模言語モデル (LLM) ベースのテキスト拡張強化性格検出モデルを提案します。このモデルは、LLM がこのタスクで失敗した場合でも、LLM の知識を抽出して性格検出のための小規模モデルを強化します。
具体的には、LLM が性格検出に重要な意味、感情、言語の側面から事後分析 (拡張) を生成できるようにします。
さらに、LLM を利用して性格ラベルの情報を充実させ、検出性能を向上させます。
ベンチマーク データセットの実験結果は、私たちのモデルが性格検出に関して最先端の方法よりも優れていることを示しています。


Personality detection aims to detect one’s personality traits underlying in social media posts. One challenge of this task is the scarcity of ground-truth personality traits which are collected from self-report questionnaires. Most existing methods learn post features directly by fine-tuning the pre-trained language models under the supervision of limited personality labels. This leads to inferior quality of post features and consequently affects the performance. In addition, they treat personality traits as one-hot classification labels, overlooking the semantic information within them. In this paper, we propose a large language model (LLM) based text augmentation enhanced personality detection model, which distills the LLM’s knowledge to enhance the small model for personality detection, even when the LLM fails in this task. Specifically, we enable LLM to generate post analyses (augmentations) from the aspects of semantic, sentiment, and linguistic, which are critical for personality detection. By using contrastive learning to pull them together in the embedding space, the post encoder can better capture the psycho-linguistic information within the post representations, thus improving personality detection. Furthermore, we utilize the LLM to enrich the information of personality labels for enhancing the detection performance. Experimental results on the benchmark datasets demonstrate that our model outperforms the state-of-the-art methods on personality detection.


著者 Linmei Hu,Hongyu He,Duokang Wang,Ziwang Zhao,Yingxia Shao,Liqiang Nie
発行日 2024-03-12 12:10:18+00:00
