Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models

要約

この論文では、ソーシャル メディア データを長期的に分析するためのツールとして、時間的に整列された大規模言語モデル (LLM) を提案します。
私たちは英国の Twitter ユーザーのパネルからの完全なタイムラインで Llama 3 8B の時間アダプターを微調整し、確立されたアンケートを使用して感情と態度の長期的な集計を抽出します。
私たちは英国の代表的な調査データと照らし合わせて推定値を検証し、いくつかの集団感情について強い正の有意な相関関係を発見しました。
得られた推定値は、複数のトレーニング シードとプロンプト定式化にわたって堅牢であり、ラベル付きデータでトレーニングされた従来の分類モデルを使用して抽出された集合的感情と一致しています。
私たちの知る限り、これは LLM の感情分析を時間アダプターを介して長期的な設定に拡張した最初の研究です。
私たちの取り組みにより、ソーシャル メディア データの長期的な分析に向けた新しいアプローチが可能になります。

要約(オリジナル)

This paper proposes temporally aligned Large Language Models (LLMs) as a tool for longitudinal analysis of social media data. We fine-tune Temporal Adapters for Llama 3 8B on full timelines from a panel of British Twitter users, and extract longitudinal aggregates of emotions and attitudes with established questionnaires. We validate our estimates against representative British survey data and find strong positive, significant correlations for several collective emotions. The obtained estimates are robust across multiple training seeds and prompt formulations, and in line with collective emotions extracted using a traditional classification model trained on labeled data. To the best of our knowledge, this is the first work to extend the analysis of affect in LLMs to a longitudinal setting through Temporal Adapters. Our work enables new approaches towards the longitudinal analysis of social media data.

arxiv情報

著者 Georg Ahnert,Max Pellert,David Garcia,Markus Strohmaier
発行日 2024-09-26 16:02:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY パーマリンク