要約
ソーシャル メディア ネットワークでは、ユーザーがいつでも大量のテキスト コンテンツを作成し、研究者にパーソナリティ関連の情報を掘り出すための貴重なアプローチを提供します。
ユーザーが作成したテキストに基づく性格検出は、ユーザーのポートレートを作成するために使用できる普遍的な方法です。
ソーシャル メディアのテキストにノイズが存在すると、性格の検出が妨げられます。
しかし、これまでの研究ではこの課題に完全には取り組んでいませんでした。
走査読解技術にヒントを得て、我々は長いテキストに対する注意ベースの情報抽出メカニズム (AIEM) を提案します。これは、貴重な情報部分を迅速に見つけ出し、重要な部分の深い意味論にさらに注目するために適用されます。
次に、性格検出タスク用の新しいアテンションベースのノイズ除去フレームワーク (ADF) を提供し、一般的に使用される 2 つのデータセットで最先端のパフォーマンスを実現します。
特に、代表的な Twitter-Myers-Briggs Type Indicator (Twitter-MBTI) データセットでは平均 10.2% の精度向上が得られています。
コードを GitHub で公開しました。
AIEM がパーソナリティ関連の信号を拡大するためにどのように機能するかを明らかにします。
要約(オリジナル)
In social media networks, users produce a large amount of text content anytime, providing researchers with a valuable approach to digging for personality-related information. Personality detection based on user-generated texts is a universal method that can be used to build user portraits. The presence of noise in social media texts hinders personality detection. However, previous studies have not fully addressed this challenge. Inspired by the scanning reading technique, we propose an attention-based information extraction mechanism (AIEM) for long texts, which is applied to quickly locate valuable pieces of information, and focus more attention on the deep semantics of key pieces. Then, we provide a novel attention-based denoising framework (ADF) for personality detection tasks and achieve state-of-the-art performance on two commonly used datasets. Notably, we obtain an average accuracy improvement of 10.2% on the gold standard Twitter-Myers-Briggs Type Indicator (Twitter-MBTI) dataset. We made our code publicly available on GitHub. We shed light on how AIEM works to magnify personality-related signals.
arxiv情報
著者 | Qirui Tang,Wenkang Jiang,Yihua Du,Lei Lin |
発行日 | 2023-11-16 14:56:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google