要約
何百万人ものユーザーがソーシャル メディアでアクティブに活動しています。
ユーザーが自分自身をよりよく紹介し、他のユーザーとネットワークを築けるようにするために、ユーザーの個人的な興味を概説する短い文であるソーシャル メディアの自己紹介の自動生成を検討します。
これまでのほとんどの研究では、タグ (年齢など) を使用してユーザーのプロフィールを作成していましたが、私たちは文レベルの自己紹介を調査して、ユーザーがお互いを知るためのより自然で魅力的な方法を提供しました。
ここでは、ユーザーのツイート履歴を利用して自己紹介を生成します。
履歴の内容は長く、ノイズが多く、さまざまな個人的な興味を示す場合があるため、この作業は簡単ではありません。
この課題に対処するために、私たちは新しい統合トピックガイド付きエンコーダー/デコーダー (UTGED) フレームワークを提案します。
ユーザーの顕著な関心を反映するために潜在的なトピックをモデル化し、そのトピックの混合によってユーザーの履歴のエンコードがガイドされ、トピックの単語によって自己紹介のデコードが制御されます。
実験のために、大規模な Twitter データセットを収集しました。その結果、トピック モデリングを行わない高度なエンコーダ/デコーダ モデルに対する UTGED の優位性が広範な結果で示されました。
要約(オリジナル)
Millions of users are active on social media. To allow users to better showcase themselves and network with others, we explore the auto-generation of social media self-introduction, a short sentence outlining a user’s personal interests. While most prior work profiles users with tags (e.g., ages), we investigate sentence-level self-introductions to provide a more natural and engaging way for users to know each other. Here we exploit a user’s tweeting history to generate their self-introduction. The task is non-trivial because the history content may be lengthy, noisy, and exhibit various personal interests. To address this challenge, we propose a novel unified topic-guided encoder-decoder (UTGED) framework; it models latent topics to reflect salient user interest, whose topic mixture then guides encoding a user’s history and topic words control decoding their self-introduction. For experiments, we collect a large-scale Twitter dataset, and extensive results show the superiority of our UTGED to the advanced encoder-decoder models without topic modeling.
arxiv情報
著者 | Chunpu Xu,Jing Li,Piji Li,Min Yang |
発行日 | 2023-05-24 13:35:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google