要約
社会世界の知識は、人間と機械による効果的なコミュニケーションと情報処理の重要な要素です。
現在、世界の事実に関する知識を表す知識ベースが多数存在します。
しかし、世界の知識の社会的側面を捉えるように設計されたリソースはありません。
私たちは、この研究がそのようなリソースの策定と構築に向けた重要な一歩となると信じています。
ソーシャル ネットワーク内で低次元エンティティの埋め込みが発生する社会的コンテキストからエンティティの埋め込みを引き出すための一般的なフレームワークである SocialVec を紹介します。
このフレームワークでは、エンティティは一般の関心を引く非常に人気のあるアカウントに対応します。
私たちは、個々のユーザーが共同フォローする傾向があるエンティティが社会的に関連していると仮定し、この社会的コンテキストの定義を使用してエンティティの埋め込みを学習します。
テキストのセマンティクスを伴うタスクを容易にする単語の埋め込みと同様に、学習されたソーシャル エンティティの埋め込みがソーシャル フレーバーの複数のタスクに利益をもたらすことが期待されます。
この研究では、130 万人の Twitter ユーザーと彼らがフォローしているアカウントのサンプルから、約 20 万のエンティティのソーシャル埋め込みを抽出しました。
私たちは、社会的に重要な 2 つのタスクについて、結果として得られる埋め込みを採用し、評価します。
まず、社会的埋め込み空間におけるエンティティの類似性の観点から、ニュースソースの政治的偏りを評価します。
2 番目に、個々の Twitter ユーザーがフォローしているエンティティのソーシャル エンベディングに基づいて、そのユーザーの個人的特徴を予測します。
どちらの場合も、タスク固有のベースラインと比較して、私たちのアプローチを使用すると有利な、または競争力のあるパフォーマンスを示します。
さらに、事実に基づいた既存のエンティティ埋め込みスキームは知識の社会的側面を捉えることができないことを示します。
私たちは、社会的世界の知識とその応用のさらなる探求をサポートするために、学習された社会的エンティティの埋め込みを研究コミュニティが利用できるようにします。
要約(オリジナル)
Social world knowledge is a key ingredient in effective communication and information processing by humans and machines alike. As of today, there exist many knowledge bases that represent factual world knowledge. Yet, there is no resource that is designed to capture social aspects of world knowledge. We believe that this work makes an important step towards the formulation and construction of such a resource. We introduce SocialVec, a general framework for eliciting low-dimensional entity embeddings from the social contexts in which they occur in social networks. In this framework, entities correspond to highly popular accounts which invoke general interest. We assume that entities that individual users tend to co-follow are socially related, and use this definition of social context to learn the entity embeddings. Similar to word embeddings which facilitate tasks that involve text semantics, we expect the learned social entity embeddings to benefit multiple tasks of social flavor. In this work, we elicited the social embeddings of roughly 200K entities from a sample of 1.3M Twitter users and the accounts that they follow. We employ and gauge the resulting embeddings on two tasks of social importance. First, we assess the political bias of news sources in terms of entity similarity in the social embedding space. Second, we predict the personal traits of individual Twitter users based on the social embeddings of entities that they follow. In both cases, we show advantageous or competitive performance using our approach compared with task-specific baselines. We further show that existing entity embedding schemes, which are fact-based, fail to capture social aspects of knowledge. We make the learned social entity embeddings available to the research community to support further exploration of social world knowledge and its applications.
arxiv情報
著者 | Nir Lotan,Einat Minkov |
発行日 | 2023-06-28 15:25:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google