Comparing Human-Centered Language Modeling: Is it Better to Model Groups, Individual Traits, or Both?

要約

自然言語処理は、人間のコンテキストをモデルに組み込む点で進歩を遂げていますが、グループごとの属性 (例: 45 歳以上) を使用するのがより効果的であるか、それとも個人をモデル化するのがより効果的であるかはまだ明らかになっていません。
グループ属性は技術的には簡単ですが、大まかです。すべての 45 歳が同じように書くわけではありません。
対照的に、個人をモデル化すると、各人のアイデンティティの複雑さがわかります。
これにより、よりパーソナライズされた表現が可能になりますが、無限の数のユーザーをモデル化し、取得不可能なデータが必要になる場合があります。
グループ属性、個々のユーザー、および組み合わせたアプローチを通じて人間のコンテキストのモデリングを比較します。
グループと個人の特徴を組み合わせると、ユーザーの文書からの年齢推定や性格評価などのユーザーレベルの回帰タスクに大きなメリットがあります。
個々のユーザーをモデル化すると、スタンスやトピックの検出など、単一ドキュメント レベルの分類タスクのパフォーマンスが大幅に向上します。
また、ユーザーの履歴データがなくても、個別ユーザーのモデリングがうまく機能することもわかりました。

要約(オリジナル)

Natural language processing has made progress in incorporating human context into its models, but whether it is more effective to use group-wise attributes (e.g., over-45-year-olds) or model individuals remains open. Group attributes are technically easier but coarse: not all 45-year-olds write the same way. In contrast, modeling individuals captures the complexity of each person’s identity. It allows for a more personalized representation, but we may have to model an infinite number of users and require data that may be impossible to get. We compare modeling human context via group attributes, individual users, and combined approaches. Combining group and individual features significantly benefits user-level regression tasks like age estimation or personality assessment from a user’s documents. Modeling individual users significantly improves the performance of single document-level classification tasks like stance and topic detection. We also find that individual-user modeling does well even without user’s historical data.

arxiv情報

著者 Nikita Soni,Niranjan Balasubramanian,H. Andrew Schwartz,Dirk Hovy
発行日 2024-01-23 05:20:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク