要約
社会的環境における人間の行動を適応的に予測することは、人工知能の実現に向けた重要な一歩である。社会予測における既存の研究のほとんどは、歩行者の軌跡予測のような焦点の定まっていない相互作用か、単数または二単元の行動予測に焦点を当ててきた。これとは対照的に、社会心理学では複雑な社会的ダイナミクスを理解するためのグループ間相互作用の重要性が強調されている。このため、本稿では、グループ(会話)レベルでの社会的相互作用の予測というギャップが生じる。さらに、予測モデルにとって重要なのは、同じ個人であっても異なるグループ間では異なる行動をとるため、訓練時には見られないグループに適応できることである。このことは、予測モデルが各グループのユニークなダイナミクスを明示的に考慮する必要性を強調している。これを実現するために、我々は人間の行動予測にメタ学習アプローチを採用し、各グループを独立したメタ学習タスクとして扱う。その結果、我々の手法はグループ内の特定の行動を予測条件とし、未知のグループへの汎化につながる。具体的には、ソーシャルプロセス(SP)モデルを導入する。このモデルは、同じグループの過去の相互作用の他のシーケンスを取り入れながら、先行する低レベルのマルチモーダルキューに基づき、全てのグループメンバーの将来のマルチモーダルキューに対する分布を共同で予測する。本研究では、現実的な合成データセットを用いて、SPモデルの出力と潜在空間の両方における汎化能力を分析する。
要約(オリジナル)
Adaptively forecasting human behavior in social settings is an important step toward achieving Artificial General Intelligence. Most existing research in social forecasting has focused either on unfocused interactions, such as pedestrian trajectory prediction, or on monadic and dyadic behavior forecasting. In contrast, social psychology emphasizes the importance of group interactions for understanding complex social dynamics. This creates a gap that we address in this paper: forecasting social interactions at the group (conversation) level. Additionally, it is important for a forecasting model to be able to adapt to groups unseen at train time, as even the same individual behaves differently across different groups. This highlights the need for a forecasting model to explicitly account for each group’s unique dynamics. To achieve this, we adopt a meta-learning approach to human behavior forecasting, treating every group as a separate meta-learning task. As a result, our method conditions its predictions on the specific behaviors within the group, leading to generalization to unseen groups. Specifically, we introduce Social Process (SP) models, which predict a distribution over future multimodal cues jointly for all group members based on their preceding low-level multimodal cues, while incorporating other past sequences of the same group’s interactions. In this work we also analyze the generalization capabilities of SP models in both their outputs and latent spaces through the use of realistic synthetic datasets.
arxiv情報
著者 | Augustinas Jučas,Chirag Raman |
発行日 | 2025-01-03 17:34:53+00:00 |
arxivサイト | arxiv_id(pdf) |