Learning mental states estimation through self-observation: a developmental synergy between intentions and beliefs representations in a deep-learning model of Theory of Mind

要約

心の理論 (ToM)、つまり信念、意図、または精神状態を他人のせいにする能力は、人間の社会的相互作用の重要な特徴です。
人間の感覚システムが限界に達する複雑な環境では、行動は周囲の世界の状態についての信念によって強く動かされます。
他人の精神状態(信念や意図など)にアクセスすると、自然な状況でより効果的な社会的相互作用が可能になります。
しかし、これらの変数は直接観察できないため、ToM を理解することは、心理学、機械学習、ロボット工学などのさまざまな分野にとって興味深い探求となっています。
この論文では、低レベルの精神状態 (意図、目標など) を予測する学習と高レベルの精神状態 (信念など) の帰属との間の発達上の相乗効果を示すことで、このトピックに貢献します。
具体的には、例えば部分的に観察可能な環境において、信念に関わる自分自身の意思決定プロセスを観察することによって、信念帰属の学習が起こる可能性があると仮定します。
シンプルなフィードフォワード深層学習モデルを使用して、他人の意図や行動の予測を学習する際、信念の帰属を同時に学習すると、より正確な予測をより早く取得できることを示します。
さらに、観察される行為者が観察者とは異なる具体化を持っている場合でも学習パフォーマンスが向上し、信念に基づく行動の塊を観察する場合の利得がより高いことを示します。
私たちは、私たちの計算的アプローチが人間の社会的認知発達の理解を知らせ、新しい自然環境やタスクにおいて人間の相互作用パートナーを自律的に理解し、支援し、そこから学ぶことができる将来の適応型ソーシャルロボットの設計に関連できることを提案します。

要約(オリジナル)

Theory of Mind (ToM), the ability to attribute beliefs, intentions, or mental states to others, is a crucial feature of human social interaction. In complex environments, where the human sensory system reaches its limits, behaviour is strongly driven by our beliefs about the state of the world around us. Accessing others’ mental states, e.g., beliefs and intentions, allows for more effective social interactions in natural contexts. Yet, these variables are not directly observable, making understanding ToM a challenging quest of interest for different fields, including psychology, machine learning and robotics. In this paper, we contribute to this topic by showing a developmental synergy between learning to predict low-level mental states (e.g., intentions, goals) and attributing high-level ones (i.e., beliefs). Specifically, we assume that learning beliefs attribution can occur by observing one’s own decision processes involving beliefs, e.g., in a partially observable environment. Using a simple feed-forward deep learning model, we show that, when learning to predict others’ intentions and actions, more accurate predictions can be acquired earlier if beliefs attribution is learnt simultaneously. Furthermore, we show that the learning performance improves even when observed actors have a different embodiment than the observer and the gain is higher when observing beliefs-driven chunks of behaviour. We propose that our computational approach can inform the understanding of human social cognitive development and be relevant for the design of future adaptive social robots able to autonomously understand, assist, and learn from human interaction partners in novel natural environments and tasks.

arxiv情報

著者 Francesca Bianco,Silvia Rigato,Maria Laura Filippetti,Dimitri Ognibene
発行日 2024-07-25 13:15:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO パーマリンク