Can you see how I learn? Human observers’ inferences about Reinforcement Learning agents’ learning processes

要約

強化学習(RL)エージェントは、多くの場合、人間の観察者が直感的に解釈できない学習行動を示し、共同教育設定で最適ではないフィードバックをもたらす可能性があります。
しかし、人間がどのようにRLエージェントの学習行動を知覚し、解釈するかはほとんど不明です。
2つの実験を使用したボトムアップアプローチでは、この作業は、エージェントの学習プロセスに対する人間の観察者の理解の要因に関するデータ駆動型の理解を提供します。
エージェント学習に関する人間の推論を直接評価するための新しい観察ベースのパラダイムが開発されました。
探索的インタビュー調査(\ textit {n} = 9)で、人間の解釈における4つのコアテーマを特定します:エージェントの目標、知識、意思決定、学習メカニズム。
2番目の確認研究(\ textIT {n} = 34)は、2つのタスク(ナビゲーション/操作)と2つのRLアルゴリズム(表面/関数近似)にわたってパラダイムの拡張バージョンを適用しました。
816回の応答の分析により、パラダイムの信頼性が確認され、テーマのフレームワークが改良され、これらのテーマが時間とともに進化し、相互に関連する方法を明らかにしました。
私たちの調査結果は、人々がエージェントの学習をどのように理解するかについての人間中心の理解を提供し、解釈可能なRLシステムを設計し、人間とロボットの相互作用の透明性を向上させるための実用的な洞察を提供します。

要約(オリジナル)

Reinforcement Learning (RL) agents often exhibit learning behaviors that are not intuitively interpretable by human observers, which can result in suboptimal feedback in collaborative teaching settings. Yet, how humans perceive and interpret RL agent’s learning behavior is largely unknown. In a bottom-up approach with two experiments, this work provides a data-driven understanding of the factors of human observers’ understanding of the agent’s learning process. A novel, observation-based paradigm to directly assess human inferences about agent learning was developed. In an exploratory interview study (\textit{N}=9), we identify four core themes in human interpretations: Agent Goals, Knowledge, Decision Making, and Learning Mechanisms. A second confirmatory study (\textit{N}=34) applied an expanded version of the paradigm across two tasks (navigation/manipulation) and two RL algorithms (tabular/function approximation). Analyses of 816 responses confirmed the reliability of the paradigm and refined the thematic framework, revealing how these themes evolve over time and interrelate. Our findings provide a human-centered understanding of how people make sense of agent learning, offering actionable insights for designing interpretable RL systems and improving transparency in Human-Robot Interaction.

arxiv情報

著者 Bernhard Hilpert,Muhan Hou,Kim Baraka,Joost Broekens
発行日 2025-06-16 15:04:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO パーマリンク