Culturally-Attuned Moral Machines: Implicit Learning of Human Value Systems by AI through Inverse Reinforcement Learning

要約

人間の文化が異なれば道徳の定義や社会規範も異なるため、人工知能 (AI) のための普遍的な道徳規範を構築することは困難または不可能ですらあります。
したがって、私たちは、AI の価値体系は文化的に調整されるべきであると主張します。特定の文化で育った子供がその文化の特定の価値観や規範を学ぶのと同じように、特定の人間のコミュニティで活動する AI エージェントは、そのコミュニティの価値観や規範を獲得すべきであると提案します。
道徳的、倫理的、文化的規範。
AI システムが人間の観察や対話からそのようなコードをどのように取得するのかは未解決の問題のままです。
ここでは、AI エージェントが文化に合わせた価値観を暗黙的に獲得する方法として逆強化学習 (IRL) を使用することを提案します。
私たちは、AI エージェントが IRL を使用して、リアルタイムの意思決定を必要とするオンライン仮想世界でのさまざまな文化的グループの行動を観察することによって、エージェントの道徳的価値を支配するさまざまな報酬関数を学習するという実験パラダイムを使用してアプローチをテストします。
私たちは、特定の文化的グループの平均的な行動から学習する AI エージェントが、そのグループの行動を反映する利他的な特性を獲得することができ、この学習された価値システムは利他的な判断を必要とする新しいシナリオに一般化できることを示します。
私たちの知る限り、この結果は、AI エージェントが人間を観察し、人間と対話することから価値観や規範を継続的に学習し、それによって彼らが活動している文化に適応する能力を潜在的に備えている可能性があることを初めて実証したものです。

要約(オリジナル)

Constructing a universal moral code for artificial intelligence (AI) is difficult or even impossible, given that different human cultures have different definitions of morality and different societal norms. We therefore argue that the value system of an AI should be culturally attuned: just as a child raised in a particular culture learns the specific values and norms of that culture, we propose that an AI agent operating in a particular human community should acquire that community’s moral, ethical, and cultural codes. How AI systems might acquire such codes from human observation and interaction has remained an open question. Here, we propose using inverse reinforcement learning (IRL) as a method for AI agents to acquire a culturally-attuned value system implicitly. We test our approach using an experimental paradigm in which AI agents use IRL to learn different reward functions, which govern the agents’ moral values, by observing the behavior of different cultural groups in an online virtual world requiring real-time decision making. We show that an AI agent learning from the average behavior of a particular cultural group can acquire altruistic characteristics reflective of that group’s behavior, and this learned value system can generalize to new scenarios requiring altruistic judgments. Our results provide, to our knowledge, the first demonstration that AI agents could potentially be endowed with the ability to continually learn their values and norms from observing and interacting with humans, thereby becoming attuned to the culture they are operating in.

arxiv情報

著者 Nigini Oliveira,Jasmine Li,Koosha Khalvati,Rodolfo Cortes Barragan,Katharina Reinecke,Andrew N. Meltzoff,Rajesh P. N. Rao
発行日 2023-12-29 05:39:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.HC, cs.LG パーマリンク