Modelling Human Values for AI Reasoning

要約

今日の最も重要な社会的課題の 1 つは、その動作、または相互作用するエージェント (人間および人工) のコミュニティ内で可能になる動作が人間の価値観と一致する AI システムを構築することです。
この課題に対処するために、明示的な計算表現のための人間の価値観の正式なモデルを詳細に説明します。
私たちの知る限り、これはまだ試みられていませんが、AI 内に値を統合する研究の量が増えていることを考えると、これは驚くべきことです。
過去数十年にわたる社会心理学から人間の価値観の性質を調査する豊富な研究を出発点として、私たちはそのような正式なモデルを提供することに着手しました。
このモデルが値に対する AI ベースの推論のための基礎的な装置をどのように提供できるかを示し、現実世界のユースケースへの適用可能性を実証します。
私たちのモデルが社会心理学の研究から重要なアイデアをどのように捉えているかを説明し、AI における人間の価値に関する将来の統合的かつ学際的な研究のロードマップを提案します。
価値観を自動的に推論する機能は、価値観の整合性の問題に対処するのに役立つだけでなく、個人やコミュニティがより多くの情報に基づいて価値観に沿った意思決定を行えるように支援できる AI システムの設計も容易にします。
個人や組織はますます、自分たちの価値観をより明確に理解し、自分たちの行動や態度がそれを適切に反映しているかどうかを探ろうとするようになっています。
人間の価値をモデル化するという私たちの取り組みにより、この増大するニーズを満たす AI システムの設計と導入が可能になります。

要約(オリジナル)

One of today’s most significant societal challenges is building AI systems whose behaviour, or the behaviour it enables within communities of interacting agents (human and artificial), aligns with human values. To address this challenge, we detail a formal model of human values for their explicit computational representation. To our knowledge, this has not been attempted as yet, which is surprising given the growing volume of research integrating values within AI. Taking as our starting point the wealth of research investigating the nature of human values from social psychology over the last few decades, we set out to provide such a formal model. We show how this model can provide the foundational apparatus for AI-based reasoning over values, and demonstrate its applicability in real-world use cases. We illustrate how our model captures the key ideas from social psychology research and propose a roadmap for future integrated, and interdisciplinary, research into human values in AI. The ability to automatically reason over values not only helps address the value alignment problem but also facilitates the design of AI systems that can support individuals and communities in making more informed, value-aligned decisions. More and more, individuals and organisations are motivated to understand their values more explicitly and explore whether their behaviours and attitudes properly reflect them. Our work on modelling human values will enable AI systems to be designed and deployed to meet this growing need.

arxiv情報

著者 Nardine Osman,Mark d’Inverno
発行日 2024-02-09 12:08:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T01, cs.AI, cs.MA, I.2.4 パーマリンク