Modelling Human Values for AI Reasoning


今日の最も重要な社会的課題の 1 つは、その動作、または相互作用するエージェント (人間および人工) のコミュニティ内で可能になる動作が人間の価値観と一致する AI システムを構築することです。
私たちの知る限り、これはまだ試みられていませんが、AI 内に値を統合する研究の量が増えていることを考えると、これは驚くべきことです。
このモデルが値に対する AI ベースの推論のための基礎的な装置をどのように提供できるかを示し、現実世界のユースケースへの適用可能性を実証します。
私たちのモデルが社会心理学の研究から重要なアイデアをどのように捉えているかを説明し、AI における人間の価値に関する将来の統合的かつ学際的な研究のロードマップを提案します。
価値観を自動的に推論する機能は、価値観の整合性の問題に対処するのに役立つだけでなく、個人やコミュニティがより多くの情報に基づいて価値観に沿った意思決定を行えるように支援できる AI システムの設計も容易にします。
人間の価値をモデル化するという私たちの取り組みにより、この増大するニーズを満たす AI システムの設計と導入が可能になります。


One of today’s most significant societal challenges is building AI systems whose behaviour, or the behaviour it enables within communities of interacting agents (human and artificial), aligns with human values. To address this challenge, we detail a formal model of human values for their explicit computational representation. To our knowledge, this has not been attempted as yet, which is surprising given the growing volume of research integrating values within AI. Taking as our starting point the wealth of research investigating the nature of human values from social psychology over the last few decades, we set out to provide such a formal model. We show how this model can provide the foundational apparatus for AI-based reasoning over values, and demonstrate its applicability in real-world use cases. We illustrate how our model captures the key ideas from social psychology research and propose a roadmap for future integrated, and interdisciplinary, research into human values in AI. The ability to automatically reason over values not only helps address the value alignment problem but also facilitates the design of AI systems that can support individuals and communities in making more informed, value-aligned decisions. More and more, individuals and organisations are motivated to understand their values more explicitly and explore whether their behaviours and attitudes properly reflect them. Our work on modelling human values will enable AI systems to be designed and deployed to meet this growing need.


著者 Nardine Osman,Mark d’Inverno
発行日 2024-02-09 12:08:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: 68T01, cs.AI, cs.MA, I.2.4 パーマリンク