The Goofus & Gallant Story Corpus for Practical Value Alignment


AI システムが人間社会のいたるところに普及するにつれて、AI システムがこれらの規範や価値観に違反し、潜在的に危害を引き起こす可能性があることが大きな懸念となっています。
したがって、意図的または非意図的危害を防ぐために、AI システムはこれらの原則に沿ったアクションを実行することが期待されます。
この研究では、自然言語と芸術的な画像を通じて説明される現実の状況における規範的行動と非規範的行動を示すマルチモーダル データセットを提示します。
このトレーニング セットには、幼児に社会原則について教えることを目的とした厳選された画像セットが含まれています。


Values or principles are key elements of human society that influence people to behave and function according to an accepted standard set of social rules to maintain social order. As AI systems are becoming ubiquitous in human society, it is a major concern that they could violate these norms or values and potentially cause harm. Thus, to prevent intentional or unintentional harm, AI systems are expected to take actions that align with these principles. Training systems to exhibit this type of behavior is difficult and often requires a specialized dataset. This work presents a multi-modal dataset illustrating normative and non-normative behavior in real-life situations described through natural language and artistic images. This training set contains curated sets of images that are designed to teach young children about social principles. We argue that this is an ideal dataset to use for training socially normative agents given this fact.


著者 Md Sultan Al Nahian,Tasmia Tasrin,Spencer Frazier,Mark Riedl,Brent Harrison
発行日 2025-01-16 17:58:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI パーマリンク