The Goofus & Gallant Story Corpus for Practical Value Alignment

要約

価値観または原則は、社会秩序を維持するために、人々が受け入れられた標準的な社会ルールに従って行動し、機能するように影響を与える人間社会の重要な要素です。
AI システムが人間社会のいたるところに普及するにつれて、AI システムがこれらの規範や価値観に違反し、潜在的に危害を引き起こす可能性があることが大きな懸念となっています。
したがって、意図的または非意図的危害を防ぐために、AI システムはこれらの原則に沿ったアクションを実行することが期待されます。
このタイプの動作を示すようにシステムをトレーニングするのは難しく、多くの場合、特殊なデータセットが必要です。
この研究では、自然言語と芸術的な画像を通じて説明される現実の状況における規範的行動と非規範的行動を示すマルチモーダル データセットを提示します。
このトレーニング セットには、幼児に社会原則について教えることを目的とした厳選された画像セットが含まれています。
この事実を踏まえると、これは社会規範的エージェントのトレーニングに使用するのに理想的なデータセットであると私たちは主張します。

要約(オリジナル)

Values or principles are key elements of human society that influence people to behave and function according to an accepted standard set of social rules to maintain social order. As AI systems are becoming ubiquitous in human society, it is a major concern that they could violate these norms or values and potentially cause harm. Thus, to prevent intentional or unintentional harm, AI systems are expected to take actions that align with these principles. Training systems to exhibit this type of behavior is difficult and often requires a specialized dataset. This work presents a multi-modal dataset illustrating normative and non-normative behavior in real-life situations described through natural language and artistic images. This training set contains curated sets of images that are designed to teach young children about social principles. We argue that this is an ideal dataset to use for training socially normative agents given this fact.

arxiv情報

著者 Md Sultan Al Nahian,Tasmia Tasrin,Spencer Frazier,Mark Riedl,Brent Harrison
発行日 2025-01-16 17:58:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク