Morality is Non-Binary: Building a Pluralist Moral Sentence Embedding Space using Contrastive Learning

要約

NLP の最近の進歩により、言語モデルには義務論的倫理と道徳規範に関する認識可能なレベルの知識が保持されていることが示されています。
しかし、既存の作品では、道徳を正義から悪までの二元論として扱うことがよくあります。
この単純化した見方では、道徳的判断の微妙なニュアンスが捉えられていません。
多元主義的な道徳哲学者は、道徳的判断における個人差を尊重しながら、人間の道徳は有限数の要素に分解できると主張しています。
この見解に沿って、私たちは最先端の対照学習アプローチを通じて多元主義的な道徳文埋め込み空間を構築します。
私たちは、道徳的要素間の関係の出現を定量的および定性的に研究することにより、埋め込み空間を体系的に調査します。
私たちの結果は、道徳に対する多元主義的なアプローチが埋め込み空間に捉えられることを示しています。
しかし、道徳的多元主義は自己監視だけで推論するのが難しく、人間によるラベルを付けた監視付きアプローチが必要です。

要約(オリジナル)

Recent advances in NLP show that language models retain a discernible level of knowledge in deontological ethics and moral norms. However, existing works often treat morality as binary, ranging from right to wrong. This simplistic view does not capture the nuances of moral judgment. Pluralist moral philosophers argue that human morality can be deconstructed into a finite number of elements, respecting individual differences in moral judgment. In line with this view, we build a pluralist moral sentence embedding space via a state-of-the-art contrastive learning approach. We systematically investigate the embedding space by studying the emergence of relationships among moral elements, both quantitatively and qualitatively. Our results show that a pluralist approach to morality can be captured in an embedding space. However, moral pluralism is challenging to deduce via self-supervision alone and requires a supervised approach with human labels.

arxiv情報

著者 Jeongwoo Park,Enrico Liscio,Pradeep K. Murukannaiah
発行日 2024-01-30 18:15:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク