An Evaluation of GPT-4 on the ETHICS Dataset

要約

このレポートは、ETHICS データセットにおける GPT-4 のパフォーマンスに関する短い調査を要約したものです。
ETHICS データセットは、正義、義務論、美徳倫理、功利主義、常識倫理というさまざまな倫理分野をカバーする 5 つのサブデータセットで構成されています。
道徳的判断は、道徳的ジレンマではなく人間の共通の価値観を表すことを目的として、高度に一致するように厳選されました。
GPT-4 のパフォーマンスは以前のモデルよりもはるかに優れており、人間の共通の価値観を扱う方法を学ぶことが AI 倫理にとって難しい問題ではないことを示唆しています。

要約(オリジナル)

This report summarizes a short study of the performance of GPT-4 on the ETHICS dataset. The ETHICS dataset consists of five sub-datasets covering different fields of ethics: Justice, Deontology, Virtue Ethics, Utilitarianism, and Commonsense Ethics. The moral judgments were curated so as to have a high degree of agreement with the aim of representing shared human values rather than moral dilemmas. GPT-4’s performance is much better than that of previous models and suggests that learning to work with common human values is not the hard problem for AI ethics.

arxiv情報

著者 Sergey Rodionov,Zarathustra Amadeus Goertzel,Ben Goertzel
発行日 2023-09-19 10:01:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク