要約
このポジションペーパーでは、正確性とプライバシーの間の異なる公平性の定義やトレードオフなど、責任あるAI(RAI)メトリックの間でしばしば観察される理論的な矛盾は、排除する欠陥ではなく貴重な機能として受け入れるべきであると主張しています。
私たちは、これらの矛盾を、メトリックを発散的な目的として扱うことにより、3つの重要な利点をもたらすと主張します。(1)規範的多元主義:矛盾する潜在的なメトリックの完全なスイートを維持することで、RAIに固有の多様な道徳的スタンスと利害関係者の価値が適切に表されることを保証します。
(2)認識論的完全性:複数の、時には矛盾するメトリックの使用により、多面的な倫理的概念をより包括的な捉えることができ、それにより、これらの概念に関するより大きな単純化された定義よりも大きな情報的忠実度が維持されます。
(3)暗黙的な正則化:理論的に矛盾する目的のために共同で最適化すると、1つの特定のメトリックに過剰に適合し、実際の複雑さの下での一般化と堅牢性を備えたソリューションへの操縦モデルを阻止します。
対照的に、メトリックを簡素化または剪定することにより、この価値の多様性を狭め、概念的な深さを失い、モデルのパフォーマンスを低下させることにより、理論的一貫性を実施する努力。
したがって、私たちはRAIの理論と実践の変化を提唱しています。矛盾に閉じ込められることから、許容可能な矛盾のしきい値を特徴付け、堅牢で堅牢で近似の一貫性を可能にするメカニズムを解明します。
要約(オリジナル)
This position paper argues that the theoretical inconsistency often observed among Responsible AI (RAI) metrics, such as differing fairness definitions or tradeoffs between accuracy and privacy, should be embraced as a valuable feature rather than a flaw to be eliminated. We contend that navigating these inconsistencies, by treating metrics as divergent objectives, yields three key benefits: (1) Normative Pluralism: Maintaining a full suite of potentially contradictory metrics ensures that the diverse moral stances and stakeholder values inherent in RAI are adequately represented. (2) Epistemological Completeness: The use of multiple, sometimes conflicting, metrics allows for a more comprehensive capture of multifaceted ethical concepts, thereby preserving greater informational fidelity about these concepts than any single, simplified definition. (3) Implicit Regularization: Jointly optimizing for theoretically conflicting objectives discourages overfitting to one specific metric, steering models towards solutions with enhanced generalization and robustness under real-world complexities. In contrast, efforts to enforce theoretical consistency by simplifying or pruning metrics risk narrowing this value diversity, losing conceptual depth, and degrading model performance. We therefore advocate for a shift in RAI theory and practice: from getting trapped in inconsistency to characterizing acceptable inconsistency thresholds and elucidating the mechanisms that permit robust, approximated consistency in practice.
arxiv情報
著者 | Gordon Dai,Yunze Xiao |
発行日 | 2025-05-23 17:48:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google