Risk Sources and Risk Management Measures in Support of Standards for General-Purpose AI Systems

要約

新たに出現した種類の人工知能 (AI) による短期および長期のリスクと、利用可能なリスク管理手段を特定することが急務となっています。
これに応えて、AI の規制と安全基準の策定における世界的な取り組みを支援するために、当社は汎用 AI (GPAI) システムのリスク源とリスク管理手段の広範なカタログを作成し、関連する場合は説明とサポート例を提供します。
この作業には、モデル開発、トレーニング、導入の各段階にわたる技術的、運用的、社会的リスクの特定と、これらのリスクを管理するための確立された実験的方法の調査が含まれます。
私たちの知る限り、この文書は、GPAI のリスク源と、記述的かつ自己完結型で、既存の規制枠組みに対して中立的なリスク管理手段の両方について広範な文書を提供するこの種の文書としては初めてのものです。
この取り組みは、AI プロバイダー、標準化専門家、研究者、政策立案者、規制当局が GPAI システムによるシステミック リスクを特定し、軽減できるようにすることを目的としています。
このため、AI ガバナンスと標準の関係者が直接使用しやすいように、カタログはパブリック ドメイン ライセンスに基づいてリリースされています。

要約(オリジナル)

There is an urgent need to identify both short and long-term risks from newly emerging types of Artificial Intelligence (AI), as well as available risk management measures. In response, and to support global efforts in regulating AI and writing safety standards, we compile an extensive catalog of risk sources and risk management measures for general-purpose AI (GPAI) systems, complete with descriptions and supporting examples where relevant. This work involves identifying technical, operational, and societal risks across model development, training, and deployment stages, as well as surveying established and experimental methods for managing these risks. To the best of our knowledge, this paper is the first of its kind to provide extensive documentation of both GPAI risk sources and risk management measures that are descriptive, self-contained and neutral with respect to any existing regulatory framework. This work intends to help AI providers, standards experts, researchers, policymakers, and regulators in identifying and mitigating systemic risks from GPAI systems. For this reason, the catalog is released under a public domain license for ease of direct use by stakeholders in AI governance and standards.

arxiv情報

著者 Rokas Gipiškis,Ayrton San Joaquin,Ze Shen Chin,Adrian Regenfuß,Ariel Gil,Koen Holtman
発行日 2024-11-15 17:18:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.LG パーマリンク