Training Compute Thresholds: Features and Functions in AI Governance

要約

このペーパーでは、人工知能 (AI) システムを管理するツールとしてのトレーニング コンピューティングしきい値の使用について検討します。
私たちは、コンピューティングしきい値は規制の唯一の決定要因ではなく、AI モデルをさらに評価するための貴重なトリガーとして機能すると主張します。
コンピューティングしきい値の主な利点には、モデルの機能とリスクとの相関関係、定量化可能性、測定の容易さ、回避に対する堅牢性、モデルの開発と展開前の把握可能性、外部検証の可能性、および対象範囲が含まれます。
コンピューティングしきい値は、潜在的に高リスクのモデルを特定するための実用的な開始点を提供し、他のセクター固有の規制やより広範なガバナンス対策と並行して、AI ガバナンス フレームワークの初期フィルターとして使用できます。

要約(オリジナル)

This paper examines the use of training compute thresholds as a tool for governing artificial intelligence (AI) systems. We argue that compute thresholds serve as a valuable trigger for further evaluation of AI models, rather than being the sole determinant of the regulation. Key advantages of compute thresholds include their correlation with model capabilities and risks, quantifiability, ease of measurement, robustness to circumvention, knowability before model development and deployment, potential for external verification, and targeted scope. Compute thresholds provide a practical starting point for identifying potentially high-risk models and can be used as an initial filter in AI governance frameworks alongside other sector-specific regulations and broader governance measures.

arxiv情報

著者 Lennart Heim
発行日 2024-05-17 14:10:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CY, cs.LG パーマリンク