Coordinated Disclosure for AI: Beyond Security Vulnerabilities


人工知能 (AI) 分野における危害報告は現在、その場限りで行われており、アルゴリズムの欠陥を開示または対処するための体系化されたプロセスが欠如しています。
対照的に、調整された脆弱性開示 (CVD) の精神とエコシステムは、ソフトウェアのセキュリティと透明性において極めて重要な役割を果たします。
世界的には、AI 関連の問題に対処する際の透明性と協力を促進する枠組みを確立する取り組みが継続的に行われていますが、依然として課題は残っています。
機械学習 (ML) モデルのアルゴリズム上の欠陥は、従来のソフトウェアの脆弱性と比較して明確な課題を提示しており、専門的なアプローチが必要です。
このギャップに対処するために、機械学習と人工知能の問題の複雑さに合わせて調整された専用の調整された欠陥開示 (CFD) フレームワークの実装を提案します。
このペーパーでは、危害に関するアドホックな報告と参加型監査の出現を含め、ML における開示の歴史的状況を詳しく掘り下げています。
これらの慣行とサイバーセキュリティにおける十分に確立された開示規範を並べることで、CFD の広範な導入により、組織とコミュニティの両方の利益のバランスを慎重にとった透明性のあるプロセスを通じて社会の信頼を高める可能性があると私たちは主張します。


Harm reporting in the field of Artificial Intelligence (AI) currently operates on an ad hoc basis, lacking a structured process for disclosing or addressing algorithmic flaws. In contrast, the Coordinated Vulnerability Disclosure (CVD) ethos and ecosystem play a pivotal role in software security and transparency. Globally, there are ongoing efforts to establish frameworks that promote transparency and collaboration in addressing AI-related issues, though challenges persist. Algorithmic flaws in machine learning (ML) models present distinct challenges compared to traditional software vulnerabilities, warranting a specialized approach. To address this gap, we propose the implementation of a dedicated Coordinated Flaw Disclosure (CFD) framework tailored to the intricacies of machine learning and artificial intelligence issues. This paper delves into the historical landscape of disclosures in ML, encompassing the ad hoc reporting of harms and the emergence of participatory auditing. By juxtaposing these practices with the well-established disclosure norms in cybersecurity, we argue that the broader adoption of CFD has the potential to enhance public trust through transparent processes that carefully balance the interests of both organizations and the community.


著者 Sven Cattell,Avijit Ghosh,Lucie-Aimée Kaffee
発行日 2024-05-24 16:08:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CR, cs.CY パーマリンク