QI2 — an Interactive Tool for Data Quality Assurance

要約

ML システムとビッグデータの影響と分散が増大するにつれて、高いデータ品質の重要性が高まっています。
また、欧州委員会が計画している AI 法では、特に安全関連の ML システムの市場導入のための、データ品質に関する困難な法的要件が定義されています。
このペーパーでは、複数のデータ品質側面のデータ品質保証プロセスをサポートする新しいアプローチを紹介します。
このアプローチにより、定量的なデータ品質要件の検証が可能になります。
概念と利点が紹介され、小さなデータセットの例で説明されます。
この方法がどのように適用されるかは、手書き数字に基づいたよく知られた MNIST データ セットで実証されます。

要約(オリジナル)

The importance of high data quality is increasing with the growing impact and distribution of ML systems and big data. Also the planned AI Act from the European commission defines challenging legal requirements for data quality especially for the market introduction of safety relevant ML systems. In this paper we introduce a novel approach that supports the data quality assurance process of multiple data quality aspects. This approach enables the verification of quantitative data quality requirements. The concept and benefits are introduced and explained on small example data sets. How the method is applied is demonstrated on the well known MNIST data set based an handwritten digits.

arxiv情報

著者 Simon Geerkens,Christian Sieberichs,Alexander Braun,Thomas Waschulzik
発行日 2023-07-07 07:06:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY パーマリンク