要約
データは、人工知能 (AI) システムが学習する方法にとって重要なインフラストラクチャです。
ただし、これまでのこれらのシステムは主にモデル中心であり、データ品質を犠牲にしてモデルを重視していました。
データ品質の問題は、特に下流の展開や現実世界のアプリケーションにおいて、AI システムのパフォーマンスを悩ませます。
新しい概念としてのデータ中心 AI (DCAI) は、反復的かつ体系的なアプローチを通じて、AI システムの検討においてデータ、その品質、およびそのダイナミズムを最前線にもたらします。
最初の概要の 1 つとして、この記事ではデータ中心の視点と概念をまとめて DCAI の基礎の概要を説明します。
具体的には、研究者と実践者のための 6 つの指針を策定し、DCAI の将来の進歩の方向性を示しています。
要約(オリジナル)
Data is a crucial infrastructure to how artificial intelligence (AI) systems learn. However, these systems to date have been largely model-centric, putting a premium on the model at the expense of the data quality. Data quality issues beset the performance of AI systems, particularly in downstream deployments and in real-world applications. Data-centric AI (DCAI) as an emerging concept brings data, its quality and its dynamism to the forefront in considerations of AI systems through an iterative and systematic approach. As one of the first overviews, this article brings together data-centric perspectives and concepts to outline the foundations of DCAI. It specifically formulates six guiding principles for researchers and practitioners and gives direction for future advancement of DCAI.
arxiv情報
著者 | Mohammad Hossein Jarrahi,Ali Memariani,Shion Guha |
発行日 | 2024-03-12 16:07:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google