DataCI: A Platform for Data-Centric AI on Streaming Data

要約

動的ストリーミング データ設定におけるデータ中心の AI 向けに特別に設計された包括的なオープンソース プラットフォームである DataCI を紹介します。
DataCI は、1) シームレスなストリーミング データセット管理、ストリーミング シナリオでのデータ中心のパイプライン開発と評価のための豊富な API を備えたインフラストラクチャ、2) パイプラインの系統を追跡するための慎重に設計されたバージョン管理機能、3) より良いパフォーマンスを実現するための直感的なグラフィカル インターフェイスを提供します。
インタラクティブなユーザーエクスペリエンス。
予備調査とデモンストレーションは、DataCI の使いやすさと有効性を証明し、ストリーミング データ コンテキストにおけるデータ中心 AI の実践に革命をもたらす可能性を強調しています。

要約(オリジナル)

We introduce DataCI, a comprehensive open-source platform designed specifically for data-centric AI in dynamic streaming data settings. DataCI provides 1) an infrastructure with rich APIs for seamless streaming dataset management, data-centric pipeline development and evaluation on streaming scenarios, 2) an carefully designed versioning control function to track the pipeline lineage, and 3) an intuitive graphical interface for a better interactive user experience. Preliminary studies and demonstrations attest to the easy-to-use and effectiveness of DataCI, highlighting its potential to revolutionize the practice of data-centric AI in streaming data contexts.

arxiv情報

著者 Huaizheng Zhang,Yizheng Huang,Yuanming Li
発行日 2023-06-27 15:07:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG パーマリンク