要約
動的ストリーミング データ設定におけるデータ中心の AI 向けに特別に設計された包括的なオープンソース プラットフォームである DataCI を紹介します。
DataCI は、1) シームレスなストリーミング データセット管理、ストリーミング シナリオでのデータ中心のパイプライン開発と評価のための豊富な API を備えたインフラストラクチャ、2) パイプラインの系統を追跡するための慎重に設計されたバージョン管理機能、3) より良いパフォーマンスを実現するための直感的なグラフィカル インターフェイスを提供します。
インタラクティブなユーザーエクスペリエンス。
予備調査とデモンストレーションは、DataCI の使いやすさと有効性を証明し、ストリーミング データ コンテキストにおけるデータ中心 AI の実践に革命をもたらす可能性を強調しています。
要約(オリジナル)
We introduce DataCI, a comprehensive open-source platform designed specifically for data-centric AI in dynamic streaming data settings. DataCI provides 1) an infrastructure with rich APIs for seamless streaming dataset management, data-centric pipeline development and evaluation on streaming scenarios, 2) an carefully designed versioning control function to track the pipeline lineage, and 3) an intuitive graphical interface for a better interactive user experience. Preliminary studies and demonstrations attest to the easy-to-use and effectiveness of DataCI, highlighting its potential to revolutionize the practice of data-centric AI in streaming data contexts.
arxiv情報
著者 | Huaizheng Zhang,Yizheng Huang,Yuanming Li |
発行日 | 2023-06-27 15:07:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google