Lingua Manga: A Generic Large Language Model Centric System for Data Curation

要約

データ・キュレーションは、多くの重要な、しかし時間のかかるデータ処理タスクを含む広範な分野である。しかし、このようなタスクの多様性は、汎用的なデータキュレーションシステムの開発を困難にしている。この問題に対処するために、我々は、事前に訓練された大規模な言語モデルを利用する、ユーザーフレンドリーで汎用性の高いシステムであるLingua Mangaを紹介する。Lingua Mangaは、柔軟で迅速な開発を容易にしながら、高いパフォーマンスとラベル効率を達成するための自動最適化を提供します。我々は、異なる目的を持ち、様々な技術的習熟度のユーザーを持つ3つのアプリケーションの例を通して、Lingua Mangaが、熟練したプログラマーとローコード、あるいはノーコードユーザーの両方を効果的に支援し、データキュレーションの課題に対処できることを実証する。

要約(オリジナル)

Data curation is a wide-ranging area which contains many critical but time-consuming data processing tasks. However, the diversity of such tasks makes it challenging to develop a general-purpose data curation system. To address this issue, we present Lingua Manga, a user-friendly and versatile system that utilizes pre-trained large language models. Lingua Manga offers automatic optimization for achieving high performance and label efficiency while facilitating flexible and rapid development. Through three example applications with distinct objectives and users of varying levels of technical proficiency, we demonstrate that Lingua Manga can effectively assist both skilled programmers and low-code or even no-code users in addressing data curation challenges.

arxiv情報

著者 Zui Chen,Lei Cao,Sam Madden
発行日 2023-09-01 15:40:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.DB パーマリンク