要約
テーブルは現実世界のデータベースで広く使用されており、人間が分析して操作するには多大な時間と労力を必要とします。
大規模言語モデル (LLM) の進歩により、自然言語入力を使用してテーブルを操作できるようになり、この機能が現実に近づいています。
このペーパーでは、LLM が外部関数コマンドを使用してテーブルを理解し、操作できるようにする、統合された微調整されたフレームワークである TableGPT を紹介します。
テーブルとシームレスに対話する機能が導入され、質問応答、データ操作 (操作の挿入、削除、クエリ、変更など)、データの視覚化、分析レポートの生成、自動予測などの幅広い機能が可能になります。
TableGPT は、表形式データを簡単に活用できるようにすることで、ユーザーに利便性とアクセシビリティを提供することを目的としています。
TableGPT の中核には、グローバル テーブル表現という新しい概念があり、LLM はメタ情報を超えてテーブル全体を包括的に理解できるようになります。
TableGPT は、テーブル モダリティとテキスト モダリティの両方で LLM を共同トレーニングすることにより、表形式のデータを深く理解し、コマンド チェーン命令を通じてテーブルに対して複雑な操作を実行できるようになります。
重要なのは、TableGPT には、外部 API インターフェイスに依存するのではなく、自己完結型システムであるという利点があります。
さらに、効率的なデータ プロセス フロー、クエリ拒否 (適切な場合)、およびプライベート展開をサポートし、ドメイン データのより迅速な微調整を可能にし、データ プライバシーを確保することで、特定のユース ケースに対するフレームワークの適応性を強化します。
要約(オリジナル)
Tables are prevalent in real-world databases, requiring significant time and effort for humans to analyze and manipulate. The advancements in large language models (LLMs) have made it possible to interact with tables using natural language input, bringing this capability closer to reality. In this paper, we present TableGPT, a unified fine-tuned framework that enables LLMs to understand and operate on tables using external functional commands. It introduces the capability to seamlessly interact with tables, enabling a wide range of functionalities such as question answering, data manipulation (e.g., insert, delete, query, and modify operations), data visualization, analysis report generation, and automated prediction. TableGPT aims to provide convenience and accessibility to users by empowering them to effortlessly leverage tabular data. At the core of TableGPT lies the novel concept of global tabular representations, which empowers LLMs to gain a comprehensive understanding of the entire table beyond meta-information. By jointly training LLMs on both table and text modalities, TableGPT achieves a deep understanding of tabular data and the ability to perform complex operations on tables through chain-of-command instructions. Importantly, TableGPT offers the advantage of being a self-contained system rather than relying on external API interfaces. Moreover, it supports efficient data process flow, query rejection (when appropriate) and private deployment, enabling faster domain data fine-tuning and ensuring data privacy, which enhances the framework’s adaptability to specific use cases.
arxiv情報
著者 | Liangyu Zha,Junlin Zhou,Liyao Li,Rui Wang,Qingyi Huang,Saisai Yang,Jing Yuan,Changbao Su,Xiang Li,Aofeng Su,Tao Zhang,Chen Zhou,Kaizhe Shou,Miao Wang,Wufang Zhu,Guoshan Lu,Chao Ye,Yali Ye,Wentao Ye,Yiming Zhang,Xinglong Deng,Jie Xu,Haobo Wang,Gang Chen,Junbo Zhao |
発行日 | 2023-07-17 17:36:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google