Large Language Model for Table Processing: A Survey


テーブルは通常 2 次元であり、大量のデータを保存するように構造化されており、データベース クエリ、スプレッドシート操作、Web テーブルの質問応答、画像テーブル情報の抽出などの日常業務に不可欠です。
大規模言語モデル (LLM) またはビジュアル言語モデル (VLM) を使用してこれらのテーブル中心のタスクを自動化すると、公共に大きな利益がもたらされ、学界や産業界からの関心を集めています。
この調査では、ユーザー シナリオと技術的側面の両方を調査し、テーブル関連タスクの包括的な概要を提供します。
テーブル処理に合わせた LLM と VLM のトレーニング手法をまとめます。
さらに、テーブル関連のさまざまなタスクに対するプロンプト エンジニアリング、特に LLM を利用したエージェントの使用についても説明します。
最後に、暗黙のユーザー意図の処理やさまざまなテーブル ソースからの情報抽出など、いくつかの課題を取り上げます。


Tables, typically two-dimensional and structured to store large amounts of data, are essential in daily activities like database queries, spreadsheet manipulations, web table question answering, and image table information extraction. Automating these table-centric tasks with Large Language Models (LLMs) or Visual Language Models (VLMs) offers significant public benefits, garnering interest from academia and industry. This survey provides a comprehensive overview of table-related tasks, examining both user scenarios and technical aspects. It covers traditional tasks like table question answering as well as emerging fields such as spreadsheet manipulation and table data analysis. We summarize the training techniques for LLMs and VLMs tailored for table processing. Additionally, we discuss prompt engineering, particularly the use of LLM-powered agents, for various table-related tasks. Finally, we highlight several challenges, including processing implicit user intentions and extracting information from various table sources.


著者 Weizheng Lu,Jing Zhang,Ju Fan,Zihao Fu,Yueguo Chen,Xiaoyong Du
発行日 2024-07-26 14:12:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク