TableMaster: A Recipe to Advance Table Understanding with Language Models

要約

テーブルは、構造化されたリレーショナルデータを表すための基本形式として機能します。
現在の言語モデル(LMS)は多くのテキストベースのタスクに優れていますが、構造化された性質などの表形式データの複雑な特性により、テーブル理解の課題に直面しています。
この論文では、テーブルの理解を向上させるためにLMSを強化することを目指しています。
1)ターゲットデータを見つけることの難しさ、2)表セマンティクスの欠陥、3)テキスト推論における数値の不正確さ、および4)象徴的推論におけるセマンティックな柔軟性のある4つの重要な課題を特定します。
これらの問題に対処するために、これらの障害を克服するために複数のソリューションを統合するレシピと包括的なフレームワークであるTablemasterを提案します。
Tablemasterは、最初に関連するテーブルコンテンツを抽出し、濃縮されたセマンティックコンテキストで口頭で抽出します。
さらに、テキストとシンボリックの推論を動的に調整する柔軟なアプローチである適応推論を紹介し、各クエリに合わせて推論プロセスを調整します。
広範な分析と実験は、テーブルマスターの調査結果と有効性を示しています。
WIKITQデータセットでは、TablemasterはGPT-4o-Miniを使用して78.13%の精度を達成し、既存のベースラインを超えています。

要約(オリジナル)

Tables serve as a fundamental format for representing structured relational data. While current language models (LMs) excel at many text-based tasks, they still face challenges in table understanding due to the complex characteristics of tabular data, such as their structured nature. In this paper, we aim to enhance LMs for improved table understanding. We identify four key challenges: 1) difficulty in locating target data, 2) deficiency in table semantics, 3) numerical inaccuracies in textual reasoning, and 4) semantic inflexibility in symbolic reasoning. To address these issues, we propose TableMaster, a recipe and comprehensive framework that integrates multiple solutions to overcome these obstacles. TableMaster first extracts relevant table content and verbalizes it with enriched semantic context. Additionally, we introduce adaptive reasoning, a flexible approach that dynamically adjusts between textual and symbolic reasoning, tailoring the reasoning process to each query. Extensive analyses and experiments demonstrate our findings and the effectiveness of TableMaster. On the WikiTQ dataset, TableMaster achieves an accuracy of 78.13% using GPT-4o-mini, surpassing existing baselines.

arxiv情報

著者 Lang Cao
発行日 2025-01-31 18:31:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク