要約
データ洞察など、明示的な表のセル内に隠された暗黙的な知識が、高品質の表の要約を生成する鍵となります。
ただし、そのような暗黙知を明らかにするのは簡単な作業ではありません。
構造化テーブルの複雑な性質により、大規模言語モデル (LLM) であっても、洞察力に富んだ忠実な方法で暗黙の知識をマイニングすることは困難です。
この課題に対処するために、私たちは新しい表推論フレームワーク Question-then-Pinpoint を提案します。
私たちの仕事は、洞察に満ちた知識に自問し、テーブル上の証拠を忠実に特定することでそれに答え、要約者に説明可能なガイダンスを提供できる、プラグアンドプレイのテーブル推論者の構築に焦点を当てています。
信頼できる推論者を訓練するために、教師 LLM が粗い推論から細かい推論へのパスをたどるように誘導することで表の知識を収集し、2 つの品質向上戦略を通じてそれを洗練させて、高品質の知識を推論者に選択的に抽出します。
新しく提案された InsTaSumm を含む 2 つのテーブル要約データセットに関する広範な実験により、フレームワークの一般的な有効性が検証されました。
要約(オリジナル)
Implicit knowledge hidden within the explicit table cells, such as data insights, is the key to generating a high-quality table summary. However, unveiling such implicit knowledge is a non-trivial task. Due to the complex nature of structured tables, it is challenging even for large language models (LLMs) to mine the implicit knowledge in an insightful and faithful manner. To address this challenge, we propose a novel table reasoning framework Question-then-Pinpoint. Our work focuses on building a plug-and-play table reasoner that can self-question the insightful knowledge and answer it by faithfully pinpointing evidence on the table to provide explainable guidance for the summarizer. To train a reliable reasoner, we collect table knowledge by guiding a teacher LLM to follow the coarse-to-fine reasoning paths and refine it through two quality enhancement strategies to selectively distill the high-quality knowledge to the reasoner. Extensive experiments on two table summarization datasets, including our newly proposed InsTaSumm, validate the general effectiveness of our framework.
arxiv情報
著者 | Kwangwook Seo,Jinyoung Yeo,Dongha Lee |
発行日 | 2024-10-01 11:26:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google