Few-Shot Data-to-Text Generation via Unified Representation and Multi-Source Learning

要約

我々は、主に特定のタイプの構造化データに焦点を当てた既存の方法の制限に対処する、構造化データからテキストへの生成のための新しいアプローチを紹介します。
私たちが提案する手法は、テーブル、ナレッジグラフトリプル、意味表現などのさまざまな形式の構造化データを処理できる統一表現を提供することで、マルチタスクトレーニング、ゼロショットおよび少数ショットのシナリオのパフォーマンスを向上させることを目的としています。
私たちが提案するアプローチが新しい構造化された形式に効果的に適応でき、現在の方法と比較してパフォーマンスを向上できることを実証します。
たとえば、テーブル入力でトレーニングされたモデルをナレッジ グラフ データセットに転送すると、私たちの方法ではゼロショット BLEU スコアが 66% 向上しました。
私たちが提案する方法は、より一般的なデータからテキストへの生成フレームワークに向けた重要なステップです。

要約(オリジナル)

We present a novel approach for structured data-to-text generation that addresses the limitations of existing methods that primarily focus on specific types of structured data. Our proposed method aims to improve performance in multi-task training, zero-shot and few-shot scenarios by providing a unified representation that can handle various forms of structured data such as tables, knowledge graph triples, and meaning representations. We demonstrate that our proposed approach can effectively adapt to new structured forms, and can improve performance in comparison to current methods. For example, our method resulted in a 66% improvement in zero-shot BLEU scores when transferring models trained on table inputs to a knowledge graph dataset. Our proposed method is an important step towards a more general data-to-text generation framework.

arxiv情報

著者 Alexander Hanbo Li,Mingyue Shang,Evangelia Spiliopoulou,Jie Ma,Patrick Ng,Zhiguo Wang,Bonan Min,William Wang,Kathleen McKeown,Vittorio Castelli,Dan Roth,Bing Xiang
発行日 2023-08-10 03:09:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク