TabGenie: A Toolkit for Table-to-Text Generation

要約

データからテキストへの生成データセットの不均一性により、データからテキストへの生成システムに関する研究が制限されます。
TabGenie は、テーブルからテキストへの生成の統一されたフレームワークを通じて、研究者がさまざまなデータからテキストへの生成データセットを探索、前処理、分析できるようにするツールキットです。
TabGenie では、すべての入力が関連するメタデータを含むテーブルとして表されます。
テーブルは、Web インターフェースを介して調べることができます。これは、テーブルからテキストへの生成をデバッグするためのインタラクティブ モードも提供し、生成されたシステム出力を並べて比較し、手動分析用に簡単にエクスポートできます。
さらに、TabGenie には、統合されたデータセットの読み込みと処理のためのコマンド ライン処理ツールと Python バインディングが装備されています。
TabGenie を PyPI パッケージとしてリリースし、そのオープンソース コードとライブ デモを https://github.com/kasnerz/tabgenie で提供しています。

要約(オリジナル)

Heterogenity of data-to-text generation datasets limits the research on data-to-text generation systems. We present TabGenie – a toolkit which enables researchers to explore, preprocess, and analyze a variety of data-to-text generation datasets through the unified framework of table-to-text generation. In TabGenie, all the inputs are represented as tables with associated metadata. The tables can be explored through the web interface, which also provides an interactive mode for debugging table-to-text generation, facilitates side-by-side comparison of generated system outputs, and allows easy exports for manual analysis. Furthermore, TabGenie is equipped with command line processing tools and Python bindings for unified dataset loading and processing. We release TabGenie as a PyPI package and provide its open-source code and a live demo at https://github.com/kasnerz/tabgenie.

arxiv情報

著者 Zdeněk Kasner,Ekaterina Garanina,Ondřej Plátek,Ondřej Dušek
発行日 2023-02-27 22:05:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク