Weakly Supervised Concept Map Generation through Task-Guided Graph Translation

要約

近年、フリーテキストからの知識を適切に構造化された要約を提供する利点があるため、概念マップ生成技術が急速に発展しています。
従来の教師なし手法はタスク指向のコンセプト マップを生成しませんが、深い生成モデルは大量のトレーニング データを必要とします。
この作業では、GT-D2G (Graph Translation-based Document To Graph) を提示します。これは、一般化された NLP パイプラインを活用してセマンティックリッチな初期グラフを導出し、それらをより簡潔な構造に変換する自動コンセプト マップ生成フレームワークです。
下流のタスク ラベル。
GT-D2G によって生成されたコンセプト マップは、入力テキストの構造化された知識の解釈可能な要約を提供できます。これは、人間による評価と 3 つの実世界のコーパスに関するケース スタディによって示されます。
ドキュメント分類のダウンストリーム タスクに関するさらなる実験では、GT-D2G が他のコンセプト マップ生成方法より優れていることが示されています。
さらに、ラベル効率の高い学習設定でのGT-D2Gのラベル付け効率と、制御されたハイパーパラメーター研究で生成されたグラフサイズの柔軟性を具体的に検証します。

要約(オリジナル)

Recent years have witnessed the rapid development of concept map generation techniques due to their advantages in providing well-structured summarization of knowledge from free texts. Traditional unsupervised methods do not generate task-oriented concept maps, whereas deep generative models require large amounts of training data. In this work, we present GT-D2G (Graph Translation-based Document To Graph), an automatic concept map generation framework that leverages generalized NLP pipelines to derive semantic-rich initial graphs, and translates them into more concise structures under the weak supervision of downstream task labels. The concept maps generated by GT-D2G can provide interpretable summarization of structured knowledge for the input texts, which are demonstrated through human evaluation and case studies on three real-world corpora. Further experiments on the downstream task of document classification show that GT-D2G beats other concept map generation methods. Moreover, we specifically validate the labeling efficiency of GT-D2G in the label-efficient learning setting and the flexibility of generated graph sizes in controlled hyper-parameter studies.

arxiv情報

著者 Jiaying Lu,Xiangjue Dong,Carl Yang
発行日 2023-03-08 13:35:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク