要約
テキスト分類は、自然言語処理において最も本質的かつ基本的な問題である。最近の数多くのテキスト分類モデルが逐次的なディープラーニング技術を適用している一方で、グラフニューラルネットワークベースのモデルは、複雑な構造化テキストデータを直接扱うことができ、グローバルな情報を利用することができる。多くの実際のテキスト分類アプリケーションは、単語、文書、コーパスの大域的特徴を捉えるグラフに自然にキャストすることができる。このサーベイでは、コーパスレベルと文書レベルのグラフニューラルネットワークを含む、2023年までの手法の網羅性を示す。グラフ構築のメカニズムやグラフベースの学習プロセスを扱いながら、これらの手法のそれぞれについて詳細に論じる。技術的な調査だけでなく、グラフ・ニューラル・ネットワークを用いたテキスト分類の背後にある問題や将来的な方向性についても言及する。また、データセット、評価指標、実験デザインについても取り上げ、一般に公開されているベンチマークにおける公表された性能の要約を示す。なお、本サーベイでは、異なる技術間の包括的な比較を行い、様々な評価メトリクスの長所と短所を明らかにする。
要約(オリジナル)
Text Classification is the most essential and fundamental problem in Natural Language Processing. While numerous recent text classification models applied the sequential deep learning technique, graph neural network-based models can directly deal with complex structured text data and exploit global information. Many real text classification applications can be naturally cast into a graph, which captures words, documents, and corpus global features. In this survey, we bring the coverage of methods up to 2023, including corpus-level and document-level graph neural networks. We discuss each of these methods in detail, dealing with the graph construction mechanisms and the graph-based learning process. As well as the technological survey, we look at issues behind and future directions addressed in text classification using graph neural networks. We also cover datasets, evaluation metrics, and experiment design and present a summary of published performance on the publicly available benchmarks. Note that we present a comprehensive comparison between different techniques and identify the pros and cons of various evaluation metrics in this survey.
arxiv情報
著者 | Kunze Wang,Yihao Ding,Soyeon Caren Han |
発行日 | 2024-07-05 12:06:26+00:00 |
arxivサイト | arxiv_id(pdf) |