Neural Natural Language Processing for Long Texts: A Survey of the State-of-the-Art

要約

過去 10 年間、ディープ ニューラル ネットワーク (DNN) の採​​用は自然言語処理 (NLP) に大きな恩恵をもたらしました。
ただし、長い文書分析の要求は短いテキストの分析とはまったく異なり、オンラインにアップロードされる文書のサイズはますます増大しており、長い文書に対する NLP レンダリングは重要な研究分野となっています。
このホワイトペーパーでは、この分野の現在の最先端技術を概説し、関連するニューラル構成要素を概観し、続いて文書分類、要約という 2 つの主要な NLP タスクに焦点を当て、感情分析での使用法についても言及します。
長い文書の NLP に関連する課題、課題、現在の解決策について詳しく説明します。
現在の研究で使用されている、公開されているラベル付きの長い文書データセットもリストします。

要約(オリジナル)

The adoption of Deep Neural Networks (DNNs) has greatly benefited Natural Language Processing (NLP) during the past decade. However, the demands of long documents analysis are quite different from those of shorter texts, with the ever increasing size of documents uploaded online rendering NLP on long documents a critical area of research. This paper surveys the current state-of-the-art in the domain, overviewing the relevant neural building blocks and subsequently focusing on two main NLP tasks: Document Classification, Summarization as well as mentioning uses in Sentiment Analysis. We detail the challenges, issues and current solutions related to long-document NLP. We also list publicly available, labelled, long-document datasets used in current research.

arxiv情報

著者 Dimitrios Tsirmpas,Ioannis Gkionis,Ioannis Mademlis
発行日 2023-05-25 17:13:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, I.2.7 パーマリンク