Text Classification: A Perspective of Deep Learning Methods

要約

近年、インターネット上の情報の急速な発展に伴い、複雑なテキストやドキュメントの数が飛躍的に増加しています。ディープラーニング技術を使用してテキストを正確に分類するには、ディープラーニング手法、つまりディープラーニング手法についての深い理解が必要です。
テキスト分類においてますます重要になっています。
テキスト分類は、コンテンツと主題に基づいて一連のドキュメントを複数の事前定義されたカテゴリに自動的に分類するタスクのクラスです。
したがって、テキスト分類の主な目標は、ユーザーがテキスト リソースから情報を抽出し、検索、分類、機械学習技術などのプロセスを一緒に処理して、さまざまなカテゴリを分類できるようにすることです。
深層学習の新しい技術の多くは、自然言語処理においてすでに優れた結果を達成しています。
これらの学習アルゴリズムが成功するかどうかは、複雑なモデルとデータ内の非線形関係を理解する能力にかかっています。
ただし、テキスト分類に適切な構造、アーキテクチャ、および手法を見つけることは、研究者にとっての課題です。
このペーパーでは、特徴抽出、特徴削減、評価戦略と方法などのテキスト分類タスクに必要な重要な手順を含む、深層学習ベースのテキスト分類アルゴリズムを紹介します。
記事の最後では、さまざまな深層学習テキスト分類方法を比較してまとめています。

要約(オリジナル)

In recent years, with the rapid development of information on the Internet, the number of complex texts and documents has increased exponentially, which requires a deeper understanding of deep learning methods in order to accurately classify texts using deep learning techniques, and thus deep learning methods have become increasingly important in text classification. Text classification is a class of tasks that automatically classifies a set of documents into multiple predefined categories based on their content and subject matter. Thus, the main goal of text classification is to enable users to extract information from textual resources and process processes such as retrieval, classification, and machine learning techniques together in order to classify different categories. Many new techniques of deep learning have already achieved excellent results in natural language processing. The success of these learning algorithms relies on their ability to understand complex models and non-linear relationships in data. However, finding the right structure, architecture, and techniques for text classification is a challenge for researchers. This paper introduces deep learning-based text classification algorithms, including important steps required for text classification tasks such as feature extraction, feature reduction, and evaluation strategies and methods. At the end of the article, different deep learning text classification methods are compared and summarized.

arxiv情報

著者 Zhongwei Wan
発行日 2023-09-24 21:49:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク