要約
テキスト データの急激な増加により、特にストレージと処理のコストが高くつくため、管理と分析に大きな課題が生じています。
テキスト マイニングの重要な側面であるテキスト分類は、テキスト データの効率的な分類と編成を可能にすることで、堅牢なソリューションを提供します。
これらの技術により、個人、研究者、企業は大量のテキストから意味のあるパターンや洞察を導き出すことができます。
この調査論文では、研究分野に基づいたテキスト分類のために特別に設計された包括的な分類法を紹介します。
分類は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論サブ技術、および研究分野のアプリケーションの階層レベルに構造化されています。
当社では、経験的および実験的という二重の評価アプローチを採用しています。
私たちは経験的に、4 つの重要な基準にわたってテキスト分類技術を評価します。
実験的に、同じ方法論テクニック内および同じ研究分野全体のサブカテゴリ内で方法論サブテクニックを比較し、ランク付けします。
この構造化された分類法と徹底的な評価を組み合わせることで、テキスト分類アルゴリズムとそのアプリケーションについて詳細かつ微妙な理解を提供し、研究者が分野固有の正確な洞察に基づいて情報に基づいた意思決定を行えるようになります。
要約(オリジナル)
The exponential growth of textual data presents substantial challenges in management and analysis, notably due to high storage and processing costs. Text classification, a vital aspect of text mining, provides robust solutions by enabling efficient categorization and organization of text data. These techniques allow individuals, researchers, and businesses to derive meaningful patterns and insights from large volumes of text. This survey paper introduces a comprehensive taxonomy specifically designed for text classification based on research fields. The taxonomy is structured into hierarchical levels: research field-based category, research field-based sub-category, methodology-based technique, methodology sub-technique, and research field applications. We employ a dual evaluation approach: empirical and experimental. Empirically, we assess text classification techniques across four critical criteria. Experimentally, we compare and rank the methodology sub-techniques within the same methodology technique and within the same overall research field sub-category. This structured taxonomy, coupled with thorough evaluations, provides a detailed and nuanced understanding of text classification algorithms and their applications, empowering researchers to make informed decisions based on precise, field-specific insights.
arxiv情報
著者 | Kamal Taha,Paul D. Yoo,Chan Yeun,Aya Taha |
発行日 | 2024-11-25 14:32:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google