Classification of Tabular Data by Text Processing

要約

自然言語処理テクノロジーは、過去 10 年間で大幅に進歩しました。
テキスト処理は、さまざまな分野に適用されて成功しています。
この論文では、表形式データの分類タスクを解決するために最先端のテキスト処理技術を使用する新しいフレームワークであるテキストベース分類(TBC)を提案します。
他の分類方法と比較してこのアプローチを使用する利点を示す一連の対照実験を提供します。
いくつかのデータセットの実験結果では、このフレームワークが予測クラスの精度、精度、再現率においていくつかの最先端モデルと同等のパフォーマンスを達成していることも示しています。

要約(オリジナル)

Natural Language Processing technology has advanced vastly in the past decade. Text processing has been successfully applied to a wide variety of domains. In this paper, we propose a novel framework, Text Based Classification(TBC), that uses state of the art text processing techniques to solve classification tasks on tabular data. We provide a set of controlled experiments where we present the benefits of using this approach against other classification methods. Experimental results on several data sets also show that this framework achieves comparable performance to that of several state of the art models in accuracy, precision and recall of predicted classes.

arxiv情報

著者 Keshav Ramani,Daniel Borrajo
発行日 2023-11-21 10:56:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク