Gzip versus bag-of-words for text classification

要約

テキスト分類における圧縮 (「gzip」) の有効性は、最近大きな注目を集めています。
このノートでは、「バッグオブワード」アプローチが同様またはより良い結果を達成でき、より効率的であることを示します。

要約(オリジナル)

The effectiveness of compression in text classification (‘gzip’) has recently garnered lots of attention. In this note we show that `bag-of-words’ approaches can achieve similar or better results, and are more efficient.

arxiv情報

著者 Juri Opitz
発行日 2023-08-08 17:39:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク