要約
テキスト分類における圧縮 (「gzip」) の有効性は、最近大きな注目を集めています。
このノートでは、「バッグオブワード」アプローチが同様またはより良い結果を達成でき、より効率的であることを示します。
要約(オリジナル)
The effectiveness of compression in text classification (‘gzip’) has recently garnered lots of attention. In this note we show that `bag-of-words’ approaches can achieve similar or better results, and are more efficient.
arxiv情報
著者 | Juri Opitz |
発行日 | 2023-08-08 17:39:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google