Entropy Coding of Unordered Data Structures

要約

ビットバック コーディングを使用して、順序付けされていないオブジェクトのシーケンスを最適に圧縮するための一般的な方法であるシャッフル コーディングを紹介します。
シャッフル コーディングを使用して圧縮できるデータ構造には、マルチセット、グラフ、ハイパーグラフなどが含まれます。
私たちは、さまざまなデータ型や統計モデルに簡単に適応できる実装をリリースし、その実装が分子データを含むさまざまなグラフ データセットで最先端の圧縮率を達成することを実証します。

要約(オリジナル)

We present shuffle coding, a general method for optimal compression of sequences of unordered objects using bits-back coding. Data structures that can be compressed using shuffle coding include multisets, graphs, hypergraphs, and others. We release an implementation that can easily be adapted to different data types and statistical models, and demonstrate that our implementation achieves state-of-the-art compression rates on a range of graph datasets including molecular data.

arxiv情報

著者 Julius Kunze,Daniel Severo,Giulio Zani,Jan-Willem van de Meent,James Townsend
発行日 2024-08-16 16:41:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.IT, cs.LG, math.IT パーマリンク