Highly Efficient Direct Analytics on Semantic-aware Time Series Data Compression

要約

セマンティックコミュニケーションは、大規模なデータトラフィックと持続可能なデータコミュニケーションの課題に取り組むための有望なパラダイムとして浮上しています。
焦点をデータの忠実度から目標指向またはタスク指向のセマンティック伝送にシフトします。
深い学習ベースの方法は、一般的にセマンティックエンコードとデコードに使用されますが、特にリソースに制約のあるIoT環境で、時系列データの連続的な性質と高い計算コストと格闘しています。
データ圧縮は、送信コストとストレージコストを削減する上で重要な役割を果たしますが、従来のデータ圧縮方法は、目標指向の通信システムの要求に達していません。
この論文では、シュリンク圧縮アルゴリズムによって圧縮された時系列データの直接分析の新しい方法を提案します。
ケーススタディとしてOutlier検出を使用した実験を通じて、私たちの方法は、複数のケースで非圧縮データで実行されているベースラインよりも優れていることを示しています。
さらに、平均してランタイムが4倍低く、データボリュームの約10%にアクセスできるため、ストレージと計算能力が制限されているエッジ分析が可能になります。
これらの結果は、私たちのアプローチが、時間シリーズデータからセマンティクスを抽出し、高圧縮を達成し、データ送信を削減しながら、多様なIoTアプリケーションのための信頼性の高い高速外れの検出分析を提供することを示しています。

要約(オリジナル)

Semantic communication has emerged as a promising paradigm to tackle the challenges of massive growing data traffic and sustainable data communication. It shifts the focus from data fidelity to goal-oriented or task-oriented semantic transmission. While deep learning-based methods are commonly used for semantic encoding and decoding, they struggle with the sequential nature of time series data and high computation cost, particularly in resource-constrained IoT environments. Data compression plays a crucial role in reducing transmission and storage costs, yet traditional data compression methods fall short of the demands of goal-oriented communication systems. In this paper, we propose a novel method for direct analytics on time series data compressed by the SHRINK compression algorithm. Through experimentation using outlier detection as a case study, we show that our method outperforms baselines running on uncompressed data in multiple cases, with merely 1% difference in the worst case. Additionally, it achieves four times lower runtime on average and accesses approximately 10% of the data volume, which enables edge analytics with limited storage and computation power. These results demonstrate that our approach offers reliable, high-speed outlier detection analytics for diverse IoT applications while extracting semantics from time-series data, achieving high compression, and reducing data transmission.

arxiv情報

著者 Guoyou Sun,Panagiotis Karras,Qi Zhang
発行日 2025-03-17 14:58:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク