Interpretable Transformation and Analysis of Timelines through Learning via Surprisability

要約

高次元のタイムラインデータの分析と外れ値と異常の識別は、センサーの測定値、生物学的および医療データ、歴史的記録、グローバル統計など、多様なドメイン全体で重要です。
ただし、従来の分析手法は、多くの場合、高次元、複雑な分布、スパース性などの課題と格闘しています。
これらの制限は、複雑な時間的データセットから意味のある洞察を抽出する能力を妨げ、トレンドの機能、外れ値、および異常を効果的に識別することを困難にします。
驚きに触発されました – 人間が予期せぬ逸脱に本能的に焦点を当てる方法を説明する認知科学の概念 – 私たちは、高次元のタイムラインデータを変換するための新しいアプローチである驚き(LVS)を介して学習を提案します。
LVSは、予想される動作からの逸脱を形式化することにより、時系列データの異常を定量化および優先順位を付けます。
LVSは、計算方法で注意の認知理論を橋渡しし、異常の検出を可能にし、重要なコンテキストを維持する方法でシフトし、複雑なデータセットを解釈するための新しいレンズを提供します。
3つの高次元のタイムラインユースケースでLVSの有用性を示します。センサーデータの時系列、数年にわたる死亡原因のグローバルデータセット、および米国大統領による2世紀以上の連合住所を含むテキストコーパスです。
我々の結果は、LVS変換により、タイムラインに沿った外れ値、異常、および最も可変性のある機能を効率的かつ解釈可能な識別が可能にすることを示しています。

要約(オリジナル)

The analysis of high-dimensional timeline data and the identification of outliers and anomalies is critical across diverse domains, including sensor readings, biological and medical data, historical records, and global statistics. However, conventional analysis techniques often struggle with challenges such as high dimensionality, complex distributions, and sparsity. These limitations hinder the ability to extract meaningful insights from complex temporal datasets, making it difficult to identify trending features, outliers, and anomalies effectively. Inspired by surprisability — a cognitive science concept describing how humans instinctively focus on unexpected deviations – we propose Learning via Surprisability (LvS), a novel approach for transforming high-dimensional timeline data. LvS quantifies and prioritizes anomalies in time-series data by formalizing deviations from expected behavior. LvS bridges cognitive theories of attention with computational methods, enabling the detection of anomalies and shifts in a way that preserves critical context, offering a new lens for interpreting complex datasets. We demonstrate the usefulness of LvS on three high-dimensional timeline use cases: a time series of sensor data, a global dataset of mortality causes over multiple years, and a textual corpus containing over two centuries of State of the Union Addresses by U.S. presidents. Our results show that the LvS transformation enables efficient and interpretable identification of outliers, anomalies, and the most variable features along the timeline.

arxiv情報

著者 Osnat Mokryn,Teddy Lazebnik,Hagit Ben Shoshan
発行日 2025-03-06 14:50:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IT, math.IT, stat.ME パーマリンク