TimeInf: Time Series Data Contribution via Influence Functions

要約

モデルの予測に対する個々のデータ ポイントの寄与を評価することは、モデルの予測を解釈し、モデルのパフォーマンスを向上させるために重要です。
既存のデータ提供方法は、表形式データ、画像、テキストなどのさまざまなデータ タイプに適用されてきました。
ただし、彼らの主な焦点は i.i.d. です。
設定。
時系列データセットに合わせた原則に基づいたアプローチが緊急に必要とされているにもかかわらず、そのような設定におけるデータの寄与を推定する問題は、おそらく固有の時間依存関係の処理に関連する課題のため、未解明のままです。
本稿では、時系列データセットのデータ寄与推定手法である TimeInf を紹介します。
TimeInf は、影響関数を使用して、時間構造を維持しながら、モデル予測を個々の時点に帰属させます。
私たちの広範な実証結果は、TimeInf が有害な異常と予測に役立つ時点の特定において最先端の方法よりも優れていることを示しています。
さらに、TimeInf は直感的で解釈可能なデータ値の属性を提供するため、視覚化を通じてさまざまな異常パターンを簡単に区別できるようになります。

要約(オリジナル)

Evaluating the contribution of individual data points to a model’s prediction is critical for interpreting model predictions and improving model performance. Existing data contribution methods have been applied to various data types, including tabular data, images, and texts; however, their primary focus has been on i.i.d. settings. Despite the pressing need for principled approaches tailored to time series datasets, the problem of estimating data contribution in such settings remains unexplored, possibly due to challenges associated with handling inherent temporal dependencies. This paper introduces TimeInf, a data contribution estimation method for time-series datasets. TimeInf uses influence functions to attribute model predictions to individual time points while preserving temporal structures. Our extensive empirical results demonstrate that TimeInf outperforms state-of-the-art methods in identifying harmful anomalies and helpful time points for forecasting. Additionally, TimeInf offers intuitive and interpretable attributions of data values, allowing us to easily distinguish diverse anomaly patterns through visualizations.

arxiv情報

著者 Yizi Zhang,Jingyan Shen,Xiaoxue Xiong,Yongchan Kwon
発行日 2024-07-23 16:16:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク