ImputeGAP: A Comprehensive Library for Time Series Imputation

要約

センサーの障害の有病率により、不足している値を推定するプロセス – は、時系列のデータ準備の基礎として浮上しました。
これらのデータギャップに対処するために多数の代入アルゴリズムが開発されていますが、既存のライブラリは限られたサポートを提供します。
さらに、彼らはしばしば、時系列の欠落データの現実的なパターンをシミュレートする能力を欠いており、その後のダウンストリーム分析に対する帰属の影響を説明できません。
このペーパーでは、さまざまな特性を持つデータセットにケータリングする多様な範囲の帰属方法とモジュール式欠落データシミュレーションをサポートする時系列代入のための包括的なライブラリであるInputeGapを紹介します。
ライブラリには、自動化されたハイパーパラメーターのチューニング、ベンチマーク、説明、下流の評価、人気のある時系列フレームワークとの互換性などの広範なカスタマイズオプションが含まれています。

要約(オリジナル)

With the prevalence of sensor failures, imputation–the process of estimating missing values–has emerged as the cornerstone of time series data preparation. While numerous imputation algorithms have been developed to address these data gaps, existing libraries provide limited support. Furthermore, they often lack the ability to simulate realistic patterns of time series missing data and fail to account for the impact of imputation on subsequent downstream analysis. This paper introduces ImputeGAP, a comprehensive library for time series imputation that supports a diverse range of imputation methods and modular missing data simulation catering to datasets with varying characteristics. The library includes extensive customization options, such as automated hyperparameter tuning, benchmarking, explainability, downstream evaluation, and compatibility with popular time series frameworks.

arxiv情報

著者 Quentin Nater,Mourad Khayati,Jacques Pasquier
発行日 2025-03-19 14:24:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DB, cs.LG パーマリンク