Uncertainty-Aware Surrogate-based Amortized Bayesian Inference for Computationally Expensive Models

要約

ベイジアン推論は通常、後部分布を推定するために多数のモデル評価に依存しています。
マルコフチェーンモンテカルロ(MCMC)や償却ベイジアン推論(ABI)などの確立された方法は、計算上困難になる可能性があります。
ABIはトレーニング後に高速な推論を可能にしますが、十分なトレーニングデータを生成するには、高価なモデルでは不可能な数千のモデルシミュレーションが必要です。
代理モデルは、より低い計算コストで近似シミュレーションを提供し、トレーニング用の大規模なデータセットの生成を可能にすることにより、ソリューションを提供します。
ただし、導入された近似誤差と不確実性は、自信過剰の事後推定につながる可能性があります。
これに対処するために、不確実性を認識した代理ベースの償却ベイズ推論(UA-Sabi)を提案します。これは、代理モデリングとABIを組み合わせたフレームワークでありながら、推論パイプラインを介したサロゲートの不確実性を明示的に定量化および推進します。
私たちの実験は、このアプローチが、厳しい時間の制約の下であっても、計算上の高価なモデルに対する信頼性が高く、高速で繰り返されるベイジアン推論を可能にすることを示しています。

要約(オリジナル)

Bayesian inference typically relies on a large number of model evaluations to estimate posterior distributions. Established methods like Markov Chain Monte Carlo (MCMC) and Amortized Bayesian Inference (ABI) can become computationally challenging. While ABI enables fast inference after training, generating sufficient training data still requires thousands of model simulations, which is infeasible for expensive models. Surrogate models offer a solution by providing approximate simulations at a lower computational cost, allowing the generation of large data sets for training. However, the introduced approximation errors and uncertainties can lead to overconfident posterior estimates. To address this, we propose Uncertainty-Aware Surrogate-based Amortized Bayesian Inference (UA-SABI) – a framework that combines surrogate modeling and ABI while explicitly quantifying and propagating surrogate uncertainties through the inference pipeline. Our experiments show that this approach enables reliable, fast, and repeated Bayesian inference for computationally expensive models, even under tight time constraints.

arxiv情報

著者 Stefania Scheurer,Philipp Reiser,Tim Brünnette,Wolfgang Nowak,Anneli Guthke,Paul-Christian Bürkner
発行日 2025-05-13 15:44:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML | Uncertainty-Aware Surrogate-based Amortized Bayesian Inference for Computationally Expensive Models はコメントを受け付けていません

From S4 to Mamba: A Comprehensive Survey on Structured State Space Models

要約

シーケンスモデリングの最近の進歩により、再発性ニューラルネットワーク(RNN)およびトランスの効率的な代替品として、構造化状態空間モデル(SSM)が出現し、長距離依存モデリングと計算効率の課題に対処しています。
RNNは消失した勾配と連続的な非効率性に苦しんでおり、トランスは二次の複雑さに直面していますが、SSMSは構造化された再発と状態空間表現を活用して、線形またはほぼ線形の複雑さで優れた長シーケンス処理を実現します。
この調査では、SSMSの包括的なレビューを提供し、基礎S4モデルからMamba、簡素化された構造化状態空間シーケンスモデル(S5)、Jambaなどの後継者への進化を追跡し、計算効率、メモリ最適化、推論速度の改善を強調します。
SSMは、自然言語処理(NLP)、音声認識、ビジョン、時系列予測などのドメイン全体の従来のシーケンスモデルを比較することにより、計算オーバーヘッドを減らしながら長距離依存関係を処理する際の利点を示します。
その可能性にもかかわらず、トレーニングの最適化、ハイブリッドモデリング、解釈可能性などの分野には課題が残っています。
この調査は、研究者と実践者のための構造化されたガイドとして機能し、AIにおけるSSMベースのアーキテクチャの進歩、トレードオフ、および将来の方向性を詳述し、深い学習を行います。

要約(オリジナル)

Recent advancements in sequence modeling have led to the emergence of Structured State Space Models (SSMs) as an efficient alternative to Recurrent Neural Networks (RNNs) and Transformers, addressing challenges in long-range dependency modeling and computational efficiency. While RNNs suffer from vanishing gradients and sequential inefficiencies, and Transformers face quadratic complexity, SSMs leverage structured recurrence and state-space representations to achieve superior long-sequence processing with linear or near-linear complexity. This survey provides a comprehensive review of SSMs, tracing their evolution from the foundational S4 model to its successors like Mamba, Simplified Structured State Space Sequence Model (S5), and Jamba, highlighting their improvements in computational efficiency, memory optimization, and inference speed. By comparing SSMs with traditional sequence models across domains such as natural language processing (NLP), speech recognition, vision, and time-series forecasting, we demonstrate their advantages in handling long-range dependencies while reducing computational overhead. Despite their potential, challenges remain in areas such as training optimization, hybrid modeling, and interpretability. This survey serves as a structured guide for researchers and practitioners, detailing the advancements, trade-offs, and future directions of SSM-based architectures in AI and deep learning.

arxiv情報

著者 Shriyank Somvanshi,Md Monzurul Islam,Mahmuda Sultana Mimi,Sazzad Bin Bashar Polock,Gaurab Chhetri,Subasish Das
発行日 2025-05-13 15:46:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | From S4 to Mamba: A Comprehensive Survey on Structured State Space Models はコメントを受け付けていません

Continuous Temporal Learning of Probability Distributions via Neural ODEs with Applications in Continuous Glucose Monitoring Data

要約

時間からの確率分布の連続時間のダイナミクスをモデル化 – 依存データサンプルは、デジタルヘルスを含む多くの分野で根本的な問題です。
目的は、グルコースなどのバイオマーカーの分布が時間とともに進化する方法と、糖尿病などの慢性疾患の進行をどのように反映するかを分析することです。
この論文では、ガウス分布の混合に基づいた新しい確率モデルを提案して、連続時間の確率プロセスからのサンプルが時間にわたってどのように進化するかをキャプチャします。
潜在的な分布シフトを時間の経過とともにモデル化するために、神経の通常の微分方程式(神経ODE)によってパラメーター化された時間依存関数を導入し、最大平均不一致(MMD)を使用してパラメトリックに非パラメトリックに推定します。
提案されたモデルは非常に解釈可能であり、微妙な時間的シフトを検出し、計算上効率の良いままです。
シミュレーション研究を通じて、正規化された勾配 – フローや非パラメテリックカーネル密度推定器など、最先端の、解釈可能性の低い方法に対する推定精度の観点から競争力があることを示します。
最後に、介入がグルコースレベルの時間依存的分布をどのように変化させるかを示し、新しい数学的および臨床的観点からのコントロールと治療グループの厳密な比較を可能にする介入がどのように介入を変えるかを示します。

要約(オリジナル)

Modeling the continuous–time dynamics of probability distributions from time–dependent data samples is a fundamental problem in many fields, including digital health. The aim is to analyze how the distribution of a biomarker, such as glucose, evolves over time and how these changes may reflect the progression of chronic diseases such as diabetes. In this paper, we propose a novel probabilistic model based on a mixture of Gaussian distributions to capture how samples from a continuous-time stochastic process evolve over the time. To model potential distribution shifts over time, we introduce a time-dependent function parameterized by a Neural Ordinary Differential Equation (Neural ODE) and estimate it non–parametrically using the Maximum Mean Discrepancy (MMD). The proposed model is highly interpretable, detects subtle temporal shifts, and remains computationally efficient. Through simulation studies, we show that it performs competitively in terms of estimation accuracy against state-of-the-art, less interpretable methods such as normalized gradient–flows and non–parameteric kernel density estimators. Finally, we demonstrate the utility of our method on digital clinical–trial data, showing how the interventions alters the time-dependent distribution of glucose levels and enabling a rigorous comparison of control and treatment groups from novel mathematical and clinical perspectives.

arxiv情報

著者 Antonio Álvarez-López,Marcos Matabuena
発行日 2025-05-13 15:57:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.DS, stat.AP, stat.ME, stat.ML | Continuous Temporal Learning of Probability Distributions via Neural ODEs with Applications in Continuous Glucose Monitoring Data はコメントを受け付けていません

Contrastive Normalizing Flows for Uncertainty-Aware Parameter Estimation

要約

データから物理的パラメーターを推定することは、物理科学における機械学習(ML)の重要なアプリケーションです。
ただし、検出器の誤りなどの系統的な不確実性は、統計的精度を侵食する可能性のあるデータ分布の歪みを誘導します。
高エネルギー物理学(HEP)とより広範なMLコンテキストの両方で、これらのドメインシフトの下で不確実性を認めるパラメーター推定を達成することは、未解決の問題のままです。
この作業では、HEPにとって重要な幅広いタスクセットの不確実性パラメーター推定のこの課題に対処します。
HiggsML不確実なチャレンジデータセットで最高のパフォーマンスを達成するコントラストの正規化フロー(CNFS)に基づいた新しいアプローチを導入します。
バイナリ分類器がモデルパラメーター尤度比を概算できるという洞察に基づいて、学習CNFマッピングにデータとパラメーターを埋め込むことにより、表現力の実際の制限と高次元パラメーターグリッドをシミュレートする高コストに対処します。
このマッピングは、シフトしたデータ分布の下で堅牢な分類を可能にする調整可能なコントラスト分布を生成します。
理論分析と経験的評価の組み合わせを通じて、CNFは、分類器と確立された頻繁な技術と組み合わされた場合、データ分布の歪みに堅牢な分類を通じて原則的なパラメーターの推定と不確実性の定量化を提供することを実証します。

要約(オリジナル)

Estimating physical parameters from data is a crucial application of machine learning (ML) in the physical sciences. However, systematic uncertainties, such as detector miscalibration, induce data distribution distortions that can erode statistical precision. In both high-energy physics (HEP) and broader ML contexts, achieving uncertainty-aware parameter estimation under these domain shifts remains an open problem. In this work, we address this challenge of uncertainty-aware parameter estimation for a broad set of tasks critical for HEP. We introduce a novel approach based on Contrastive Normalizing Flows (CNFs), which achieves top performance on the HiggsML Uncertainty Challenge dataset. Building on the insight that a binary classifier can approximate the model parameter likelihood ratio, we address the practical limitations of expressivity and the high cost of simulating high-dimensional parameter grids by embedding data and parameters in a learned CNF mapping. This mapping yields a tunable contrastive distribution that enables robust classification under shifted data distributions. Through a combination of theoretical analysis and empirical evaluations, we demonstrate that CNFs, when coupled with a classifier and established frequentist techniques, provide principled parameter estimation and uncertainty quantification through classification that is robust to data distribution distortions.

arxiv情報

著者 Ibrahim Elsharkawy,Yonatan Kahn
発行日 2025-05-13 16:14:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, hep-ph, physics.data-an | Contrastive Normalizing Flows for Uncertainty-Aware Parameter Estimation はコメントを受け付けていません

Wilsonian Renormalization of Neural Network Gaussian Processes

要約

関連する情報と無関係な情報を分離することは、モデリングプロセスまたは科学的調査の鍵です。
理論物理学は、繰り込みグループ(RG)の形でこれを達成するための強力なツールを提供します。
ここでは、ガウスプロセス(GP)回帰のコンテキストでウィルソニアンRGを実行するための実用的なアプローチを示します。
GPカーネルの未解決のモードを体系的に統合し、それにより、データがIRスケールを設定するGPのRGフローを取得します。
単純な場合、これにより、尾根パラメーターの普遍的な流れが生じます。これは、非ガウスが含まれているより豊富なシナリオで入力依存になります。
分析的に扱いやすいことに加えて、このアプローチは、RGフローと学習可能なモードと学習可能なモードとの間の自然な接続を提供することにより、RGとニューラルネットワークの構造的類似性を超えています。
このようなフローを研究することで、深いニューラルネットワークでの機能学習の理解が向上し、これらのモデルの潜在的な普遍性クラスを特定できるようになります。

要約(オリジナル)

Separating relevant and irrelevant information is key to any modeling process or scientific inquiry. Theoretical physics offers a powerful tool for achieving this in the form of the renormalization group (RG). Here we demonstrate a practical approach to performing Wilsonian RG in the context of Gaussian Process (GP) Regression. We systematically integrate out the unlearnable modes of the GP kernel, thereby obtaining an RG flow of the GP in which the data sets the IR scale. In simple cases, this results in a universal flow of the ridge parameter, which becomes input-dependent in the richer scenario in which non-Gaussianities are included. In addition to being analytically tractable, this approach goes beyond structural analogies between RG and neural networks by providing a natural connection between RG flow and learnable vs. unlearnable modes. Studying such flows may improve our understanding of feature learning in deep neural networks, and enable us to identify potential universality classes in these models.

arxiv情報

著者 Jessica N. Howard,Ro Jefferson,Anindita Maiti,Zohar Ringel
発行日 2025-05-13 16:20:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.dis-nn, cs.LG, hep-th, stat.ML | Wilsonian Renormalization of Neural Network Gaussian Processes はコメントを受け付けていません

Early-Cycle Internal Impedance Enables ML-Based Battery Cycle Life Predictions Across Manufacturers

要約

さまざまなメーカーにわたるリチウムイオン電池の終末期(EOL)を予測することは、電極材料のばらつき、製造プロセス、細胞形式、および一般的に利用可能なデータの不足により、重大な課題を提示します。
電圧容量のプロファイルデータのみに特徴を構築する方法は、通常、細胞化学全体で一般化できません。
この研究では、従来の電圧容量機能と直接的な現在の内部抵抗(DCIR)測定を組み合わせた方法論を紹介し、より正確で一般化可能なEOL予測を可能にします。
早期サイクルDCIRデータの使用は、内部抵抗の成長に関連する重要な分解メカニズムをキャプチャし、モデルの堅牢性を高めます。
モデルは、150サイクルの平均絶対誤差(MAE)で、さまざまな電極組成の目に見えないメーカーのEOLへのサイクル数を正常に予測することが示されています。
このクロスメーカーの一般化可能性により、広範な新しいデータ収集と再訓練の必要性が低下し、メーカーが既存のデータセットを使用して新しいバッテリー設計を最適化できるようになります。
さらに、サイクリングデータの成長するエコシステムを豊かにし、バッテリー材料の開発を加速するための継続的な取り組みの一環として、新しいDCIR互換データセットがリリースされます。

要約(オリジナル)

Predicting the end-of-life (EOL) of lithium-ion batteries across different manufacturers presents significant challenges due to variations in electrode materials, manufacturing processes, cell formats, and a lack of generally available data. Methods that construct features solely on voltage-capacity profile data typically fail to generalize across cell chemistries. This study introduces a methodology that combines traditional voltage-capacity features with Direct Current Internal Resistance (DCIR) measurements, enabling more accurate and generalizable EOL predictions. The use of early-cycle DCIR data captures critical degradation mechanisms related to internal resistance growth, enhancing model robustness. Models are shown to successfully predict the number of cycles to EOL for unseen manufacturers of varied electrode composition with a mean absolute error (MAE) of 150 cycles. This cross-manufacturer generalizability reduces the need for extensive new data collection and retraining, enabling manufacturers to optimize new battery designs using existing datasets. Additionally, a novel DCIR-compatible dataset is released as part of ongoing efforts to enrich the growing ecosystem of cycling data and accelerate battery materials development.

arxiv情報

著者 Tyler Sours,Shivang Agarwal,Marc Cormier,Jordan Crivelli-Decker,Steffen Ridderbusch,Stephen L. Glazier,Connor P. Aiken,Aayush R. Singh,Ang Xiao,Omar Allam
発行日 2025-05-13 16:25:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.LG | Early-Cycle Internal Impedance Enables ML-Based Battery Cycle Life Predictions Across Manufacturers はコメントを受け付けていません

Preference Optimization for Combinatorial Optimization Problems

要約

強化学習(RL)は、神経組み合わせの最適化の強力なツールとして浮上しており、モデルが専門知識を必要とせずに複雑な問題を解決するヒューリスティックを学習できるようにしています。
大きな進歩にもかかわらず、既存のRLアプローチは、報酬信号の減少や広大な組み合わせのアクション空間での非効率的な探査などの課題に直面し、非効率性につながります。
このホワイトペーパーでは、統計的比較モデリングを介して定量的好みのシグナルを定性的優先信号に変換し、サンプリングされたソリューション間の優位性を強調する優先順位の最適化を提案します。
方法論的には、ポリシーの観点から報酬関数を修復し、優先モデルを利用することにより、扱いにくい計算を避けながら、ポリシーを好みに直接合わせたエントロピー正規化RL目的を策定します。
さらに、地元の検索手法を後処理ではなく微調整に統合して高品質の優先ペアを生成し、ポリシーがローカルオプティマを逃れるのに役立ちます。
巡回セールスマンの問題(TSP)、コンパシテート車両ルーティング問題(CVRP)、柔軟なフローショップの問題(FFSP)などのさまざまなベンチマークの経験的結果は、我々の方法が既存のRLアルゴリズムを大幅に上回り、優れた収束効率とソリューションの品質を達成することを示しています。

要約(オリジナル)

Reinforcement Learning (RL) has emerged as a powerful tool for neural combinatorial optimization, enabling models to learn heuristics that solve complex problems without requiring expert knowledge. Despite significant progress, existing RL approaches face challenges such as diminishing reward signals and inefficient exploration in vast combinatorial action spaces, leading to inefficiency. In this paper, we propose Preference Optimization, a novel method that transforms quantitative reward signals into qualitative preference signals via statistical comparison modeling, emphasizing the superiority among sampled solutions. Methodologically, by reparameterizing the reward function in terms of policy and utilizing preference models, we formulate an entropy-regularized RL objective that aligns the policy directly with preferences while avoiding intractable computations. Furthermore, we integrate local search techniques into the fine-tuning rather than post-processing to generate high-quality preference pairs, helping the policy escape local optima. Empirical results on various benchmarks, such as the Traveling Salesman Problem (TSP), the Capacitated Vehicle Routing Problem (CVRP) and the Flexible Flow Shop Problem (FFSP), demonstrate that our method significantly outperforms existing RL algorithms, achieving superior convergence efficiency and solution quality.

arxiv情報

著者 Mingjun Pan,Guanquan Lin,You-Wei Luo,Bin Zhu,Zhien Dai,Lijun Sun,Chun Yuan
発行日 2025-05-13 16:47:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Preference Optimization for Combinatorial Optimization Problems はコメントを受け付けていません

Towards Foundation Models for Experimental Readout Systems Combining Discrete and Continuous Data

要約

将来の電子イオンコリダーでチェレンコフ検出器のイメージングからの低レベルの検出器入力を操作できる核物理学のための(プロト)基礎モデルを提示します。
既存の次のトークン予測の制限に対処するために、つまりVQ-VAEトークン化からの解像度損失と条件付き生成の欠如は、3つの重要なイノベーションを提案します。
共同語彙の膨張なしの高解像度の連続バリエートトークン化。
私たちのモデルは、高性能DIRCの閉鎖テストを通じて検証された、チェレンコフ光子のピクセルと時間シーケンスの高速で高忠実度の生成を可能にします。
また、モデルがパイオンやカオンの識別などの再構築タスクに一般化され、微調整を活用する能力を示しています。

要約(オリジナル)

We present a (proto) Foundation Model for Nuclear Physics, capable of operating on low-level detector inputs from Imaging Cherenkov Detectors at the future Electron Ion Collider. To address limitations in existing next-token prediction approaches-namely resolution loss from VQ-VAE tokenization and lack of conditional generation-we propose three key innovations: (i) separate vocabularies for discrete spatial features and continuous variates, combined via Causal Multi-Head Cross-Attention (CMHCA), (ii) continuous kinematic conditioning through prepended context embeddings, and (iii) scalable and simple, high-resolution continuous variate tokenization without joint vocabulary inflation. Our model enables fast, high-fidelity generation of pixel and time sequences for Cherenkov photons, validated through closure tests in the High Performance DIRC. We also show our model generalizes to reconstruction tasks such as pion and kaon identification, in which we show its ability to leverage fine-tuning.

arxiv情報

著者 James Giroux,Cristiano Fanelli
発行日 2025-05-13 16:49:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, hep-ex, nucl-ex, physics.ins-det | Towards Foundation Models for Experimental Readout Systems Combining Discrete and Continuous Data はコメントを受け付けていません

Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations

要約

du/dt = f(u、x、t、p)の形式のパラメトリック微分方程式は、科学と工学の基本です。
フーリエ神経演算子(FNO)などのディープラーニングフレームワークは、効率的にソリューションを近似することができますが、逆問題、感度推定(DU/DP)、および概念ドリフトに苦労しています。
感度に制約のあるフーリエ神経演算子(SC-FNO)と呼ばれる感度ベースの正規化戦略を導入することにより、これらの制限に対処します。
SC-FNOは、ソリューションパスの予測において高い精度を達成し、物理学に基づいた正則化により標準のFNOおよびFNOを常に上回ります。
パラメーターの反転タスクのパフォーマンスを改善し、スケールを高次元パラメータースペース(最大82のパラメーターでテスト)にスケールし、データとトレーニング要件の両方を削減します。
これらの利益は、トレーニング時間のわずかな増加(エポックあたり30%から130%)で達成され、さまざまなタイプの微分方程式と神経演算子にわたって一般化されます。
コードと選択した実験は、https://github.com/ambehroozi/sc_neural_operatorsで入手できます

要約(オリジナル)

Parametric differential equations of the form du/dt = f(u, x, t, p) are fundamental in science and engineering. While deep learning frameworks such as the Fourier Neural Operator (FNO) can efficiently approximate solutions, they struggle with inverse problems, sensitivity estimation (du/dp), and concept drift. We address these limitations by introducing a sensitivity-based regularization strategy, called Sensitivity-Constrained Fourier Neural Operators (SC-FNO). SC-FNO achieves high accuracy in predicting solution paths and consistently outperforms standard FNO and FNO with physics-informed regularization. It improves performance in parameter inversion tasks, scales to high-dimensional parameter spaces (tested with up to 82 parameters), and reduces both data and training requirements. These gains are achieved with a modest increase in training time (30% to 130% per epoch) and generalize across various types of differential equations and neural operators. Code and selected experiments are available at: https://github.com/AMBehroozi/SC_Neural_Operators

arxiv情報

著者 Abdolmehdi Behroozi,Chaopeng Shen and,Daniel Kifer
発行日 2025-05-13 16:54:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG | Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations はコメントを受け付けていません

Implet: A Post-hoc Subsequence Explainer for Time Series Models

要約

時系列モデルの説明可能性は、信頼を促進し、デバッグを促進し、実際のアプリケーションで解釈可能性を確保するために重要です。
この作業では、時系列モデルの正確かつ簡潔なサブシーケンスレベルの説明を生成する新しい事後説明者であるインパレットを紹介します。
私たちのアプローチは、モデルの予測に大きく貢献する重要な時間的セグメントを特定し、従来の特徴と分布の方法を超えた解釈可能性を高めることを提供します。
それに基づいて、説明の簡潔さと解釈性をさらに向上させるために設計されたコホートベースの(グループレベル)説明フレームワークを提案します。
いくつかの標準的な時系列分類ベンチマークのンプを評価し、解釈可能性を改善する上でその有効性を示しています。
このコードはhttps://github.com/lbzsteven/impletで入手できます

要約(オリジナル)

Explainability in time series models is crucial for fostering trust, facilitating debugging, and ensuring interpretability in real-world applications. In this work, we introduce Implet, a novel post-hoc explainer that generates accurate and concise subsequence-level explanations for time series models. Our approach identifies critical temporal segments that significantly contribute to the model’s predictions, providing enhanced interpretability beyond traditional feature-attribution methods. Based on it, we propose a cohort-based (group-level) explanation framework designed to further improve the conciseness and interpretability of our explanations. We evaluate Implet on several standard time-series classification benchmarks, demonstrating its effectiveness in improving interpretability. The code is available at https://github.com/LbzSteven/implet

arxiv情報

著者 Fanyu Meng,Ziwen Kan,Shahbaz Rezaei,Zhaodan Kong,Xin Chen,Xin Liu
発行日 2025-05-13 17:01:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG | Implet: A Post-hoc Subsequence Explainer for Time Series Models はコメントを受け付けていません