Towards proactive self-adaptive AI for non-stationary environments with dataset shifts

要約

生産に展開された人工知能(AI)モデルは、非定常環境でのパフォーマンスを維持する上で課題に頻繁に直面しています。
この問題は、時間のデータセットシフトがしばしば発生する医療環境で特に顕著です。
これらのシフトは、トレーニングデータの分布が、展開中に遭遇したデータの分布と時間の経過とともに発生すると発生します。
さらに、継続的に再訓練するための新しいラベル付きデータは、通常、データアクセス制限のためにタイムリーに使用できません。
これらの課題に対処するために、AIパラメーターの時間的軌跡をモデル化する積極的な自己適応AIアプローチ、または適応性の適応性を提案し、短期間の予測パラメーター値を可能にします。
この目的のために、拡張可能な機能データ分析フレームワーク内で、多項式スプラインベースを使用します。
前の確率シフト、共変量シフト、および概念シフトに対処するロジスティック回帰モデルで、方法論を検証します。
この検証は、制御されたシミュレートされたデータセットと、2020年から2024年の間にさまざまなシフトが発生する、メキシコからの公開されている現実世界のCovid-19データセットの両方で実施さ​​れます。我々の結果は、このアプローチが、最新のトレーニングデータを必要とせずに、現在からの異なる時間距離でトレーニングされたベースライン安定モデルと比較したベースライン安定モデルと比較したベースラインの安定したモデルと比較したベースラインの安定したモデルと比較したベースラインの安定したモデルと比較したベースラインの安定したモデルと比較したベースラインの安定したモデルと比較して、シフトに対するパフォーマンスを向上させます。
この作業は、健康のための回復力のあるAI生産環境において、データ保護と互換性がある動的で非定常環境に対する促進的なAI研究の基礎を築きます。

要約(オリジナル)

Artificial Intelligence (AI) models deployed in production frequently face challenges in maintaining their performance in non-stationary environments. This issue is particularly noticeable in medical settings, where temporal dataset shifts often occur. These shifts arise when the distributions of training data differ from those of the data encountered during deployment over time. Further, new labeled data to continuously retrain AI is not typically available in a timely manner due to data access limitations. To address these challenges, we propose a proactive self-adaptive AI approach, or pro-adaptive, where we model the temporal trajectory of AI parameters, allowing us to short-term forecast parameter values. To this end, we use polynomial spline bases, within an extensible Functional Data Analysis framework. We validate our methodology with a logistic regression model addressing prior probability shift, covariate shift, and concept shift. This validation is conducted on both a controlled simulated dataset and a publicly available real-world COVID-19 dataset from Mexico, with various shifts occurring between 2020 and 2024. Our results indicate that this approach enhances the performance of AI against shifts compared to baseline stable models trained at different time distances from the present, without requiring updated training data. This work lays the foundation for pro-adaptive AI research against dynamic, non-stationary environments, being compatible with data protection, in resilient AI production environments for health.

arxiv情報

著者 David Fernández Narro,Pablo Ferri,Juan M. García-Gómez,Carlos Sáez
発行日 2025-04-30 12:09:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.2.8 パーマリンク