Evaluation of Active Feature Acquisition Methods for Static Feature Settings

要約

アクティブ特徴取得 (AFA) エージェントは、特徴の取得にコストがかかる、または有害な場合が多いヘルスケアなどの分野で重要であり、後続の分類タスクに最適な特徴のセットを決定します。
AFA エージェントを導入すると欠落分布に変化が生じるため、遡及データを使用して導入時に期待されるパフォーマンスを評価することが重要です。
関連論文では、特徴が時間依存であると想定される能動的特徴獲得パフォーマンス評価 (AFAPE) のためのセミオフライン強化学習 (RL) フレームワークを紹介します。
ここでは、静的特徴設定をカバーするように AFAPE 問題を研究および拡張します。静的特徴設定では、特徴は時間不変であるため、AFA エージェントが取得順序を決定する際により柔軟になります。
この静的特徴設定では、セミオフライン RL フレームワーク内で、新しい逆確率重み付け (IPW)、直接法 (DM)、および二重強化学習 (DRL) 推定器を導出し、適応させます。
これらの推定量は、遡及データセットの欠損がランダム欠損 (MAR) パターンに従う場合に適用できます。
また、既存の適切な欠損データ技術と組み合わせて、欠損非ランダム (MNAR) パターンに適用することもできます。
合成 MAR および MNAR 欠損のもとでの合成および実世界のデータ実験において、半オフライン RL 推定器によってもたらされるデータ効率の向上を示します。

要約(オリジナル)

Active feature acquisition (AFA) agents, crucial in domains like healthcare where acquiring features is often costly or harmful, determine the optimal set of features for a subsequent classification task. As deploying an AFA agent introduces a shift in missingness distribution, it’s vital to assess its expected performance at deployment using retrospective data. In a companion paper, we introduce a semi-offline reinforcement learning (RL) framework for active feature acquisition performance evaluation (AFAPE) where features are assumed to be time-dependent. Here, we study and extend the AFAPE problem to cover static feature settings, where features are time-invariant, and hence provide more flexibility to the AFA agents in deciding the order of the acquisitions. In this static feature setting, we derive and adapt new inverse probability weighting (IPW), direct method (DM), and double reinforcement learning (DRL) estimators within the semi-offline RL framework. These estimators can be applied when the missingness in the retrospective dataset follows a missing-at-random (MAR) pattern. They also can be applied to missing-not-at-random (MNAR) patterns in conjunction with appropriate existing missing data techniques. We illustrate the improved data efficiency offered by the semi-offline RL estimators in synthetic and real-world data experiments under synthetic MAR and MNAR missingness.

arxiv情報

著者 Henrik von Kleist,Alireza Zamanian,Ilya Shpitser,Narges Ahmidi
発行日 2023-12-06 17:07:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク