要約
イベントまでの時間を予測するための重要なツールである生存分析は、ヘルスケア、刑事司法、金融など多くの領域で使用されている。分類タスクのように、生存分析は、しばしばデータやアルゴリズムに内在するバイアスのために、不利なグループに対するバイアスを示すことがある。ISとCSの両コミュニティにおけるいくつかの研究は、生存分析における公平性に対処することを試みてきた。しかし、既存の手法は、事前に定義された評価時点における予測の公平性の重要性を見落としていることが多く、これは、意思決定が特定の時間枠に依存することが多い実世界のアプリケーションにおいて極めて重要である。この重大な研究ギャップを解決するために、我々は新しい公平性の概念を導入する:生存分析におけるオッズの等化(EO)。生存分析におけるEOの公平性を達成するために、我々は条件付き相互情報に基づく新しい公平性正則化項と革新的な打ち切りデータ増強技術を特徴とする条件付き相互情報増強(CMIA)アプローチを提案する。我々のCMIAアプローチは、予測精度と公平性のバランスを効果的にとることができ、様々な生存モデルに適用可能である。我々は、3つの異なる応用領域において、CMIAアプローチを複数の最先端手法と比較評価し、その結果、CMIAは、良好な精度を維持しながら、一貫して予測格差を低減し、複数のデータセットと生存モデル(例えば、線形COX、ディープAFT)において、他の競合手法を有意に上回ることを実証する。
要約(オリジナル)
Survival analysis, a vital tool for predicting the time to event, has been used in many domains such as healthcare, criminal justice, and finance. Like classification tasks, survival analysis can exhibit bias against disadvantaged groups, often due to biases inherent in data or algorithms. Several studies in both the IS and CS communities have attempted to address fairness in survival analysis. However, existing methods often overlook the importance of prediction fairness at pre-defined evaluation time points, which is crucial in real-world applications where decision making often hinges on specific time frames. To address this critical research gap, we introduce a new fairness concept: equalized odds (EO) in survival analysis, which emphasizes prediction fairness at pre-defined time points. To achieve the EO fairness in survival analysis, we propose a Conditional Mutual Information Augmentation (CMIA) approach, which features a novel fairness regularization term based on conditional mutual information and an innovative censored data augmentation technique. Our CMIA approach can effectively balance prediction accuracy and fairness, and it is applicable to various survival models. We evaluate the CMIA approach against several state-of-the-art methods within three different application domains, and the results demonstrate that CMIA consistently reduces prediction disparity while maintaining good accuracy and significantly outperforms the other competing methods across multiple datasets and survival models (e.g., linear COX, deep AFT).
arxiv情報
著者 | Tianyang Xie,Yong Ge |
発行日 | 2025-02-04 18:40:38+00:00 |
arxivサイト | arxiv_id(pdf) |