Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks

要約

医療アプリケーション向けの AI ツールの責任ある設計を確保するためのさまざまな側面の中でも、公平性への懸念への対処が重要な焦点となっています。
特に、電子医療記録 (EHR) データが広範囲に普及しており、そのデータが幅広い臨床意思決定支援タスクに情報を提供する大きな可能性を考慮すると、このカテゴリーの医療 AI ツールにおける公平性を向上させることが非常に重要です。
このような広範な問題 (つまり、EHR ベースの AI モデルにおける公平性の緩和) はさまざまな方法を使用して取り組まれてきましたが、タスクやモデルに依存しない方法は著しくまれです。
この研究では、実際の EHR データと一致する (忠実な) だけでなく、公平性に関する懸念 (エンドユーザーによって定義される) を軽減できる合成 EHR データを生成する新しいパイプラインを提示することで、このギャップをターゲットにすることを目的としました。
実際のデータと組み合わせると、下流のタスクで使用されます。
さまざまな下流タスクと 2 つの異なる EHR データセットにわたって、提案したパイプラインの有効性を実証します。
私たちが提案するパイプラインは、下流モデルの設計を変更するものなど、健康 AI アプリケーションの公平性に対処するための既存の方法のツールボックスに、広く適用可能な補完的なツールを追加できます。
私たちのプロジェクトのコードベースは https://github.com/healthylaife/FairSynth で入手できます。

要約(オリジナル)

Among various aspects of ensuring the responsible design of AI tools for healthcare applications, addressing fairness concerns has been a key focus area. Specifically, given the wide spread of electronic health record (EHR) data and their huge potential to inform a wide range of clinical decision support tasks, improving fairness in this category of health AI tools is of key importance. While such a broad problem (that is, mitigating fairness in EHR-based AI models) has been tackled using various methods, task- and model-agnostic methods are noticeably rare. In this study, we aimed to target this gap by presenting a new pipeline that generates synthetic EHR data, which is not only consistent with (faithful to) the real EHR data but also can reduce the fairness concerns (defined by the end-user) in the downstream tasks, when combined with the real data. We demonstrate the effectiveness of our proposed pipeline across various downstream tasks and two different EHR datasets. Our proposed pipeline can add a widely applicable and complementary tool to the existing toolbox of methods to address fairness in health AI applications such as those modifying the design of a downstream model. The codebase for our project is available at https://github.com/healthylaife/FairSynth

arxiv情報

著者 Mirza Farhan Bin Tarek,Raphael Poulain,Rahmatollah Beheshti
発行日 2024-06-04 17:29:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク