Handling Uncertainty in Health Data using Generative Algorithms

要約

不確実性の理解と管理は、特にクラスの不均衡が予測に影響を与える可能性のあるヘルスケアのようなハイステークスドメインでは、機械学習において重要です。
このペーパーでは、生成AIを使用してクラスの不均衡を緩和する新しいパイプラインであるRigaを紹介します。
表形式のヘルスケアデータを画像に変換することにより、RigaはCGAN、VQVAE、VQGANなどのモデルを活用してバランスの取れたサンプルを生成し、分類パフォーマンスを向上させます。
これらの表現はCNNによって処理され、後にシームレスな統合のために表形式に戻ります。
このアプローチは、Xgboostなどの従来の分類器を強化し、ベイジアン構造学習を改善し、過小評価されたクラスの現実的な合成データを生成することにより、MLモデルの堅牢性を強化します。

要約(オリジナル)

Understanding and managing uncertainty is crucial in machine learning, especially in high-stakes domains like healthcare, where class imbalance can impact predictions. This paper introduces RIGA, a novel pipeline that mitigates class imbalance using generative AI. By converting tabular healthcare data into images, RIGA leverages models like cGAN, VQVAE, and VQGAN to generate balanced samples, improving classification performance. These representations are processed by CNNs and later transformed back into tabular format for seamless integration. This approach enhances traditional classifiers like XGBoost, improves Bayesian structure learning, and strengthens ML model robustness by generating realistic synthetic data for underrepresented classes.

arxiv情報

著者 Mahdi Arab Loodaricheh,Neh Majmudar,Anita Raja,Ansaf Salleb-Aouissi
発行日 2025-03-05 18:04:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク