要約
このペーパーでは、生成人工知能(GenAI)システムのデータ準備におけるグラフニューラルネットワーク(GNNS)の重要な役割を検証し、特にバイアスのアドレス指定と緩和に焦点を当てています。
バイアス緩和のための3つの異なる方法の比較分析を提示します:データスパース化、特徴の変更、および合成データ増強。
ドイツの信用データセットを使用した実験分析を通じて、統計的パリティ、機会の平等、誤った肯定レートなど、複数の公平性メトリックを使用してこれらのアプローチを評価します。
私たちの研究は、すべての方法が元のデータセットと比較して公平性メトリックを改善する一方で、グラフセージを使用した層別サンプリングと合成データ増強は、モデルのパフォーマンスを維持しながら人口統計表現のバランスをとるのに特に効果的であることが証明されることを示しています。
この結果は、モデルのパフォーマンスを維持しながら、より公平なAIシステムを開発するための実用的な洞察を提供します。
要約(オリジナル)
This paper examines the critical role of Graph Neural Networks (GNNs) in data preparation for generative artificial intelligence (GenAI) systems, with a particular focus on addressing and mitigating biases. We present a comparative analysis of three distinct methods for bias mitigation: data sparsification, feature modification, and synthetic data augmentation. Through experimental analysis using the german credit dataset, we evaluate these approaches using multiple fairness metrics, including statistical parity, equality of opportunity, and false positive rates. Our research demonstrates that while all methods improve fairness metrics compared to the original dataset, stratified sampling and synthetic data augmentation using GraphSAGE prove particularly effective in balancing demographic representation while maintaining model performance. The results provide practical insights for developing more equitable AI systems while maintaining model performance.
arxiv情報
著者 | Barbara Hoffmann,Ruben Mayer |
発行日 | 2025-03-28 16:18:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google