要約
ストリーミング特徴選択技術は、継続的に更新される情報から最も関連性の高い属性の識別を容易にするため、リアルタイム データ ストリームの処理に不可欠になっています。
そのパフォーマンスにもかかわらず、ストリーミング機能を選択するための現在のアルゴリズムは、バイアスの管理や機密属性によって永続化する可能性のある差別の回避において不十分なことが多く、結果として得られるモデルで不公平な結果が生じる可能性があります。
この問題に対処するために、オンラインでデータを処理する能力を損なうことなく、機能選択プロセスの公平性を維持するために、Fair Streaming Feature Selection の新しいアルゴリズムである FairSFS を提案します。
FairSFS は、特徴セットを動的に調整することで受信特徴ベクトルに適応し、この改訂されたセットから分類属性と機密属性の間の相関関係を識別することで、機密データの伝播を防ぎます。
実証的評価によれば、FairSFS は主要なストリーミング機能選択方法や既存の公平機能技術と同等の精度を維持するだけでなく、公平性メトリックも大幅に向上します。
要約(オリジナル)
Streaming feature selection techniques have become essential in processing real-time data streams, as they facilitate the identification of the most relevant attributes from continuously updating information. Despite their performance, current algorithms to streaming feature selection frequently fall short in managing biases and avoiding discrimination that could be perpetuated by sensitive attributes, potentially leading to unfair outcomes in the resulting models. To address this issue, we propose FairSFS, a novel algorithm for Fair Streaming Feature Selection, to uphold fairness in the feature selection process without compromising the ability to handle data in an online manner. FairSFS adapts to incoming feature vectors by dynamically adjusting the feature set and discerns the correlations between classification attributes and sensitive attributes from this revised set, thereby forestalling the propagation of sensitive data. Empirical evaluations show that FairSFS not only maintains accuracy that is on par with leading streaming feature selection methods and existing fair feature techniques but also significantly improves fairness metrics.
arxiv情報
著者 | Zhangling Duan,Tianci Li,Xingyu Wu,Zhaolong Ling,Jingye Yang,Zhaohong Jia |
発行日 | 2024-06-20 15:22:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google