要約
ストリーミング サブモジュール最大化は、大規模なデータセットから代表的なサブセットを選択するタスクの自然なモデルです。
データポイントに性別や人種などの機密属性がある場合、偏見や差別を避けるために公平性を徹底することが重要になります。
これにより、公平な機械学習アルゴリズムの開発に対する大きな関心が高まっています。
最近、このようなアルゴリズムは、カーディナリティ制約の下での単調サブモジュール最大化のために開発されました。
この論文では、この問題をマトロイド制約に自然に一般化する方法を研究します。
ストリーミング アルゴリズムと、効率、品質、公平性の間のトレードオフを提供する不可能な結果を提供します。
私たちは、見本ベースのクラスタリング、映画の推奨、ソーシャル ネットワークでの最大限のカバレッジなど、さまざまなよく知られた現実世界のアプリケーションで実験的に結果を検証します。
要約(オリジナル)
Streaming submodular maximization is a natural model for the task of selecting a representative subset from a large-scale dataset. If datapoints have sensitive attributes such as gender or race, it becomes important to enforce fairness to avoid bias and discrimination. This has spurred significant interest in developing fair machine learning algorithms. Recently, such algorithms have been developed for monotone submodular maximization under a cardinality constraint. In this paper, we study the natural generalization of this problem to a matroid constraint. We give streaming algorithms as well as impossibility results that provide trade-offs between efficiency, quality and fairness. We validate our findings empirically on a range of well-known real-world applications: exemplar-based clustering, movie recommendation, and maximum coverage in social networks.
arxiv情報
著者 | Marwa El Halabi,Federico Fusco,Ashkan Norouzi-Fard,Jakab Tardos,Jakub Tarnawski |
発行日 | 2023-10-19 15:22:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google