Modification-Fair Cluster Editing


古典的なクラスター編集問題 (相関クラスタリングとも呼ばれます) では、少数のエッジ変更によって、指定されたグラフをクリーク (クラスター) の素結合に変換することが求められます。
頂点カラーのグラフ (サブグループを表す色) に適用すると、NP 困難クラスター編集問題の標準アルゴリズムは、データのサブグループ (人口統計グループなど) に偏った解を生成する可能性があります。
まず、頂点色が 2 つあるグラフに対する Modification-Fair Cluster Editing を検討します。
サブグループ内にエッジを挿入するだけの場合でも、問題は NP 困難であることを示します。


The classic Cluster Editing problem (also known as Correlation Clustering) asks to transform a given graph into a disjoint union of cliques (clusters) by a small number of edge modifications. When applied to vertex-colored graphs (the colors representing subgroups), standard algorithms for the NP-hard Cluster Editing problem may yield solutions that are biased towards subgroups of data (e.g., demographic groups), measured in the number of modifications incident to the members of the subgroups. We propose a modification fairness constraint which ensures that the number of edits incident to each subgroup is proportional to its size. To start with, we study Modification-Fair Cluster Editing for graphs with two vertex colors. We show that the problem is NP-hard even if one may only insert edges within a subgroup; note that in the classic ‘non-fair’ setting, this case is trivially polynomial-time solvable. However, in the more general editing form, the modification-fair variant remains fixed-parameter tractable with respect to the number of edge edits. We complement these and further theoretical results with an empirical analysis of our model on real-world social networks where we find that the price of modification-fairness is surprisingly low, that is, the cost of optimal modification-fair solutions differs from the cost of optimal ‘non-fair’ solutions only by a small percentage.


著者 Vincent Froese,Leon Kellerhals,Rolf Niedermeier
発行日 2024-01-26 15:18:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.DS, cs.LG パーマリンク