Modification-Fair Cluster Editing

要約

古典的なクラスター編集問題 (相関クラスタリングとも呼ばれます) では、少数のエッジ変更によって、指定されたグラフをクリーク (クラスター) の素結合に変換することが求められます。
頂点カラーのグラフ (サブグループを表す色) に適用すると、NP 困難クラスター編集問題の標準アルゴリズムは、データのサブグループ (人口統計グループなど) に偏った解を生成する可能性があります。
サブグループのメンバー。
各サブグループに発生する編集の数がそのサイズに比例することを保証する、変更の公平性制約を提案します。
まず、頂点色が 2 つあるグラフに対する Modification-Fair Cluster Editing を検討します。
サブグループ内にエッジを挿入するだけの場合でも、問題は NP 困難であることを示します。
古典的な「不公平」設定では、このケースは多項式時間で自明に解決できることに注意してください。
ただし、より一般的な編集形式では、変更を公平にするバリアントは、エッジ編集の数に関して固定パラメータで扱いやすいままです。
我々は、これらの理論的結果とさらなる理論的結果を、現実世界のソーシャルネットワーク上のモデルの経験的分析で補完します。そこでは、変更の公平性の価格が驚くほど低いことが分かりました。つまり、最適な変更の公平性ソリューションのコストは、変更の公平性のコストとは異なります。
最適な「不公平な」解決策はほんのわずかな割合でしか得られません。

要約(オリジナル)

The classic Cluster Editing problem (also known as Correlation Clustering) asks to transform a given graph into a disjoint union of cliques (clusters) by a small number of edge modifications. When applied to vertex-colored graphs (the colors representing subgroups), standard algorithms for the NP-hard Cluster Editing problem may yield solutions that are biased towards subgroups of data (e.g., demographic groups), measured in the number of modifications incident to the members of the subgroups. We propose a modification fairness constraint which ensures that the number of edits incident to each subgroup is proportional to its size. To start with, we study Modification-Fair Cluster Editing for graphs with two vertex colors. We show that the problem is NP-hard even if one may only insert edges within a subgroup; note that in the classic ‘non-fair’ setting, this case is trivially polynomial-time solvable. However, in the more general editing form, the modification-fair variant remains fixed-parameter tractable with respect to the number of edge edits. We complement these and further theoretical results with an empirical analysis of our model on real-world social networks where we find that the price of modification-fairness is surprisingly low, that is, the cost of optimal modification-fair solutions differs from the cost of optimal ‘non-fair’ solutions only by a small percentage.

arxiv情報

著者 Vincent Froese,Leon Kellerhals,Rolf Niedermeier
発行日 2024-01-26 15:18:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG パーマリンク