要約
クラスタリングアルゴリズムでは使用されていない補助情報を使用して、さまざまなデータセットから生成されたクラスターの事後説明を生成することを検討します。
以前の作業で使用された用語に続いて、補助情報をタグと呼びます。
私たちの焦点は、2つの形式の説明、すなわち、分離形式(クラスターの説明はタグのセットで構成されている場合)と2つの接続詞正規形式(CNF)の説明(説明は2セットのタグで構成され、オペレーターを組み合わせた2つのタグで構成されています)に焦点を当てています。
整数線形プログラミング(ILP)とヒューリスティックな方法を使用して、これらの説明を生成します。
さまざまなデータセットを実験し、説明から得た洞察について説明します。
また、説明方法のスケーラビリティに関する実験結果を提示します。
要約(オリジナル)
We consider generating post-hoc explanations of clusters generated from various datasets using auxiliary information which was not used by clustering algorithms. Following terminology used in previous work, we refer to the auxiliary information as tags. Our focus is on two forms of explanations, namely disjunctive form (where the explanation for a cluster consists of a set of tags) and a two-clause conjunctive normal form (CNF) explanation (where the explanation consists of two sets of tags, combined through the AND operator). We use integer linear programming (ILP) as well as heuristic methods to generate these explanations. We experiment with a variety of datasets and discuss the insights obtained from our explanations. We also present experimental results regarding the scalability of our explanation methods.
arxiv情報
著者 | Robert F. Downey,S. S. Ravi |
発行日 | 2025-04-29 15:18:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google