Maximal Ordinal Two-Factorizations

要約

形式的なコンテキストを考慮すると、順序因子は、概念格子内で連鎖を形成する出現関係のサブセット、つまり、線形順序に対応するデータセットの一部です。
正式なコンテキストでデータを視覚化するために、Ganter と Glodeanu は 2 つの順序因子に基づくバイプロットを提案しました。
バイプロットを有効にするには、これらの要因ができるだけ多くのデータ ポイントを構成すること、つまり、それらの要因が出現関係の大部分をカバーすることが重要です。
この研究では、そのような順序二因数分解を調査します。
まず、序数の 2 因子化を省略した形式的なコンテキストについて、2 つの因子の素性を調査します。
次に、与えられたサイズの 2 つの因数分解の存在を決定することは NP 完全問題であり、最大因数分解の計算に計算コストがかかることを示します。
最後に、大規模な序数 2 因数分解を計算できるアルゴリズム Ord2Factor を提供します。

要約(オリジナル)

Given a formal context, an ordinal factor is a subset of its incidence relation that forms a chain in the concept lattice, i.e., a part of the dataset that corresponds to a linear order. To visualize the data in a formal context, Ganter and Glodeanu proposed a biplot based on two ordinal factors. For the biplot to be useful, it is important that these factors comprise as much data points as possible, i.e., that they cover a large part of the incidence relation. In this work, we investigate such ordinal two-factorizations. First, we investigate for formal contexts that omit ordinal two-factorizations the disjointness of the two factors. Then, we show that deciding on the existence of two-factorizations of a given size is an NP-complete problem which makes computing maximal factorizations computationally expensive. Finally, we provide the algorithm Ord2Factor that allows us to compute large ordinal two-factorizations.

arxiv情報

著者 Dominik Dürrschnabel,Gerd Stumme
発行日 2023-06-20 11:22:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 03G10, 06-08, 06A07, 68R10, 90C27, cs.AI, cs.LG, cs.LO, F.2.2, math.CO パーマリンク