要約
形式的なコンテキストを考慮すると、順序因子は、概念格子内で連鎖を形成する出現関係のサブセット、つまり、線形順序に対応するデータセットの一部です。
正式なコンテキストでデータを視覚化するために、Ganter と Glodeanu は 2 つの順序因子に基づくバイプロットを提案しました。
バイプロットを有効にするには、これらの要因ができるだけ多くのデータ ポイントを構成すること、つまり、それらの要因が出現関係の大部分をカバーすることが重要です。
この研究では、そのような順序二因数分解を調査します。
まず、序数の 2 因子化を省略した形式的なコンテキストについて、2 つの因子の素性を調査します。
次に、与えられたサイズの 2 つの因数分解の存在を決定することは NP 完全問題であり、最大因数分解の計算に計算コストがかかることを示します。
最後に、大規模な序数 2 因数分解を計算できるアルゴリズム Ord2Factor を提供します。
要約(オリジナル)
Given a formal context, an ordinal factor is a subset of its incidence relation that forms a chain in the concept lattice, i.e., a part of the dataset that corresponds to a linear order. To visualize the data in a formal context, Ganter and Glodeanu proposed a biplot based on two ordinal factors. For the biplot to be useful, it is important that these factors comprise as much data points as possible, i.e., that they cover a large part of the incidence relation. In this work, we investigate such ordinal two-factorizations. First, we investigate for formal contexts that omit ordinal two-factorizations the disjointness of the two factors. Then, we show that deciding on the existence of two-factorizations of a given size is an NP-complete problem which makes computing maximal factorizations computationally expensive. Finally, we provide the algorithm Ord2Factor that allows us to compute large ordinal two-factorizations.
arxiv情報
著者 | Dominik Dürrschnabel,Gerd Stumme |
発行日 | 2023-06-20 11:22:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google