Global Optimization for Cardinality-constrained Minimum Sum-of-Squares Clustering via Semidefinite Programming

要約

最小二乗和クラスタリング (MSSC)、つまり K 平均法タイプのクラスタリングは、各クラスターのカーディナリティに関する事前の知識を活用するために最近拡張されました。
このような知識は、パフォーマンスとソリューションの品質を向上させるために使用されます。
この論文では、カーディナリティ制約のある MSSC を解決するためのブランチ アンド カット手法に基づく大域最適化アプローチを提案します。
下限ルーチンには、Rujeerapaiboon らによって最近提案された半定値計画法 (SDP) 緩和を使用します。
[サイアム J. オプティム。
29(2)、1211-1239、(2019)]。
ただし、この緩和は、小規模なインスタンスの場合にのみ、ブランチ アンド カット方式で使用できます。
したがって、インスタンスのサイズとクラスターの数に応じてより適切に拡張できる新しい SDP 緩和を導き出します。
どちらの場合も、多面体カットを追加することでバインドを強化します。
ペアごとの制約を強制するカスタマイズされた分岐戦略の利点を活用して、子ノードで発生する問題の複雑さを軽減します。
上限については、代わりに、各ノードで解決される SDP 緩和の解を利用するローカル探索手順を提示します。
計算結果は、提案されたアルゴリズムが、最先端の正確な方法で解決されるものよりも 10 倍大きいサイズの実世界のインスタンスを初めてグローバルに解決できることを示しています。

要約(オリジナル)

The minimum sum-of-squares clustering (MSSC), or k-means type clustering, has been recently extended to exploit prior knowledge on the cardinality of each cluster. Such knowledge is used to increase performance as well as solution quality. In this paper, we propose a global optimization approach based on the branch-and-cut technique to solve the cardinality-constrained MSSC. For the lower bound routine, we use the semidefinite programming (SDP) relaxation recently proposed by Rujeerapaiboon et al. [SIAM J. Optim. 29(2), 1211-1239, (2019)]. However, this relaxation can be used in a branch-and-cut method only for small-size instances. Therefore, we derive a new SDP relaxation that scales better with the instance size and the number of clusters. In both cases, we strengthen the bound by adding polyhedral cuts. Benefiting from a tailored branching strategy which enforces pairwise constraints, we reduce the complexity of the problems arising in the children nodes. For the upper bound, instead, we present a local search procedure that exploits the solution of the SDP relaxation solved at each node. Computational results show that the proposed algorithm globally solves, for the first time, real-world instances of size 10 times larger than those solved by state-of-the-art exact methods.

arxiv情報

著者 Veronica Piccialli,Antonio M. Sudoso
発行日 2023-09-07 16:12:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML パーマリンク