Best Principal Submatrix Selection for the Maximum Entropy Sampling Problem: Scalable Algorithms and Performance Guarantees



– 最大エントロピーサンプリング問題(MESP)とは、指定された共分散行列から情報が多い主要部分行列を選択する問題であり、医療、電力システム、製造業、データサイエンスなどの多くの分野で広く利用されている。
– Lagrangian dualとprimal表現を調べることで、MESPのための新しい凸整数計画法が導かれ、その連続緩和が近似最適解を与えることが示された。
– MESPのための効率的なサンプリングアルゴリズムを研究し、文献で最高の近似上界を改善する近似上界を開発した。また、同じ近似上界を持つ効率的な決定論的実装を提供した。
– 特異行列に対する新しい数学的ツールを開発し、提案された凸整数計画のLagrangian dualを分析することで、広く利用されるローカルサーチアルゴリズムを調査し、その最初の近似上界を示した。
– 提案されたアルゴリズムは、中程度サイズの問題から大規模な問題まで効率的に解決することができ、オープンソースソフトウェアとしてコード化され、公開されている。
– 最小分散サンプリング問題(A-MESP)にもアルゴリズムを拡張し、選択された主要部分行列の逆のトレースを最小化することが目的である。


This paper studies a classic maximum entropy sampling problem (MESP), which aims to select the most informative principal submatrix of a prespecified size from a covariance matrix. MESP has been widely applied to many areas, including healthcare, power system, manufacturing and data science. By investigating its Lagrangian dual and primal characterization, we derive a novel convex integer program for MESP and show that its continuous relaxation yields a near-optimal solution. The results motivate us to study an efficient sampling algorithm and develop its approximation bound for MESP, which improves the best-known bound in literature. We then provide an efficient deterministic implementation of the sampling algorithm with the same approximation bound. By developing new mathematical tools for the singular matrices and analyzing the Lagrangian dual of the proposed convex integer program, we investigate the widely-used local search algorithm and prove its first-known approximation bound for MESP. The proof techniques further inspire us with an efficient implementation of the local search algorithm. Our numerical experiments demonstrate that these approximation algorithms can efficiently solve medium-sized and large-scale instances to near-optimality. Our proposed algorithms are coded and released as open-source software. Finally, we extend the analyses to the A-Optimal MESP (A-MESP), where the objective is to minimize the trace of the inverse of the selected principal submatrix.


著者 Yongchun Li,Weijun Xie
発行日 2023-05-01 13:21:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.LG, math.OC, stat.ML パーマリンク