要約
計算幾何学における次の問題を考えます。d 次元の実空間で、正のセットの凸包が負のセットと交差しないように、正としてマークされた点のセットと負としてマークされた点のセットが与えられるとします。
、可能であれば、すべての正の点を負の点から分離する K 超平面を見つけます。
つまり、すべての正の点を含み、負の点を含まない、最大 K 個の面を持つ凸多面体を検索します。
この問題は、純粋な凸多面体近似に関する文献で知られています。
私たちの関心は、制約学習におけるその応用の可能性から生じています。この場合、点は混合整数計画の実行可能または実行不可能な解であり、K 超平面は検出される線形制約です。
正確な分離が達成できない場合は常に、凸多面体の内部の負の点の数を最小化する最適化問題として問題をキャストします。
サポート ベクター マシンからインスピレーションを得たモデルを導入し、バイナリ変数を使用した 2 つの数学的プログラミング公式を設計します。
Dantzig-Wolfe 分解を利用して拡張された定式化を取得し、アドホック価格設定ルーチンを使用してカラム生成アルゴリズムを考案します。
合成データセットに対するすべてのアプローチによって得られた計算時間と分離誤差の値を、数百から数千のポイント数で比較し、文献に記載されている既存のアプローチよりも優れたパフォーマンスを発揮するアプローチを示しています。
さらに、予算 K がプラスの点とマイナスの点を完全に分離するのに十分であるかどうかに応じて、重要な計算上の違いが生じることがわかります。
8 次元インスタンス (およびそれ以上) では、既存の凸包アルゴリズムは計算上適用できなくなりますが、当社のアルゴリズムを使用すると、数分の計算で適切な凸包近似を特定できます。
要約(オリジナル)
We consider the following problem in computational geometry: given, in the d-dimensional real space, a set of points marked as positive and a set of points marked as negative, such that the convex hull of the positive set does not intersect the negative set, find K hyperplanes that separate, if possible, all the positive points from the negative ones. That is, we search for a convex polyhedron with at most K faces, containing all the positive points and no negative point. The problem is known in the literature for pure convex polyhedral approximation; our interest stems from its possible applications in constraint learning, where points are feasible or infeasible solutions of a Mixed Integer Program, and the K hyperplanes are linear constraints to be found. We cast the problem as an optimization one, minimizing the number of negative points inside the convex polyhedron, whenever exact separation cannot be achieved. We introduce models inspired by support vector machines and we design two mathematical programming formulations with binary variables. We exploit Dantzig-Wolfe decomposition to obtain extended formulations, and we devise column generation algorithms with ad-hoc pricing routines. We compare computing time and separation error values obtained by all our approaches on synthetic datasets, with number of points from hundreds up to a few thousands, showing our approaches to perform better than existing ones from the literature. Furthermore, we observe that key computational differences arise, depending on whether the budget K is sufficient to completely separate the positive points from the negative ones or not. On 8-dimensional instances (and over), existing convex hull algorithms become computational inapplicable, while our algorithms allow to identify good convex hull approximations in minutes of computation.
arxiv情報
著者 | Michele Barbato,Alberto Ceselli,Rosario Messana |
発行日 | 2024-07-24 15:08:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google