要約
この論文では、ニューラル ネットワークの出力または潜在変数にハード凸制約を課すフレームワークである RAYEN について説明します。
RAYEN は、ネットワークのあらゆる入力またはあらゆる重みに対して、制約が常に満たされることを保証します。
他のアプローチと比較して、RAYEN は、実行可能セットに対して計算コストのかかる直交射影ステップを実行せず、ソフト制約 (テスト時に制約が満たされることを保証しない) に依存せず、実行可能セットの保守的な近似を使用しません。
設定されており、制約を強制するために潜在的に遅い内部勾配降下補正は実行されません。
RAYEN は、線形、凸 2 次、2 次円錐 (SOC)、および線形行列不等式 (LMI) 制約の任意の組み合わせをサポートし、制約のないネットワークと比較して非常に小さな計算オーバーヘッドを実現します。
たとえば、8 ミリ秒未満のオーバーヘッドで 1K 次元の変数に 1K の 2 次制約を課したり、12 ミリ秒未満で 10K 次元の変数に 300×300 の密行列を伴う LMI 制約を課したりできます。
制約付き最適化問題の解を近似するニューラル ネットワークで使用すると、RAYEN は最先端のアルゴリズムよりも 20 ~ 7468 倍高速な計算時間を達成し、同時に制約を満たすことを常に保証し、非常に近いコストを取得します。
最適なものへ。
要約(オリジナル)
This paper presents RAYEN, a framework to impose hard convex constraints on the output or latent variable of a neural network. RAYEN guarantees that, for any input or any weights of the network, the constraints are satisfied at all times. Compared to other approaches, RAYEN does not perform a computationally-expensive orthogonal projection step onto the feasible set, does not rely on soft constraints (which do not guarantee the satisfaction of the constraints at test time), does not use conservative approximations of the feasible set, and does not perform a potentially slow inner gradient descent correction to enforce the constraints. RAYEN supports any combination of linear, convex quadratic, second-order cone (SOC), and linear matrix inequality (LMI) constraints, achieving a very small computational overhead compared to unconstrained networks. For example, it is able to impose 1K quadratic constraints on a 1K-dimensional variable with an overhead of less than 8 ms, and an LMI constraint with 300×300 dense matrices on a 10K-dimensional variable in less than 12 ms. When used in neural networks that approximate the solution of constrained optimization problems, RAYEN achieves computation times between 20 and 7468 times faster than state-of-the-art algorithms, while guaranteeing the satisfaction of the constraints at all times and obtaining a cost very close to the optimal one.
arxiv情報
著者 | Jesus Tordesillas,Jonathan P. How,Marco Hutter |
発行日 | 2023-07-17 09:12:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google