要約
ビジュアル データの点ごとの特徴の対応を解決することは、コンピューター ビジョンの基本的な問題です。
この課題に対処する強力なモデルは、グラフ マッチングとして定式化することです。これには、ノード単位およびエッジ単位の制約を持つ二次割り当て問題 (QAP) を解く必要があります。
ただし、このような QAP を解決するには、多数の局所的な極点があるため、費用がかかり、困難になる可能性があります。
この研究では、グラフ マッチングの計算を高速化するために設計された新しい線形モデルとソルバーを紹介します。
具体的には、正の半定値行列近似を使用して構造属性制約を確立します。次に、元の QAP を、最大化のために凹型の線形モデルに変換します。
このモデルは、その後、既存のアプローチと比較して効率と数値安定性が向上したことで知られる Sinkhorn 最適輸送アルゴリズムを使用して解くことができます。
広く使用されているベンチマーク PascalVOC の実験結果は、当社のアルゴリズムが大幅に改善された効率で最先端のパフォーマンスを達成していることを示しています。
ソースコード: https://github.com/xmlyqing00/clap
要約(オリジナル)
Solving point-wise feature correspondence in visual data is a fundamental problem in computer vision. A powerful model that addresses this challenge is to formulate it as graph matching, which entails solving a Quadratic Assignment Problem (QAP) with node-wise and edge-wise constraints. However, solving such a QAP can be both expensive and difficult due to numerous local extreme points. In this work, we introduce a novel linear model and solver designed to accelerate the computation of graph matching. Specifically, we employ a positive semi-definite matrix approximation to establish the structural attribute constraint.We then transform the original QAP into a linear model that is concave for maximization. This model can subsequently be solved using the Sinkhorn optimal transport algorithm, known for its enhanced efficiency and numerical stability compared to existing approaches. Experimental results on the widely used benchmark PascalVOC showcase that our algorithm achieves state-of-the-art performance with significantly improved efficiency. Source code: https://github.com/xmlyqing00/clap
arxiv情報
著者 | Yongqing Liang,Huijun Han,Xin Li |
発行日 | 2024-10-22 15:28:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google