A Comparative Study of Graph Matching Algorithms in Computer Vision

要約

グラフマッチング最適化問題は、2つの変形可能な物体を対応させるなど、コンピュータビジョンにおける多くのタスクに不可欠な要素である。当然ながら、過去数十年間に様々な適用可能なアルゴリズムが提案されてきた。しかし、一般的なベンチマークが開発されていないため、異なる問題インスタンスや評価基準で評価した結果が比較できず、その性能を検証することが困難な場合が多い。このような欠点に対処するため、我々はグラフマッチングアルゴリズムの比較研究を行う。我々は、既存の一般に公開されているコンピュータビジョンのグラフマッチング問題の大規模なセットを収集し、共通のフォーマットで分類した統一ベンチマークを作成する。同時に、グラフマッチングアルゴリズムの最も一般的なオープンソースの実装を収集し、分類する。その性能は、最適化アルゴリズムの比較のためのベストプラクティスに沿った方法で評価されます。この研究は、将来的に貴重なリソースとして機能するように、再現性と拡張性があるように設計されています。 我々の研究は3つの注目すべき洞察を提供する。 1.一般的な問題インスタンスは、実質的に1秒未満で正確に解くことができるため、将来の実証評価には不十分である。2.最も一般的なベースライン手法は、利用可能な最善の手法に大きく劣る。3.問題のNP困難性にもかかわらず、ビジョンアプリケーションから来るインスタンスは、500以上の頂点を持つグラフの場合でさえ数秒でしばしば解くことが可能である。

要約(オリジナル)

The graph matching optimization problem is an essential component for many tasks in computer vision, such as bringing two deformable objects in correspondence. Naturally, a wide range of applicable algorithms have been proposed in the last decades. Since a common standard benchmark has not been developed, their performance claims are often hard to verify as evaluation on differing problem instances and criteria make the results incomparable. To address these shortcomings, we present a comparative study of graph matching algorithms. We create a uniform benchmark where we collect and categorize a large set of existing and publicly available computer vision graph matching problems in a common format. At the same time we collect and categorize the most popular open-source implementations of graph matching algorithms. Their performance is evaluated in a way that is in line with the best practices for comparing optimization algorithms. The study is designed to be reproducible and extensible to serve as a valuable resource in the future. Our study provides three notable insights: 1.) popular problem instances are exactly solvable in substantially less than 1 second and, therefore, are insufficient for future empirical evaluations; 2.) the most popular baseline methods are highly inferior to the best available methods; 3.) despite the NP-hardness of the problem, instances coming from vision applications are often solvable in a few seconds even for graphs with more than 500 vertices.

arxiv情報

著者 Stefan Haller,Lorenz Feineis,Lisa Hutschenreiter,Florian Bernard,Carsten Rother,Dagmar Kainmüller,Paul Swoboda,Bogdan Savchynskyy
発行日 2022-07-01 09:37:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, math.OC パーマリンク