Non-Separable Multi-Dimensional Network Flows for Visual Computing

要約

ネットワーク (またはグラフ) 内のフローは、数多くのコンピューター ビジョン タスクにおいて重要な役割を果たします。
これらのグラフのスカラー値のエッジにより情報が失われることが多く、それによって表現力の制限が生じます。
たとえば、多くの場合、高次元データ (例: 特徴記述子) は単一のスカラー値 (例: 2 つの特徴記述子の類似性) にマッピングされます。
この制限を克服するために、分離不可能な多次元ネットワーク フローに対する新しい形式主義を提案します。
これにより、自動かつ適応的な特徴選択戦略が可能になります。フローは次元ごとに定義されているため、フローを最大化することで、最も一致する特徴次元が自動的に選択されます。
概念実証として、私たちの形式主義をマルチオブジェクト追跡問題に適用し、ノイズに対する堅牢性の点で、MOT16 ベンチマークで私たちのアプローチがスカラー定式化よりも優れていることを実証します。

要約(オリジナル)

Flows in networks (or graphs) play a significant role in numerous computer vision tasks. The scalar-valued edges in these graphs often lead to a loss of information and thereby to limitations in terms of expressiveness. For example, oftentimes high-dimensional data (e.g. feature descriptors) are mapped to a single scalar value (e.g. the similarity between two feature descriptors). To overcome this limitation, we propose a novel formalism for non-separable multi-dimensional network flows. By doing so, we enable an automatic and adaptive feature selection strategy – since the flow is defined on a per-dimension basis, the maximizing flow automatically chooses the best matching feature dimensions. As a proof of concept, we apply our formalism to the multi-object tracking problem and demonstrate that our approach outperforms scalar formulations on the MOT16 benchmark in terms of robustness to noise.

arxiv情報

著者 Viktoria Ehm,Daniel Cremers,Florian Bernard
発行日 2023-05-15 13:21:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク