Differentiable Mathematical Programming for Object-Centric Representation Learning

要約

我々は、物体中心表現学習の手法として、与えられたシーン特徴に対して、トポロジーを考慮した$k$個の離散的なパーティションへの特徴分割を提案する。この目的のため、線形計画として表現される分割手法として、最小$s$-$t$グラフカットを用いることを提案する。この方法は、画像グラフの近傍関係を明示的に符号化するため、位相的な認識が可能である。グラフカットを解くために、我々のソリューションは効率的でスケーラブル、かつ微分可能な二次プログラミング近似に依存している。カット問題に特化した最適化により、一般的な二次計画法よりも大幅に効率的に二次計画法を解き、その勾配を計算することができる。我々の結果は、我々のアプローチがスケーラブルであり、テクスチャを持つシーンやオブジェクトを用いたオブジェクト発見タスクにおいて、既存の手法を凌駕することを示している。

要約(オリジナル)

We propose topology-aware feature partitioning into $k$ disjoint partitions for given scene features as a method for object-centric representation learning. To this end, we propose to use minimum $s$-$t$ graph cuts as a partitioning method which is represented as a linear program. The method is topologically aware since it explicitly encodes neighborhood relationships in the image graph. To solve the graph cuts our solution relies on an efficient, scalable, and differentiable quadratic programming approximation. Optimizations specific to cut problems allow us to solve the quadratic programs and compute their gradients significantly more efficiently compared with the general quadratic programming approach. Our results show that our approach is scalable and outperforms existing methods on object discovery tasks with textured scenes and objects.

arxiv情報

著者 Adeel Pervez,Phillip Lippe,Efstratios Gavves
発行日 2022-10-05 11:36:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク