Rotating Features for Object Discovery

要約

人間の認知における拘束的な問題、つまり脳が固定された神経接続ネットワーク内でオブジェクトをどのように表現し接続するかという問題は、依然として激しい議論の対象となっています。
教師なし設定でこの問題に対処するほとんどの機械学習の取り組みは、スロットベースの手法に焦点を当ててきましたが、その離散的な性質と不確実性を表現するのが難しいため、限界がある可能性があります。
最近、Complex AutoEncoder が、連続的かつ分散されたオブジェクト中心の表現を学習する代替手段として提案されました。
ただし、単純なおもちゃデータのみに適用されます。
この論文では、複素数値の特徴を高次元に一般化した回転特徴、および分散表現からオブジェクトを抽出するための新しい評価手順を紹介します。
さらに、事前トレーニングされた特徴に対するアプローチの適用可能性を示します。
これらの進歩により、分散オブジェクト中心の表現を単純なおもちゃから実世界のデータまで拡張できるようになります。
私たちは、この研究が機械学習における拘束力のある問題に対処するための新しいパラダイムを前進させ、この分野でさらなるイノベーションを引き起こす可能性があると信じています。

要約(オリジナル)

The binding problem in human cognition, concerning how the brain represents and connects objects within a fixed network of neural connections, remains a subject of intense debate. Most machine learning efforts addressing this issue in an unsupervised setting have focused on slot-based methods, which may be limiting due to their discrete nature and difficulty to express uncertainty. Recently, the Complex AutoEncoder was proposed as an alternative that learns continuous and distributed object-centric representations. However, it is only applicable to simple toy data. In this paper, we present Rotating Features, a generalization of complex-valued features to higher dimensions, and a new evaluation procedure for extracting objects from distributed representations. Additionally, we show the applicability of our approach to pre-trained features. Together, these advancements enable us to scale distributed object-centric representations from simple toy to real-world data. We believe this work advances a new paradigm for addressing the binding problem in machine learning and has the potential to inspire further innovation in the field.

arxiv情報

著者 Sindy Löwe,Phillip Lippe,Francesco Locatello,Max Welling
発行日 2023-10-17 12:48:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク