要約
カプセル ネットワーク (Hinton et al., 2018 などを参照) は、オブジェクトとそのパーツの関係についての知識と理由をエンコードすることを目的としています。
この論文では、そのようなデータの生成モデルを指定し、シーン内の各モデル オブジェクトの変換と、オブジェクトへの観測部分の割り当てを推測するための変分アルゴリズムを導き出します。
変分的期待値の最大化に基づいて、オブジェクト モデルの学習アルゴリズムを導出します (Jordan et al., 1999)。
また、Fischler と Bolles (1981) の RANSAC 法に基づく代替推論アルゴリズムも研究します。
これらの推論方法を、(i) 正方形や三角形 (「星座」) などの複数の幾何学的オブジェクトから生成されたデータ、および (ii) 顔のパーツベースのモデルからのデータに適用します。
Kosiorek らによる最近の研究。
(2019) は、スタック型カプセル オートエンコーダー (SCAE) による償却推論を使用して、この問題に取り組みました。私たちの結果は、(コンステレーション データで) 比較できる場所で、それらを大幅に上回っていることを示しています。
要約(オリジナル)
Capsule networks (see e.g. Hinton et al., 2018) aim to encode knowledge of and reason about the relationship between an object and its parts. In this paper we specify a generative model for such data, and derive a variational algorithm for inferring the transformation of each model object in a scene, and the assignments of observed parts to the objects. We derive a learning algorithm for the object models, based on variational expectation maximization (Jordan et al., 1999). We also study an alternative inference algorithm based on the RANSAC method of Fischler and Bolles (1981). We apply these inference methods to (i) data generated from multiple geometric objects like squares and triangles (‘constellations’), and (ii) data from a parts-based model of faces. Recent work by Kosiorek et al. (2019) has used amortized inference via stacked capsule autoencoders (SCAEs) to tackle this problem — our results show that we significantly outperform them where we can make comparisons (on the constellations data).
arxiv情報
著者 | Alfredo Nazabal,Nikolaos Tsagkas,Christopher K. I. Williams |
発行日 | 2022-10-21 14:28:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google