Unsupervised Representation Learning for Diverse Deformable Shape Collections

要約

3D サーフェス メッシュをエンコードして操作するための新しい学習ベースの方法を紹介します。
私たちの方法は、変形可能な形状コレクションに対して解釈可能な埋め込み空間を作成するように特別に設計されています。
メッシュが 1 対 1 に対応する必要がある以前の 3D メッシュ オートエンコーダとは異なり、私たちのアプローチは教師なしの方法で多様なメッシュに対してトレーニングされます。
私たちの方法の中心となるのは、メッシュの接続性や形状カテゴリの従来の制約から解放され、普遍的な潜在空間を確立するスペクトル プーリング技術です。
プロセス全体は 2 つの段階で構成されます。
最初の段階では、関数マップ パラダイムを採用して、教師なしの方法で形状のコレクション間のポイントツーポイント (p2p) マップを抽出します。
次に、これらの p2p マップを利用して共通の潜在空間を構築します。これにより、メッシュの接続性や形状カテゴリからの直接的な解釈と独立性が保証されます。
広範な実験を通じて、私たちの方法が優れた再構成を実現し、ベースラインアプローチよりも現実的で滑らかな補間を生成することを実証しました。

要約(オリジナル)

We introduce a novel learning-based method for encoding and manipulating 3D surface meshes. Our method is specifically designed to create an interpretable embedding space for deformable shape collections. Unlike previous 3D mesh autoencoders that require meshes to be in a 1-to-1 correspondence, our approach is trained on diverse meshes in an unsupervised manner. Central to our method is a spectral pooling technique that establishes a universal latent space, breaking free from traditional constraints of mesh connectivity and shape categories. The entire process consists of two stages. In the first stage, we employ the functional map paradigm to extract point-to-point (p2p) maps between a collection of shapes in an unsupervised manner. These p2p maps are then utilized to construct a common latent space, which ensures straightforward interpretation and independence from mesh connectivity and shape category. Through extensive experiments, we demonstrate that our method achieves excellent reconstructions and produces more realistic and smoother interpolations than baseline approaches.

arxiv情報

著者 Sara Hahner,Souhaib Attaiki,Jochen Garcke,Maks Ovsjanikov
発行日 2023-10-27 13:45:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク