要約
人間の動作分類は、人間がどのように動き、環境と相互作用するかを分類する、高レベルの階層的抽象化として機能する。この分類法は、把持、操作スキル、および全身をサポートするポーズを分析するのに有用であることが証明されている。その階層と基礎となるカテゴリの設計に多大な努力が払われているにもかかわらず、その利用は限定的なままである。これは、分類法の離散的な階層構造と、そのカテゴリに関連する高次元の異種データとの間のギャップを埋める計算モデルの欠如に起因すると考えられる。この問題を克服するために、我々は、関連する階層構造を捕捉する双曲埋め込みを介して分類データをモデル化することを提案する。このモデルは、潜在空間上のグラフベースの事前分布と、距離を保存するバック制約によって、分類学の構造を取り込む。我々のモデルを3つの異なる人体運動分類法で検証し、元のグラフ構造を忠実に保持する双曲線埋め込みを学習する。我々のモデルは、既存または新しい分類カテゴリからの未知のデータを適切に符号化し、埋め込み間の現実的な軌跡を生成するために使用でき、ユークリッドベースやVAEベースの同等モデルを凌駕することを示す。
要約(オリジナル)
Human motion taxonomies serve as high-level hierarchical abstractions that classify how humans move and interact with their environment. They have proven useful to analyse grasps, manipulation skills, and whole-body support poses. Despite substantial efforts devoted to design their hierarchy and underlying categories, their use remains limited. This may be attributed to the lack of computational models that fill the gap between the discrete hierarchical structure of the taxonomy and the high-dimensional heterogeneous data associated to its categories. To overcome this problem, we propose to model taxonomy data via hyperbolic embeddings that capture the associated hierarchical structure. We achieve this by formulating a novel Gaussian process hyperbolic latent variable model that incorporates the taxonomy structure through graph-based priors on the latent space and distance-preserving back constraints. We validate our model on three different human motion taxonomies to learn hyperbolic embeddings that faithfully preserve the original graph structure. We show that our model properly encodes unseen data from existing or new taxonomy categories, can be used to generate realistic trajectories between the embeddings, and outperforms its Euclidean and VAE-based counterparts.
arxiv情報
著者 | Noémie Jaquier,Leonel Rozo,Miguel González-Duque,Viacheslav Borovitskiy,Tamim Asfour |
発行日 | 2024-02-01 20:57:59+00:00 |
arxivサイト | arxiv_id(pdf) |