要約
人間の動きの分類法は、人間がどのように移動し、環境と相互作用するかを分類する高レベルの階層的抽象概念として機能します。
これらは、掴み、操作スキル、全身のサポートポーズを分析するのに役立つことが証明されています。
その階層と基礎となるカテゴリの設計に多大な労力が費やされたにもかかわらず、その使用は依然として限定的です。
これは、分類法の個別の階層構造とそのカテゴリーに関連付けられた高次元の異種データとの間のギャップを埋める計算モデルが不足していることに起因すると考えられます。
この問題を解決するために、関連する階層構造を捕捉する双曲線埋め込みを介して分類データをモデル化することを提案します。
これは、潜在空間に関するグラフベースの事前分布と距離保存後方制約による分類構造を組み込んだ、新しいガウス過程双曲線潜在変数モデルを定式化することで実現します。
元のグラフ構造を忠実に保存する双曲線埋め込みを学習するために、3 つの異なる人間の動作分類法に基づいてモデルを検証します。
私たちのモデルは、既存または新しい分類カテゴリからの目に見えないデータを適切にエンコードし、ユークリッドおよび VAE ベースの対応するモデルよりも優れたパフォーマンスを発揮することを示します。
最後に、概念実証実験を通じて、学習したエンベディング間の現実的な軌道を生成するためにモデルを使用できることを示します。
要約(オリジナル)
Human motion taxonomies serve as high-level hierarchical abstractions that classify how humans move and interact with their environment. They have proven useful to analyse grasps, manipulation skills, and whole-body support poses. Despite substantial efforts devoted to design their hierarchy and underlying categories, their use remains limited. This may be attributed to the lack of computational models that fill the gap between the discrete hierarchical structure of the taxonomy and the high-dimensional heterogeneous data associated to its categories. To overcome this problem, we propose to model taxonomy data via hyperbolic embeddings that capture the associated hierarchical structure. We achieve this by formulating a novel Gaussian process hyperbolic latent variable model that incorporates the taxonomy structure through graph-based priors on the latent space and distance-preserving back constraints. We validate our model on three different human motion taxonomies to learn hyperbolic embeddings that faithfully preserve the original graph structure. We show that our model properly encodes unseen data from existing or new taxonomy categories, and outperforms its Euclidean and VAE-based counterparts. Finally, through proof-of-concept experiments, we show that our model may be used to generate realistic trajectories between the learned embeddings.
arxiv情報
著者 | Noémie Jaquier,Leonel Rozo,Miguel González-Duque,Viacheslav Borovitskiy,Tamim Asfour |
発行日 | 2024-06-04 15:34:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google