Dynamic Hyperbolic Attention Network for Fine Hand-object Reconstruction


単一の RGB 画像から物体と手の両方を 3D で再構築するのは複雑です。
この研究では、双曲空間における最初の正確な手のオブジェクトの再構成方法、すなわち、双曲空間の固有の特性を利用して代表的な特徴を学習する動的双曲アテンション ネットワーク (DHANet) を提案します。
メッシュと画像の特徴を統一双曲空間に投影する私たちの方法には、2 つのモジュールが含まれています。
これら 2 つのモジュールを使用して、私たちの方法は豊富なジオメトリ画像のマルチモーダル情報を使用してメッシュの特徴を学習し、より適切な手とオブジェクトのインタラクションをモデル化します。
3 つの公開データセットに対する広範な実験により、私たちの方法がほとんどの最先端の方法よりも優れていることが実証されました。


Reconstructing both objects and hands in 3D from a single RGB image is complex. Existing methods rely on manually defined hand-object constraints in Euclidean space, leading to suboptimal feature learning. Compared with Euclidean space, hyperbolic space better preserves the geometric properties of meshes thanks to its exponentially-growing space distance, which amplifies the differences between the features based on similarity. In this work, we propose the first precise hand-object reconstruction method in hyperbolic space, namely Dynamic Hyperbolic Attention Network (DHANet), which leverages intrinsic properties of hyperbolic space to learn representative features. Our method that projects mesh and image features into a unified hyperbolic space includes two modules, ie. dynamic hyperbolic graph convolution and image-attention hyperbolic graph convolution. With these two modules, our method learns mesh features with rich geometry-image multi-modal information and models better hand-object interaction. Our method provides a promising alternative for fine hand-object reconstruction in hyperbolic space. Extensive experiments on three public datasets demonstrate that our method outperforms most state-of-the-art methods.


著者 Zhiying Leng,Shun-Cheng Wu,Mahdi Saleh,Antonio Montanaro,Hao Yu,Yin Wang,Nassir Navab,Xiaohui Liang,Federico Tombari
発行日 2023-09-06 13:00:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, I.4.5 パーマリンク