要約
単眼画像から物体の姿勢を推定することは、コンピューター ビジョンの基本的な逆問題です。
この問題の不適切な性質は、それを解決するために事前変形を組み込む必要があります。
実際には、多くの材料は、操作しても知覚できるほど収縮したり伸びたりせず、強力でよく知られている事前情報を構成します。
数学的には、これはリーマン計量の保存に変換されます。
ニューラル ネットワークは、表面を任意の精度で近似し、微分幾何量の計算を可能にするため、表面再構築の問題を解決するための完璧な遊び場を提供します。
このホワイト ペーパーでは、連続した変形可能なサーフェスを一連の画像から推測するアプローチを紹介します。このアプローチは、いくつかの手法に対してベンチマークされ、オフライン トレーニングを必要とせずに最先端のパフォーマンスが得られます。
要約(オリジナル)
Estimating the pose of an object from a monocular image is an inverse problem fundamental in computer vision. The ill-posed nature of this problem requires incorporating deformation priors to solve it. In practice, many materials do not perceptibly shrink or extend when manipulated, constituting a powerful and well-known prior. Mathematically, this translates to the preservation of the Riemannian metric. Neural networks offer the perfect playground to solve the surface reconstruction problem as they can approximate surfaces with arbitrary precision and allow the computation of differential geometry quantities. This paper presents an approach to inferring continuous deformable surfaces from a sequence of images, which is benchmarked against several techniques and obtains state-of-the-art performance without the need for offline training.
arxiv情報
著者 | Oriol Barbany,Adrià Colomé,Carme Torras |
発行日 | 2022-12-22 10:45:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google