Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on Bidirectional Prediction

要約

従来の幾何学的登録ベースの推定方法は、暗黙的に CAD モデルを利用するだけであり、そのため、観察品質への依存とオクルージョンへの欠陥が生じます。この問題に対処するために、この論文では、点ごとの注意を認識するメカニズムを備えた双方向対応予測ネットワークを提案しています。
このネットワークは、対応を予測するためにモデル ポイントを必要とするだけでなく、観測値と事前モデルの間の幾何学的類似性を明示的にモデル化します。} 私たちの重要な洞察は、各モデル ポイントとシーン ポイントの間の相関が、ポイント ペアの一致を学習するための重要な情報を提供するということです。

特徴分布の発散によってもたらされる相関ノイズにさらに取り組むために、特徴の均一性を向上させるためのシンプルだが効果的な擬似シャム ネットワークを設計します。LineMOD、YCB-Video、および Occ-LineMOD の公開データセットでの実験結果は、提案された方法が次のことを達成することを示しています。
同じ評価基準の下で他の最先端の方法よりも優れたパフォーマンスを示します。
特にオクルージョンが厳しい環境において、ポーズを推定する際の堅牢性が大幅に向上しました。

要約(オリジナル)

Traditional geometric registration based estimation methods only exploit the CAD model implicitly, which leads to their dependence on observation quality and deficiency to occlusion.To address the problem,the paper proposes a bidirectional correspondence prediction network with a point-wise attention-aware mechanism. This network not only requires the model points to predict the correspondence but also explicitly models the geometric similarities between observations and the model prior.} Our key insight is that the correlations between each model point and scene point provide essential information for learning point-pair matches. To further tackle the correlation noises brought by feature distribution divergence, we design a simple but effective pseudo-siamese network to improve feature homogeneity.Experimental results on the public datasets of LineMOD, YCB-Video, and Occ-LineMOD show that the proposed method achieves better performance than other state-of-the-art methods under the same evaluation criteria. Its robustness in estimating poses is greatly improved, especially in an environment with severe occlusions.

arxiv情報

著者 Yuhao Yang,Jun Wu,Guangjian Zhang,Rong Xiong
発行日 2023-08-16 17:13:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク