Deep Learning-Based Object Pose Estimation: A Comprehensive Survey

要約

オブジェクトの姿勢推定は、拡張現実やロボット工学における幅広い用途に関わる基本的なコンピューター ビジョンの問題です。
過去 10 年にわたり、ディープ ラーニング モデルは、その優れた精度と堅牢性により、設計された点ペアの特徴に依存する従来のアルゴリズムにますます取って代わられるようになりました。
それにもかかわらず、ラベル付きトレーニング データへの依存、モデルのコンパクトさ、困難な条件下での堅牢性、新しい目に見えないオブジェクトへの一般化能力など、現代の手法にはいくつかの課題が残っています。
この分野のさまざまな側面における進歩、未解決の課題、有望な将来の方向性について論じた最近の調査が欠落している。
このギャップを埋めるために、ディープ ラーニング ベースのオブジェクトの姿勢推定における最近の進歩について説明します。この問題の 3 つの定式化、\emph{i.e.}、インスタンス レベル、カテゴリ レベル、および目に見えないオブジェクトの姿勢推定をすべてカバーします。
私たちの調査では、複数の入力データ モダリティ、出力ポーズの自由度、オブジェクトのプロパティ、および下流のタスクもカバーしており、読者にこの分野の全体的な理解を提供します。
さらに、さまざまなドメイン、推論モード、アプリケーション領域、評価メトリクス、ベンチマーク データセットのトレーニング パラダイムについて説明し、これらのベンチマークにおける現在の最先端の手法のパフォーマンスをレポートすることで、読者が選択しやすくなります。
アプリケーションに最適な方法を提供します。
最後に、この調査では主要な課題を特定し、一般的な傾向とその長所と短所を検討し、将来の研究の有望な方向性を特定します。
また、https://github.com/CNJianLiu/Awesome-Object-Pose-Estimation で最新の作品をトレースし続けています。

要約(オリジナル)

Object pose estimation is a fundamental computer vision problem with broad applications in augmented reality and robotics. Over the past decade, deep learning models, due to their superior accuracy and robustness, have increasingly supplanted conventional algorithms reliant on engineered point pair features. Nevertheless, several challenges persist in contemporary methods, including their dependency on labeled training data, model compactness, robustness under challenging conditions, and their ability to generalize to novel unseen objects. A recent survey discussing the progress made on different aspects of this area, outstanding challenges, and promising future directions, is missing. To fill this gap, we discuss the recent advances in deep learning-based object pose estimation, covering all three formulations of the problem, \emph{i.e.}, instance-level, category-level, and unseen object pose estimation. Our survey also covers multiple input data modalities, degrees-of-freedom of output poses, object properties, and downstream tasks, providing the readers with a holistic understanding of this field. Additionally, it discusses training paradigms of different domains, inference modes, application areas, evaluation metrics, and benchmark datasets, as well as reports the performance of current state-of-the-art methods on these benchmarks, thereby facilitating the readers in selecting the most suitable method for their application. Finally, the survey identifies key challenges, reviews the prevailing trends along with their pros and cons, and identifies promising directions for future research. We also keep tracing the latest works at https://github.com/CNJianLiu/Awesome-Object-Pose-Estimation.

arxiv情報

著者 Jian Liu,Wei Sun,Hui Yang,Zhiwen Zeng,Chongpei Liu,Jin Zheng,Xingyu Liu,Hossein Rahmani,Nicu Sebe,Ajmal Mian
発行日 2024-05-31 15:11:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク