A Bayesian framework for active object recognition, pose estimation and shape transfer learning through touch

要約

人間は触覚を通じて世界を探索し理解することができるため、触覚センシングもロボットの認識の重要な側面です。
非構造化環境では、ロボットは既知のオブジェクトと新規のオブジェクトの両方に遭遇する可能性があるため、既知のオブジェクトと新規のオブジェクトの両方に対処する方法が必要になります。
この研究では、統合ベイジアン フレームワークで粒子フィルター (PF) とガウス プロセス陰的曲面 (GPIS) を組み合わせます。
このフレームワークは、アクティブ ラーニング方式で、既知のオブジェクトと新しいオブジェクトを区別し、オブジェクト認識を実行し、既知のオブジェクトの姿勢を推定し、未知のオブジェクトの形状を再構築できます。
PF からの最尤推定 (MLE) 形状を使用して GPIS の選択を事前に行うことで、既知のオブジェクトの形状に関する知識を新しい形状の学習に転送できます。
アクティブなデータ取得をガイドし、十分な情報が得られたときに探査を終了するために、グローバル形状推定を伴う探査手順が提案されています。
提案されたベイジアン フレームワークのパフォーマンスは、ランダムなポーズで初期化された既知のオブジェクトと新しいオブジェクトのシミュレーションを通じて評価され、急速探索ランダム ツリー (RRT) と比較されます。結果は、提案された探索手順がグローバル形状推定を利用して高速化を達成することを示しています。
RRT ベースのローカル探索手順よりも探索が容易です。
全体として、結果は、提案されたフレームワークが物体認識、姿勢推定、形状再構成において効果的かつ効率的であることを示しています。
さらに、学習した形状を新しい事前分布として含めることができ、将来の物体認識や新しい物体の姿勢推定に効果的に使用できることを示します。

要約(オリジナル)

As humans can explore and understand the world through the sense of touch, tactile sensing is also an important aspect of robotic perception. In unstructured environments, robots can encounter both known and novel objects, this calls for a method to address both known and novel objects. In this study, we combine a particle filter (PF) and Gaussian process implicit surface (GPIS) in a unified Bayesian framework. The framework can differentiate between known and novel objects, perform object recognition, estimate pose for known objects, and reconstruct shapes for unknown objects, in an active learning fashion. By grounding the selection of the GPIS prior with the maximum-likelihood-estimation (MLE) shape from the PF, the knowledge about known objects’ shapes can be transferred to learn novel shapes. An exploration procedure with global shape estimation is proposed to guide active data acquisition and conclude the exploration when sufficient information is obtained. The performance of the proposed Bayesian framework is evaluated through simulations on known and novel objects, initialized with random poses and is compared with a rapidly explore random tree (RRT).The results show that the proposed exploration procedure, utilizing global shape estimation, achieves faster exploration than the RRT-based local exploration procedure. Overall, results indicate that the proposed framework is effective and efficient in object recognition, pose estimation and shape reconstruction. Moreover, we show that a learned shape can be included as a new prior and used effectively for future object recognition and pose estimation of novel objects.

arxiv情報

著者 Haodong Zheng,Andrei Jalba,Raymond H. Cuijpers,Wijnand IJsselsteijn,Sanne Schoenmakers
発行日 2024-09-10 23:35:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク