Implicit Shape Model Trees: Recognition of 3-D Indoor Scenes and Prediction of Object Poses for Mobile Robots


シーン モデル「Implicit Shape Model (ISM) ツリー」を使用すると、これら 2 つのタスクを一緒に解決できます。
この記事では、ISM ツリーに関して、シーンを認識し、検索されたオブジェクトの姿勢を予測するための新しいアルゴリズムを紹介します。
シーンをオブジェクトのセットとして定義します。ここで、いくつかのオブジェクトは 3D 空間関係によって接続されます。
以前の作業では、単一の ISM を使用してシーンを認識していました。
ただし、これらの ISM は誤検知が発生する傾向がありました。
この問題に対処するために、複数の ISM を含む階層モデルである ISM ツリーを導入しました。
この記事は、貢献する認識アルゴリズムを通じて、最終的にシーン認識における ISM ツリーの使用を可能にします。
私たちは、ユーザーが人間によってデモンストレーションされたオブジェクトの配置から ISM ツリーを生成できるようにする予定です。
適切なアルゴリズムの欠如は、ISM ツリー生成アルゴリズムの導入によって克服されます。
ただし、2 つのタスクをリンクする効率的なアルゴリズムは提供されていませんでした。


For a mobile robot, we present an approach to recognize scenes in arrangements of objects distributed over cluttered environments. Recognition is made possible by letting the robot alternately search for objects and assign found objects to scenes. Our scene model ‘Implicit Shape Model (ISM) trees’ allows us to solve these two tasks together. For the ISM trees, this article presents novel algorithms for recognizing scenes and predicting the poses of searched objects. We define scenes as sets of objects, where some objects are connected by 3-D spatial relations. In previous work, we recognized scenes using single ISMs. However, these ISMs were prone to false positives. To address this problem, we introduced ISM trees, a hierarchical model that includes multiple ISMs. Through the recognition algorithm it contributes, this article ultimately enables the use of ISM trees in scene recognition. We intend to enable users to generate ISM trees from object arrangements demonstrated by humans. The lack of a suitable algorithm is overcome by the introduction of an ISM tree generation algorithm. In scene recognition, it is usually assumed that image data is already available. However, this is not always the case for robots. For this reason, we combined scene recognition and object search in previous work. However, we did not provide an efficient algorithm to link the two tasks. This article introduces such an algorithm that predicts the poses of searched objects with relations. Experiments show that our overall approach enables robots to find and recognize object arrangements that cannot be perceived from a single viewpoint.


著者 Pascal Meißner,Rüdiger Dillmann
発行日 2023-09-13 17:40:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.RO パーマリンク