要約
移動ロボットについては、雑然とした環境に分散されたオブジェクトの配置でシーンを認識するアプローチを紹介します。
ロボットに物体を探索させ、見つかった物体をシーンに割り当てることを交互に実行させることで、認識が可能になります。
シーン モデル「Implicit Shape Model (ISM) ツリー」を使用すると、これら 2 つのタスクを一緒に解決できます。
この記事では、ISM ツリーに関して、シーンを認識し、検索されたオブジェクトの姿勢を予測するための新しいアルゴリズムを紹介します。
シーンをオブジェクトのセットとして定義します。ここで、いくつかのオブジェクトは 3D 空間関係によって接続されます。
以前の作業では、単一の ISM を使用してシーンを認識していました。
ただし、これらの ISM は誤検知が発生する傾向がありました。
この問題に対処するために、複数の ISM を含む階層モデルである ISM ツリーを導入しました。
この記事は、貢献する認識アルゴリズムを通じて、最終的にシーン認識における ISM ツリーの使用を可能にします。
私たちは、ユーザーが人間によってデモンストレーションされたオブジェクトの配置から ISM ツリーを生成できるようにする予定です。
適切なアルゴリズムの欠如は、ISM ツリー生成アルゴリズムの導入によって克服されます。
シーン認識では、通常、画像データがすでに利用可能であると想定されます。
ただし、ロボットの場合は必ずしもそうとは限りません。
このため、以前の研究ではシーン認識とオブジェクト検索を組み合わせました。
ただし、2 つのタスクをリンクする効率的なアルゴリズムは提供されていませんでした。
この記事では、検索されたオブジェクトの姿勢を関係性から予測するアルゴリズムを紹介します。
実験の結果、私たちの全体的なアプローチにより、単一の視点からは認識できないオブジェクトの配置をロボットが見つけて認識できることがわかりました。
要約(オリジナル)
For a mobile robot, we present an approach to recognize scenes in arrangements of objects distributed over cluttered environments. Recognition is made possible by letting the robot alternately search for objects and assign found objects to scenes. Our scene model ‘Implicit Shape Model (ISM) trees’ allows us to solve these two tasks together. For the ISM trees, this article presents novel algorithms for recognizing scenes and predicting the poses of searched objects. We define scenes as sets of objects, where some objects are connected by 3-D spatial relations. In previous work, we recognized scenes using single ISMs. However, these ISMs were prone to false positives. To address this problem, we introduced ISM trees, a hierarchical model that includes multiple ISMs. Through the recognition algorithm it contributes, this article ultimately enables the use of ISM trees in scene recognition. We intend to enable users to generate ISM trees from object arrangements demonstrated by humans. The lack of a suitable algorithm is overcome by the introduction of an ISM tree generation algorithm. In scene recognition, it is usually assumed that image data is already available. However, this is not always the case for robots. For this reason, we combined scene recognition and object search in previous work. However, we did not provide an efficient algorithm to link the two tasks. This article introduces such an algorithm that predicts the poses of searched objects with relations. Experiments show that our overall approach enables robots to find and recognize object arrangements that cannot be perceived from a single viewpoint.
arxiv情報
著者 | Pascal Meißner,Rüdiger Dillmann |
発行日 | 2023-09-13 17:40:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google