要約
視覚的障害物発見は、屋内移動ロボットの自律的ナビゲーションに向けた重要なステップである。成功したソリューションは、複数のシーンで多くの応用例がある。例外の1つは反射地面である。この場合、床面の反射は真の世界に似ているため、障害物発見を混乱させ、ナビゲーションを失敗させる。この問題の鍵は、反射と障害物の識別特徴を得ることにあると主張する。障害物と反射は、3次元空間の接地面によって分離できることに注意する。この観察に基づき、我々はまず、ロボットの動きを利用して接地面を予測する、事前較正に基づく接地面検出スキームを導入する。この方式では、ロボットの動きが反射に強いため、反射による地面検出の失敗を避けることができる。検出された地面が与えられた場合、地面に対する画素の相対的な位置を記述するための地面画素視差を設計する。これに基づいて、矩形ボックス内の物体を記述するための、統一的な外観幾何特徴表現を提案する。最終的には、検出フレームワークによるセグメンテーションに基づき、障害物を発見するために提案された特徴を利用するために、外観-形状融合回帰器を設計する。これはまた、我々のモデルが障害物全体ではなく、障害物の一部に集中しすぎることを防ぐ。このデータセットは、様々な反射地面を持つ15のシーン、200以上の画像シーケンス、3400枚のRGB画像から構成される。地面と障害物のピクセル単位の注釈は、我々の手法と他の手法との比較を提供する。反射の誤検出を減らすことで、提案手法は他の手法を凌駕する。ソースコードとデータセットはhttps://github.com/XuefengBUPT/IndoorObstacleDiscovery-RG。
要約(オリジナル)
Visual obstacle discovery is a key step towards autonomous navigation of indoor mobile robots. Successful solutions have many applications in multiple scenes. One of the exceptions is the reflective ground. In this case, the reflections on the floor resemble the true world, which confuses the obstacle discovery and leaves navigation unsuccessful. We argue that the key to this problem lies in obtaining discriminative features for reflections and obstacles. Note that obstacle and reflection can be separated by the ground plane in 3D space. With this observation, we firstly introduce a pre-calibration based ground detection scheme that uses robot motion to predict the ground plane. Due to the immunity of robot motion to reflection, this scheme avoids failed ground detection caused by reflection. Given the detected ground, we design a ground-pixel parallax to describe the location of a pixel relative to the ground. Based on this, a unified appearance-geometry feature representation is proposed to describe objects inside rectangular boxes. Eventually, based on segmenting by detection framework, an appearance-geometry fusion regressor is designed to utilize the proposed feature to discover the obstacles. It also prevents our model from concentrating too much on parts of obstacles instead of whole obstacles. For evaluation, we introduce a new dataset for Obstacle on Reflective Ground (ORG), which comprises 15 scenes with various ground reflections, a total of more than 200 image sequences and 3400 RGB images. The pixel-wise annotations of ground and obstacle provide a comparison to our method and other methods. By reducing the misdetection of the reflection, the proposed approach outperforms others. The source code and the dataset will be available at https://github.com/XuefengBUPT/IndoorObstacleDiscovery-RG.
arxiv情報
著者 | Feng Xue,Yicong Chang,Tianxi Wang,Yu Zhou,Anlong Ming |
発行日 | 2024-01-02 22:07:44+00:00 |
arxivサイト | arxiv_id(pdf) |