要約
無人航空機 (UAV) が現実世界の環境で自律的に航行する場合、特に捜索救助活動においては、安全性を確保するための包括的なマップが必要です。
ただし、一般的なメトリック マップには、シーンの全体的な理解に重要な意味論的な情報が欠けていることがよくあります。
この論文では、RGB-D画像から環境から抽出されたオブジェクト情報を豊富に含む確率的計量マップを構築するシステムを提案しました。
私たちのアプローチは、フロントエンドで最先端の YOLOv8 ベースの物体検出フレームワークと、バックエンドで 2D SLAM メソッドである CartoGrapher を組み合わせています。
フロントエンド インターフェイスから抽出されたセマンティック オブジェクト クラスを効果的に追跡して配置するために、革新的な BoT-SORT 手法を採用しています。
オブジェクトの位置を抽出し、それをメトリック マップで投影するための新しい関連付け方法が導入されています。
これまでの研究とは異なり、私たちのアプローチは、さまざまな中空底物体が存在する環境内での信頼性の高いナビゲーションを考慮しています。
私たちのシステムの出力は確率マップです。これは、クラスの区別、正確な位置、オブジェクトの高さを含むオブジェクト固有の属性を組み込むことにより、マップの表現を大幅に強化します。
私たちが提案したアプローチを評価するために、多くの実験が行われました。
結果は、ロボットがいくつかのオブジェクト (特に椅子と机) を含む拡張セマンティック マップを効果的に生成できることを示しています。
さらに、当社のシステムは組み込みコンピューター Jetson Xavier AGX ユニット内で評価され、実際のアプリケーションでの使用例が実証されています。
要約(オリジナル)
To autonomously navigate in real-world environments, special in search and rescue operations, Unmanned Aerial Vehicles (UAVs) necessitate comprehensive maps to ensure safety. However, the prevalent metric map often lacks semantic information crucial for holistic scene comprehension. In this paper, we proposed a system to construct a probabilistic metric map enriched with object information extracted from the environment from RGB-D images. Our approach combines a state-of-the-art YOLOv8-based object detection framework at the front end and a 2D SLAM method – CartoGrapher at the back end. To effectively track and position semantic object classes extracted from the front-end interface, we employ the innovative BoT-SORT methodology. A novel association method is introduced to extract the position of objects and then project it with the metric map. Unlike previous research, our approach takes into reliable navigating in the environment with various hollow bottom objects. The output of our system is a probabilistic map, which significantly enhances the map’s representation by incorporating object-specific attributes, encompassing class distinctions, accurate positioning, and object heights. A number of experiments have been conducted to evaluate our proposed approach. The results show that the robot can effectively produce augmented semantic maps containing several objects (notably chairs and desks). Furthermore, our system is evaluated within an embedded computer – Jetson Xavier AGX unit to demonstrate the use case in real-world applications.
arxiv情報
著者 | Thanh Nguyen Canh,Armagan Elibol,Nak Young Chong,Xiem HoangVan |
発行日 | 2024-01-16 05:50:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google