Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM

要約

3D ガウス スプラッティング SLAM を利用して、シーン表現内にオブジェクト レベルの情報を埋め込みながら動的環境を再構築する新しいフレームワークである Go-SLAM を紹介します。
このフレームワークは高度なオブジェクト セグメンテーション技術を採用しており、それが表すオブジェクトに対応する各ガウス スプラットに一意の識別子を割り当てます。
その結果、私たちのシステムはオープンな語彙クエリを容易にし、ユーザーが自然言語記述を使用してオブジェクトを見つけることができるようにします。
さらに、このフレームワークには、障害物や環境の不確実性を考慮して、クエリされたオブジェクトに向かうロボットの効率的なナビゲーション パスを計算する最適パス生成モジュールが搭載されています。
さまざまなシーン設定での包括的な評価により、忠実度の高いシーンの再構成、正確なオブジェクトのセグメンテーション、柔軟なオブジェクトのクエリ、および効率的なロボットの経路計画を実現する際のアプローチの有効性が実証されています。
この研究は、3D シーンの再構築、意味論的なオブジェクトの理解、およびリアルタイムの環境インタラクションの間のギャップを埋める上でのさらなる前進を表しています。

要約(オリジナル)

We introduce Go-SLAM, a novel framework that utilizes 3D Gaussian Splatting SLAM to reconstruct dynamic environments while embedding object-level information within the scene representations. This framework employs advanced object segmentation techniques, assigning a unique identifier to each Gaussian splat that corresponds to the object it represents. Consequently, our system facilitates open-vocabulary querying, allowing users to locate objects using natural language descriptions. Furthermore, the framework features an optimal path generation module that calculates efficient navigation paths for robots toward queried objects, considering obstacles and environmental uncertainties. Comprehensive evaluations in various scene settings demonstrate the effectiveness of our approach in delivering high-fidelity scene reconstructions, precise object segmentation, flexible object querying, and efficient robot path planning. This work represents an additional step forward in bridging the gap between 3D scene reconstruction, semantic object understanding, and real-time environment interactions.

arxiv情報

著者 Phu Pham,Dipam Patel,Damon Conover,Aniket Bera
発行日 2024-09-25 13:56:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO パーマリンク