Hierarchical Path-planning from Speech Instructions with Spatial Concept-based Topometric Semantic Mapping

要約

人間の音声指示を使用して目的地まで移動することは、現実世界で動作する自律移動ロボットにとって不可欠です。
ロボットは同じ目標に向かって異なる経路をたどることができますが、最短経路が常に最適であるとは限りません。
望ましいアプローチは、ウェイポイントの仕様に柔軟に対応し、たとえ迂回があったとしても、より良い代替経路を計画することです。
さらに、ロボットにはリアルタイムの推論機能が必要です。
空間表現には、セマンティック、トポロジ、およびメトリック レベルが含まれており、それぞれが環境のさまざまな側面を捉えます。
本研究は、トポメトリック意味マップによる階層的空間表現と、ウェイポイントを含む音声指示による経路計画を実現することを目的としている。
我々は、マルチモーダルな空間概念を利用し、場所の接続性を組み込んだ階層型パス計画手法である SpCoTMHP を提案します。
このアプローチは、階層レベル間の相互作用を伴う、新しい統合された確率的生成モデルと高速な近似推論を提供します。
確率的推論としての制御に基づく定式化は、提案された経路計画を理論的にサポートします。
ウェイポイントによる音声命令を用いたナビゲーション実験では、従来の方法と比較して経路計画の性能が向上し、WN-SPLが0.589秒向上し、計算時間が7.14秒短縮されたことが実証されました。
階層的な空間表現は人間とロボットに相互に理解可能な形式を提供し、言語ベースのナビゲーション タスクを可能にします。

要約(オリジナル)

Navigating to destinations using human speech instructions is essential for autonomous mobile robots operating in the real world. Although robots can take different paths toward the same goal, the shortest path is not always optimal. A desired approach is to flexibly accommodate waypoint specifications, planning a better alternative path, even with detours. Furthermore, robots require real-time inference capabilities. Spatial representations include semantic, topological, and metric levels, each capturing different aspects of the environment. This study aims to realize a hierarchical spatial representation by a topometric semantic map and path planning with speech instructions, including waypoints. We propose SpCoTMHP, a hierarchical path-planning method that utilizes multimodal spatial concepts, incorporating place connectivity. This approach provides a novel integrated probabilistic generative model and fast approximate inference, with interaction among the hierarchy levels. A formulation based on control as probabilistic inference theoretically supports the proposed path planning. Navigation experiments using speech instruction with a waypoint demonstrated the performance improvement of path planning, WN-SPL by 0.589, and reduced computation time by 7.14 sec compared to conventional methods. Hierarchical spatial representations offer a mutually understandable form for humans and robots, enabling language-based navigation tasks.

arxiv情報

著者 Akira Taniguchi,Shuya Ito,Tadahiro Taniguchi
発行日 2023-05-25 14:10:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク