要約
自律型ロボット、自律型車両、複合現実ヘッドセットを装着した人間には、動的に変化する現実世界の環境における安全性が重要なアプリケーション向けの正確で信頼性の高い追跡サービスが必要です。
ただし、Simultaneous Localization and Mapping (SLAM) などの既存の追跡アプローチは、大規模な手動調整にもかかわらず、環境の変化や境界条件にうまく適応できません。
一方、深層学習ベースのアプローチは環境の変化によりよく適応できますが、通常、トレーニング用に大量のデータが必要であり、多くの場合、新しい領域に適応する柔軟性に欠けています。
この問題を解決するために、神経記号プログラム合成アプローチを活用して、データを活用して複雑な関係を学習しながら、従来の SLAM アプローチからのドメイン知識を統合する、適応可能な SLAM パイプラインを構築することを提案します。
このアプローチではエンドツーエンドの SLAM パイプラインを合成できますが、特徴抽出モジュールの合成に焦点を当てます。
まず、特徴抽出のための重要な属性とさまざまな特徴抽出器の実際のパフォーマンスに関するドメイン知識をカプセル化できるドメイン固有言語 (DSL) を考案します。
次に、ニューロシンボリック アーキテクチャが適応的な特徴抽出を実行し、記号推論を使用して最適な特徴抽出器を選択しながら、学習を通じてパラメータを最適化します。
私たちの評価は、私たちのアプローチである神経象徴的特徴抽出 (nFEX) がより高品質の特徴を生み出すことを示しています。
また、最先端のベースライン特徴抽出器である ORB と SIFT で観察されるポーズエラーをそれぞれ最大 90% と最大 66% 削減し、これによりシステムの効率と新しい環境への適応性が向上します。
要約(オリジナル)
Autonomous robots, autonomous vehicles, and humans wearing mixed-reality headsets require accurate and reliable tracking services for safety-critical applications in dynamically changing real-world environments. However, the existing tracking approaches, such as Simultaneous Localization and Mapping (SLAM), do not adapt well to environmental changes and boundary conditions despite extensive manual tuning. On the other hand, while deep learning-based approaches can better adapt to environmental changes, they typically demand substantial data for training and often lack flexibility in adapting to new domains. To solve this problem, we propose leveraging the neurosymbolic program synthesis approach to construct adaptable SLAM pipelines that integrate the domain knowledge from traditional SLAM approaches while leveraging data to learn complex relationships. While the approach can synthesize end-to-end SLAM pipelines, we focus on synthesizing the feature extraction module. We first devise a domain-specific language (DSL) that can encapsulate domain knowledge on the important attributes for feature extraction and the real-world performance of various feature extractors. Our neurosymbolic architecture then undertakes adaptive feature extraction, optimizing parameters via learning while employing symbolic reasoning to select the most suitable feature extractor. Our evaluations demonstrate that our approach, neurosymbolic Feature EXtraction (nFEX), yields higher-quality features. It also reduces the pose error observed for the state-of-the-art baseline feature extractors ORB and SIFT by up to 90% and up to 66%, respectively, thereby enhancing the system’s efficiency and adaptability to novel environments.
arxiv情報
著者 | Yasra Chandio,Momin A. Khan,Khotso Selialia,Luis Garcia,Joseph DeGol,Fatima M. Anwar |
発行日 | 2024-07-09 14:18:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google