Visual SLAMMOT Considering Multiple Motion Models

要約

同時位置特定とマッピング (SLAM) と複数物体追跡 (MOT) は、自動運転の分野で極めて重要なタスクであり、研究で大きな注目を集めています。
SLAM はリアルタイム マップを生成し、不慣れな環境で車両の姿勢を特定することに努めますが、MOT は複数の動的オブジェクトのリアルタイムの識別と追跡に焦点を当てています。
その重要性にもかかわらず、一般的なアプローチでは SLAM と MOT を自動運転システム内の独立したモジュールとして扱うため、固有の制限が生じています。
従来の SLAM 手法は静的な環境の仮定に依存することが多く、動的な屋外シナリオではなく屋内シナリオに適しています。
逆に、従来の MOT 技術は通常、車両の既知の状態に依存しており、この事前情報に基づく物体の状態推定の精度が制約されます。
これらの課題に対処するために、これまでの取り組みでは統一された SLAMMOT パラダイムが導入されましたが、主に単純化された動作パターンに焦点が当てられていました。
私たちのチームの以前の研究 IMM-SLAMMOT\cite{IMM-SLAMMOT} では、複数のモーション モデルの考慮を SLAMMOT、つまり密結合した SLAM と MOT に組み込んだ新しい方法論を提示し、LiDAR ベースのシステムにおけるその有効性を実証しました。
この論文では、この方法論を視覚的な SLAMMOT としてインスタンス化し、LiDAR と視覚ベースのセンシング メカニズムの間のギャップを埋める実現可能性と利点を研究します。
具体的には、複数の運動モデルを考慮した視覚的 SLAMMOT のソリューションを提案し、視覚領域における IMM-SLAMMOT の固有の利点を検証します。

要約(オリジナル)

Simultaneous Localization and Mapping (SLAM) and Multi-Object Tracking (MOT) are pivotal tasks in the realm of autonomous driving, attracting considerable research attention. While SLAM endeavors to generate real-time maps and determine the vehicle’s pose in unfamiliar settings, MOT focuses on the real-time identification and tracking of multiple dynamic objects. Despite their importance, the prevalent approach treats SLAM and MOT as independent modules within an autonomous vehicle system, leading to inherent limitations. Classical SLAM methodologies often rely on a static environment assumption, suitable for indoor rather than dynamic outdoor scenarios. Conversely, conventional MOT techniques typically rely on the vehicle’s known state, constraining the accuracy of object state estimations based on this prior. To address these challenges, previous efforts introduced the unified SLAMMOT paradigm, yet primarily focused on simplistic motion patterns. In our team’s previous work IMM-SLAMMOT\cite{IMM-SLAMMOT}, we present a novel methodology incorporating consideration of multiple motion models into SLAMMOT i.e. tightly coupled SLAM and MOT, demonstrating its efficacy in LiDAR-based systems. This paper studies feasibility and advantages of instantiating this methodology as visual SLAMMOT, bridging the gap between LiDAR and vision-based sensing mechanisms. Specifically, we propose a solution of visual SLAMMOT considering multiple motion models and validate the inherent advantages of IMM-SLAMMOT in the visual domain.

arxiv情報

著者 Peilin Tian,Hao Li
発行日 2024-11-28 13:36:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク