Multimotion Visual Odometry (MVO)

要約

視覚的な動きの推定は、自律ナビゲーションにおいてよく研究されている課題です。
最近の研究は、非常に動的な環境におけるマルチモーション推定に取り組むことに焦点を当てています。
これらの環境は、複数の複雑なモーションを含むだけでなく、重大なオクルージョンを示す傾向があります。
センサーのエゴモーションと同時にサードパーティのモーションを推定することは、観測されたオブジェクトのモーションがその実際のモーションとセンサーのモーションの両方で構成されているため、困難です。
マルチモーション推定におけるこれまでの研究のほとんどは、外観ベースのオブジェクト検出またはアプリケーション固有のモーション制約に依存することで、この問題を単純化しています。
これらのアプローチは特定のアプリケーションや環境では効果的ですが、完全なマルチモーション推定問題 (MEP) にはうまく一般化できません。
この論文では、外観ベースの情報に依存せずに、センサーのエゴモーションを含むシーン内のすべてのモーションの完全な SE(3) 軌跡を推定するマルチモーション推定パイプラインである Multimotion Visual Odometry (MVO) について説明します。
MVO は、マルチモーション セグメンテーションおよびトラッキング技術を使用して、従来のビジュアル オドメトリ (VO) パイプラインを拡張します。
物理的に確立されたモーション プリアを使用して、一時的なオクルージョンを通じてモーションを外挿し、モーション クロージャを通じてモーションの再現を特定します。
Oxford Multimotion Dataset (OMD) と KITTI Vision Benchmark Suite からの実世界データの評価では、MVO が同様のアプローチと比較して優れた推定精度を実現し、さまざまなマルチモーション推定の課題に適用できることが実証されています。

要約(オリジナル)

Visual motion estimation is a well-studied challenge in autonomous navigation. Recent work has focused on addressing multimotion estimation in highly dynamic environments. These environments not only comprise multiple, complex motions but also tend to exhibit significant occlusion. Estimating third-party motions simultaneously with the sensor egomotion is difficult because an object’s observed motion consists of both its true motion and the sensor motion. Most previous works in multimotion estimation simplify this problem by relying on appearance-based object detection or application-specific motion constraints. These approaches are effective in specific applications and environments but do not generalize well to the full multimotion estimation problem (MEP). This paper presents Multimotion Visual Odometry (MVO), a multimotion estimation pipeline that estimates the full SE(3) trajectory of every motion in the scene, including the sensor egomotion, without relying on appearance-based information. MVO extends the traditional visual odometry (VO) pipeline with multimotion segmentation and tracking techniques. It uses physically founded motion priors to extrapolate motions through temporary occlusions and identify the reappearance of motions through motion closure. Evaluations on real-world data from the Oxford Multimotion Dataset (OMD) and the KITTI Vision Benchmark Suite demonstrate that MVO achieves good estimation accuracy compared to similar approaches and is applicable to a variety of multimotion estimation challenges.

arxiv情報

著者 Kevin M. Judd,Jonathan D. Gammell
発行日 2024-04-23 23:21:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク