iSLAM: Imperative SLAM

要約

同時位置特定とマッピング (SLAM) は、ロボット ナビゲーションにおける重要な課題の 1 つです。
SLAM システムは、多くの場合、動き推定のためのフロントエンド コンポーネントと推定ドリフトを除去するためのバックエンド システムで構成されます。
最近の進歩により、データ駆動型の手法はフロントエンド タスクでは非常に効果的である一方、バックエンド プロセスではジオメトリ ベースの手法が引き続き不可欠であることが示唆されています。
ただし、データ駆動型のフロントエンドとジオメトリベースのバックエンドの間のパラダイムがこのように切り離されていると、パフォーマンスが最適化されず、その結果、システムの機能と汎用化の可能性が低下する可能性があります。
この問題を解決するために、私たちは命令型 SLAM (iSLAM) と呼ばれる新しい自己教師あり命令型学習フレームワークを提案しました。これはフロントエンドとバックエンド間の相互修正を促進し、外部の監視を必要とせずにパフォーマンスを向上させます。
具体的には、フロントエンドとバックエンドが双方向に接続されるように、SLAM 問題をバイレベル最適化として定式化します。
その結果、フロントエンド モデルは、バックエンド コンポーネントからの残差を逆伝播することにより、ポーズ グラフの最適化を通じて得られたグローバルな幾何学的知識を学習できます。
立体慣性 SLAM の応用を通じて、この新しいフレームワークの有効性を示します。
実験では、iSLAM トレーニング戦略により、ベースライン モデルと比較して平均 22% の精度向上が達成されたことが示されています。
私たちの知る限り、iSLAM は、フロントエンドとバックエンドのコンポーネントが自己監視型で相互に修正できることを示した最初の SLAM システムです。

要約(オリジナル)

Simultaneous Localization and Mapping (SLAM) stands as one of the critical challenges in robot navigation. A SLAM system often consists of a front-end component for motion estimation and a back-end system for eliminating estimation drifts. Recent advancements suggest that data-driven methods are highly effective for front-end tasks, while geometry-based methods continue to be essential in the back-end processes. However, such a decoupled paradigm between the data-driven front-end and geometry-based back-end can lead to sub-optimal performance, consequently reducing the system’s capabilities and generalization potential. To solve this problem, we proposed a novel self-supervised imperative learning framework, named imperative SLAM (iSLAM), which fosters reciprocal correction between the front-end and back-end, thus enhancing performance without necessitating any external supervision. Specifically, we formulate the SLAM problem as a bilevel optimization so that the front-end and back-end are bidirectionally connected. As a result, the front-end model can learn global geometric knowledge obtained through pose graph optimization by back-propagating the residuals from the back-end component. We showcase the effectiveness of this new framework through an application of stereo-inertial SLAM. The experiments show that the iSLAM training strategy achieves an accuracy improvement of 22% on average over a baseline model. To the best of our knowledge, iSLAM is the first SLAM system showing that the front-end and back-end components can mutually correct each other in a self-supervised manner.

arxiv情報

著者 Taimeng Fu,Shaoshu Su,Yiren Lu,Chen Wang
発行日 2024-03-22 02:10:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク