Robust Monocular Visual Odometry using Curriculum Learning

要約

カリキュラム学習 (CL) は、人間や動物で観察される自然な学習パターンからインスピレーションを得ており、モデル開発中に徐々に複雑になるトレーニング データを導入する体系的なアプローチを採用しています。
私たちの研究では、革新的な CL 手法を適用して、制約された環境でのロボットのナビゲーションに不可欠な単眼ビジュアル オドメトリ (VO) 推定という困難な幾何学的問題に対処しています。
私たちの研究の主な目的は、さまざまなカリキュラム学習戦略を調査することにより、単眼 VO における現在の最先端 (SOTA) ベンチマークの限界を押し上げることです。
当社は、困難な環境や複雑な動作シナリオにわたって高いパフォーマンスを維持できる、より復元力の高いモデルを開発することを目標に、新しい CL アプローチの統合を通じてエンドツーエンドのディープパッチビジュアルオドメトリ (DPVO) フレームワークを強化します。
私たちの研究には、いくつかの特徴的な CL 戦略が含まれています。
私たちは、軌道の動きの特性に基づいてサンプルの難易度を評価する方法を開発し、自己ペースの重み付け損失メカニズムを介して高度な適応スケジューリングを実装し、トレーニングの重点を動的に調整するために強化学習エージェントを利用します。
多様な合成 TartanAir データセットと、EuRoC や TUM-RGBD などの複雑な現実世界のベンチマークに関する包括的な評価を通じて、当社のカリキュラム学習ベースのディープパッチビジュアル オドメトリ (CL-DPVO) は、両方を含む既存の SOTA 手法と比較して優れたパフォーマンスを実証します。
特徴ベースおよび学習ベースの VO アプローチ。
この結果は、カリキュラムの学習原則をビジュアル オドメトリ システムに統合することの有効性を検証しました。

要約(オリジナル)

Curriculum Learning (CL), drawing inspiration from natural learning patterns observed in humans and animals, employs a systematic approach of gradually introducing increasingly complex training data during model development. Our work applies innovative CL methodologies to address the challenging geometric problem of monocular Visual Odometry (VO) estimation, which is essential for robot navigation in constrained environments. The primary objective of our research is to push the boundaries of current state-of-the-art (SOTA) benchmarks in monocular VO by investigating various curriculum learning strategies. We enhance the end-to-end Deep-Patch-Visual Odometry (DPVO) framework through the integration of novel CL approaches, with the goal of developing more resilient models capable of maintaining high performance across challenging environments and complex motion scenarios. Our research encompasses several distinctive CL strategies. We develop methods to evaluate sample difficulty based on trajectory motion characteristics, implement sophisticated adaptive scheduling through self-paced weighted loss mechanisms, and utilize reinforcement learning agents for dynamic adjustment of training emphasis. Through comprehensive evaluation on the diverse synthetic TartanAir dataset and complex real-world benchmarks such as EuRoC and TUM-RGBD, our Curriculum Learning-based Deep-Patch-Visual Odometry (CL-DPVO) demonstrates superior performance compared to existing SOTA methods, including both feature-based and learning-based VO approaches. The results validate the effectiveness of integrating curriculum learning principles into visual odometry systems.

arxiv情報

著者 Assaf Lahiany,Oren Gal
発行日 2024-12-13 14:27:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク