要約
現在のビジュアル SLAM システムは、計算効率と堅牢なループ クロージャ処理のバランスをとるという大きな課題に直面しています。
従来のアプローチでは、慎重な手動調整が必要で、かなりの計算オーバーヘッドが発生しますが、学習ベースの方法では、明示的なループ クロージャー機能が欠如しているか、計算コストのかかる方法で実装されています。
自動化されたカリキュラム学習とビジュアル SLAM システムの効率的な微調整を組み合わせた新しいアプローチである AutoLoop を紹介します。
私たちの手法では、DDPG (Deep Deterministic Policy Gradient) エージェントを採用して、トレーニング中にループ クロージャの重みを動的に調整し、手動によるハイパーパラメータ検索の必要性を排除しながら、必要なトレーニング ステップを大幅に削減します。
このアプローチでは、潜在的なループ クロージャ ペアをオフラインで事前計算し、エージェント主導のカリキュラムを通じてそれらを活用することで、モデルが新しいシナリオに効率的に適応できるようにします。
TartanAir でトレーニング用に実施され、KITTI、EuRoC、ICL-NUIM、TUM RGB-D を含む複数のベンチマークにわたって検証された実験では、AutoLoop が従来のアプローチと比較してトレーニング時間を 1 桁削減しながら、同等またはそれ以上のパフォーマンスを達成することを実証しています。
AutoLoop は、ビジュアル SLAM システムを迅速に適応させるための実用的なソリューションを提供し、従来は手動で複数回繰り返す必要があった重み調整プロセスを自動化します。
私たちの結果は、この自動化されたカリキュラム戦略がトレーニングを加速するだけでなく、さまざまな環境条件下でモデルのパフォーマンスを維持または向上させることを示しています。
要約(オリジナル)
Current visual SLAM systems face significant challenges in balancing computational efficiency with robust loop closure handling. Traditional approaches require careful manual tuning and incur substantial computational overhead, while learning-based methods either lack explicit loop closure capabilities or implement them through computationally expensive methods. We present AutoLoop, a novel approach that combines automated curriculum learning with efficient fine-tuning for visual SLAM systems. Our method employs a DDPG (Deep Deterministic Policy Gradient) agent to dynamically adjust loop closure weights during training, eliminating the need for manual hyperparameter search while significantly reducing the required training steps. The approach pre-computes potential loop closure pairs offline and leverages them through an agent-guided curriculum, allowing the model to adapt efficiently to new scenarios. Experiments conducted on TartanAir for training and validated across multiple benchmarks including KITTI, EuRoC, ICL-NUIM and TUM RGB-D demonstrate that AutoLoop achieves comparable or superior performance while reducing training time by an order of magnitude compared to traditional approaches. AutoLoop provides a practical solution for rapid adaptation of visual SLAM systems, automating the weight tuning process that traditionally requires multiple manual iterations. Our results show that this automated curriculum strategy not only accelerates training but also maintains or improves the model’s performance across diverse environmental conditions.
arxiv情報
著者 | Assaf Lahiany,Oren Gal |
発行日 | 2025-01-15 21:22:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google