Benchmarking Augmentation Methods for Learning Robust Navigation Agents: the Winning Entry of the 2021 iGibson Challenge

要約

深層強化学習とスケーラブルなフォトリアリスティックなシミュレーションの最近の進歩により、ナビゲーションを含むさまざまな視覚タスク用の身体化 AI がますます成熟してきました。
しかし、身体化されたエージェントに静的環境をナビゲートするよう教えることに関しては目覚ましい進歩が見られましたが、動く歩行者や可動障害物を含む可能性のあるより動的な環境についてはあまり進歩がありませんでした。
この研究では、これらの困難な環境でエージェントのパフォーマンスを向上させるためのさまざまな拡張技術のベンチマークを行うことを目的としています。
トレーニング中にいくつかの動的な障害物をシーンに追加すると、テスト時の汎化が大幅に向上し、ベースライン エージェントよりもはるかに高い成功率が達成されることを示します。
このアプローチを画像拡張手法と組み合わせて、さらに高い成功率を達成できることもわかりました。
さらに、このアプローチは、画像拡張手法よりも sim 間の転送に対しても堅牢であることを示します。
最後に、CVPR での 2021 iGibson Challenge に向けてエージェントをトレーニングするためにこの動的障害物拡張アプローチを使用し、このアプローチの有効性を実証します。このアプローチは、インタラクティブ ナビゲーションで 1 位を獲得しました。
ビデオリンク: https://www.youtube.com/watch?v=HxUX2HeOSE4

要約(オリジナル)

Recent advances in deep reinforcement learning and scalable photorealistic simulation have led to increasingly mature embodied AI for various visual tasks, including navigation. However, while impressive progress has been made for teaching embodied agents to navigate static environments, much less progress has been made on more dynamic environments that may include moving pedestrians or movable obstacles. In this study, we aim to benchmark different augmentation techniques for improving the agent’s performance in these challenging environments. We show that adding several dynamic obstacles into the scene during training confers significant improvements in test-time generalization, achieving much higher success rates than baseline agents. We find that this approach can also be combined with image augmentation methods to achieve even higher success rates. Additionally, we show that this approach is also more robust to sim-to-sim transfer than image augmentation methods. Finally, we demonstrate the effectiveness of this dynamic obstacle augmentation approach by using it to train an agent for the 2021 iGibson Challenge at CVPR, where it achieved 1st place for Interactive Navigation. Video link: https://www.youtube.com/watch?v=HxUX2HeOSE4

arxiv情報

著者 Naoki Yokoyama,Qian Luo,Dhruv Batra,Sehoon Ha
発行日 2023-10-12 19:24:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク