深層強化学習とスケーラブルなフォトリアリスティックなシミュレーションの最近の進歩により、ナビゲーションを含むさまざまな視覚タスク用の身体化 AI がますます成熟してきました。
トレーニング中にいくつかの動的な障害物をシーンに追加すると、テスト時の汎化が大幅に向上し、ベースライン エージェントよりもはるかに高い成功率が達成されることを示します。
さらに、このアプローチは、画像拡張手法よりも sim 間の転送に対しても堅牢であることを示します。
最後に、CVPR での 2021 iGibson Challenge に向けてエージェントをトレーニングするためにこの動的障害物拡張アプローチを使用し、このアプローチの有効性を実証します。このアプローチは、インタラクティブ ナビゲーションで 1 位を獲得しました。
ビデオリンク: https://www.youtube.com/watch?v=HxUX2HeOSE4
Recent advances in deep reinforcement learning and scalable photorealistic simulation have led to increasingly mature embodied AI for various visual tasks, including navigation. However, while impressive progress has been made for teaching embodied agents to navigate static environments, much less progress has been made on more dynamic environments that may include moving pedestrians or movable obstacles. In this study, we aim to benchmark different augmentation techniques for improving the agent’s performance in these challenging environments. We show that adding several dynamic obstacles into the scene during training confers significant improvements in test-time generalization, achieving much higher success rates than baseline agents. We find that this approach can also be combined with image augmentation methods to achieve even higher success rates. Additionally, we show that this approach is also more robust to sim-to-sim transfer than image augmentation methods. Finally, we demonstrate the effectiveness of this dynamic obstacle augmentation approach by using it to train an agent for the 2021 iGibson Challenge at CVPR, where it achieved 1st place for Interactive Navigation. Video link: https://www.youtube.com/watch?v=HxUX2HeOSE4
著者 | Naoki Yokoyama,Qian Luo,Dhruv Batra,Sehoon Ha |
発行日 | 2023-10-12 19:24:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google