Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey

要約

二足歩行ロボットは、人工知能、特に深層強化学習 (DRL) における潜在的な応用と進歩により、世界的な注目を集めています。
DRL は二足歩行の大幅な進歩をもたらしましたが、幅広いタスクを適切に実行できる包括的で統一されたフレームワークを開発することは依然として課題です。
この調査では、二足歩行のための既存の DRL フレームワークを体系的に分類、比較、要約し、エンドツーエンドの階層的な制御スキームに編成します。
エンドツーエンドのフレームワークは学習アプローチに基づいて評価されますが、階層フレームワークは学習ベースの手法または従来のモデルベースのアプローチのいずれかを利用する層に分割されます。
この調査では、各フレームワーク タイプの構成、機能、長所、および制限の詳細な分析が提供されます。
さらに、私たちは研究上の重要なギャップを特定し、日常生活における幅広い応用の可能性を備えた、二足歩行のためのより統合された効率的なフレームワークの実現を目指した将来の方向性を提案します。

要約(オリジナル)

Bipedal robots are garnering increasing global attention due to their potential applications and advancements in artificial intelligence, particularly in Deep Reinforcement Learning (DRL). While DRL has driven significant progress in bipedal locomotion, developing a comprehensive and unified framework capable of adeptly performing a wide range of tasks remains a challenge. This survey systematically categorizes, compares, and summarizes existing DRL frameworks for bipedal locomotion, organizing them into end-to-end and hierarchical control schemes. End-to-end frameworks are assessed based on their learning approaches, whereas hierarchical frameworks are dissected into layers that utilize either learning-based methods or traditional model-based approaches. This survey provides a detailed analysis of the composition, capabilities, strengths, and limitations of each framework type. Furthermore, we identify critical research gaps and propose future directions aimed at achieving a more integrated and efficient framework for bipedal locomotion, with potential broad applications in everyday life.

arxiv情報

著者 Lingfan Bao,Joseph Humphreys,Tianhu Peng,Chengxu Zhou
発行日 2024-04-25 22:41:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク