Deep Reinforcement Learning for Bipedal Locomotion: A Brief Survey

要約

二足歩行ロボットは、特に深層強化学習 (DRL) による人工知能の潜在的な応用と進歩により、世界的に認知されてきています。
DRL は二足歩行を大幅に進歩させましたが、幅広いタスクを処理できる統一フレームワークの開発は依然として継続的な課題です。
この調査では、二足歩行のための既存の DRL フレームワークを体系的に分類、比較、分析し、それらをエンドツーエンドおよび階層的な制御スキームに編成します。
エンドツーエンドのフレームワークは学習アプローチに基づいて評価されますが、階層型フレームワークは学習ベースまたは従来のモデルベースの手法を統合した階層構造の観点から検討されます。
各フレームワークの構成、長所、制限、機能の詳細な評価を提供します。
さらに、この調査では主要な研究ギャップを特定し、現実世界の環境で幅広い用途に使用できる、二足歩行のためのより統合された効率的なフレームワークの作成を目的とした将来の方向性を提案します。

要約(オリジナル)

Bipedal robots are gaining global recognition due to their potential applications and advancements in artificial intelligence, particularly through Deep Reinforcement Learning (DRL). While DRL has significantly advanced bipedal locomotion, the development of a unified framework capable of handling a wide range of tasks remains an ongoing challenge. This survey systematically categorises, compares, and analyses existing DRL frameworks for bipedal locomotion, organising them into end-to-end and hierarchical control schemes. End-to-end frameworks are evaluated based on their learning approaches, while hierarchical frameworks are examined in terms of layered structures that integrate learning-based or traditional model-based methods. We provide a detailed evaluation of the composition, strengths, limitations, and capabilities of each framework. Additionally, this survey identifies key research gaps and proposes future directions aimed at creating a more integrated and efficient framework for bipedal locomotion, with wide-ranging applications in real-world environments.

arxiv情報

著者 Lingfan Bao,Joseph Humphreys,Tianhu Peng,Chengxu Zhou
発行日 2024-12-12 17:34:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク