Autonomous Embodied Agents: When Robotics Meets Deep Learning Reasoning

要約

利用可能な計算能力の向上とディープラーニング革命により、人工知能研究における新たなトピックとフロンティアの探求が可能になった。コンピュータビジョン、ロボティクス、意思決定の交差点に位置する「具現化人工知能」と呼ばれる新しい分野は、スマートな自律型ロボットの開発と社会への展開を促進することを目的としており、ここ数年で重要性を増している。近年、フォトリアリスティックなロボットシミュレーションのための大規模な3Dモデルコレクションが利用可能になったことで、学習ベースのエージェントを数百万フレームにわたってより迅速かつ安全に訓練し、実際のロボットプラットフォームにモデルを配備する前にその挙動を慎重に評価することができるようになった。これらのインテリジェントエージェントは、おそらく未知の環境において特定のタスクを実行することを目的としています。このため、シミュレーションによるトレーニングの間、エージェントは、環境からの情報収集、タスクに有用な手がかりの符号化と抽出、最終的なゴールに向けた行動の実行など、周囲との継続的な相互作用を学習する。本論文では、屋内環境のための具現化エージェントの完全な作成プロセスを、そのコンセプトから実装、展開まで追う。我々は、この分野における将来の研究を促進するために、具現化AIと自律エージェントの研究に貢献することを目的とする。我々は、知的な具現化エージェントの実装の背後にある手順の詳細な分析を提示し、文献における現在の最新技術の徹底的な説明、提案された方法の技術的説明、および関連するロボットタスクに関する正確な実験的研究を包括する。

要約(オリジナル)

The increase in available computing power and the Deep Learning revolution have allowed the exploration of new topics and frontiers in Artificial Intelligence research. A new field called Embodied Artificial Intelligence, which places at the intersection of Computer Vision, Robotics, and Decision Making, has been gaining importance during the last few years, as it aims to foster the development of smart autonomous robots and their deployment in society. The recent availability of large collections of 3D models for photorealistic robotic simulation has allowed faster and safe training of learning-based agents for millions of frames and a careful evaluation of their behavior before deploying the models on real robotic platforms. These intelligent agents are intended to perform a certain task in a possibly unknown environment. To this end, during the training in simulation, the agents learn to perform continuous interactions with the surroundings, such as gathering information from the environment, encoding and extracting useful cues for the task, and performing actions towards the final goal; where every action of the agent influences the interactions. This dissertation follows the complete creation process of embodied agents for indoor environments, from their concept to their implementation and deployment. We aim to contribute to research in Embodied AI and autonomous agents, in order to foster future work in this field. We present a detailed analysis of the procedure behind implementing an intelligent embodied agent, comprehending a thorough description of the current state-of-the-art in literature, technical explanations of the proposed methods, and accurate experimental studies on relevant robotic tasks.

arxiv情報

著者 Roberto Bigazzi
発行日 2025-05-02 00:43:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク